标签:多模态数据

字节跳动、中科院开源多模态数据集—WebMath-40B

字节跳动和中国科学院的研究人员联合发布了超大多模态数据集InfiMM-WebMath-40B,旨在推动多模态大模型的发展。该数据集从Common-Crawl中筛选提炼而成,包含2...

一张显卡看遍天下电影!智源联合高校开源Video-XL打破长视频理解极限,95%准确率刷爆纪录

智源研究院联合国内多所顶尖高校推出了超长视频理解大模型Video-XL,这一模型在处理小时级视频上展现了卓越的性能和泛化能力。Video-XL利用语言模型的原生能...

Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

Nature杂志近期发表的一篇文章揭示了学术出版商将论文数据出售给科技公司用于训练人工智能(AI)模型的现象。这一做法引发了广泛的争议和讨论。文章指出,许...

从 OpenAI 收购实时分析数据公司看未来数据库长什么样?

OpenAI收购实时分析数据库Rockset的事件在数据库领域和AI界引起了广泛关注。Rockset成立于2016年,由来自Facebook、谷歌、雅虎、甲骨文和VMware等公司的技术...

AI大佬重磅预测:高阶模型不会开源,软件公司或消失,「单飞」创业者春天来了

蓝驰创投对AI领域的投资观点和策略正在不断迭代和精细化。他们强调了未来软件公司的减少,GenAI将催生一批一人十亿美金的初创公司,并指出开源模型虽多,但闭...