大模型
LLM,VLM,模型
GPT-4系列模型,在文档理解中的多维度评测
Snowflake的研究人员对OpenAI的GPT-4系列模型进行了深入研究,评估了其在文本生成、图像理解、文档摘要等方面的能力。通过在DocVQA、InfographicsVQA、SlideV...
一次性裁掉 50 多名副总裁!小扎的冷血管理哲学:高管也是打工人
Meta公司正在考虑裁减数百名副总裁,去年副总裁人数达到约300人,而扎克伯格希望将这一数字减少到250人。Meta的员工总数在多轮裁员后减少了约22%,截至2024年...
谢赛宁对话Sora 负责人:AI 视觉的基础是对压缩图像的学习
在这次深入的讨论中,Aditya Ramesh,OpenAI Sora及DALL·E团队的负责人,以及纽约大学助理教授谢赛宁,共同探讨了人工智能领域中语言和视觉模型的融合及其对...
对话智源研究院院长:我们距离 AGI 还有多远
北京智源人工智能研究院在第六届北京智源大会上分享了关于通用人工智能(AGI)的最新进展和见解。智源研究院院长王仲远认为,基于大模型的人工智能技术实现AG...
星环科技孙元浩:语料已经是大模型最大的挑战
星环科技创始人及CEO孙元浩认为,当前大模型训练并未将人类互联网数据穷尽,各行各业企业内部的数据还未被充分利用。高质量的数据可以显著提高大模型的准确性...
GPT-4不是世界模型,LeCun双手赞同!ACL力证LLM永远无法模拟世界
根据新智元的报道,亚利桑那大学、微软、霍普金斯大学等机构最近联合发布了一篇论文,从实证角度对LLM作为世界模拟器的能力进行了否定。这项研究已经被ACL 20...
Yandex 开源 LLM 训练工具,可节省高达 20% 的 GPU 资源
莫斯科跨国科技公司Yandex于2024年6月11日推出了一种名为YaFSDP的开源方法,旨在提高大型语言模型(LLM)训练的效率。LLM训练通常需要大量的GPU集群,这些GPU...
北大快手攻克复杂视频生成难题!新框架轻松组合各种细节,代码将开源
北京大学与快手AI团队合作提出了一个名为VideoTetris的新框架,旨在解决高难度、指令复杂的视频生成问题。该框架通过类似于拼图游戏俄罗斯方块的方式,轻松组...
艾欧智能陈相羽:数据才是当下具身智能的痛点
在2024年的国际机器人会议ICRA上,中国机器人企业的崛起成为焦点。其中,艾欧智能以其独特的定位——作为基础场景数据提供商和解决方案提供商——脱颖而出。陈相...
ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了
最近,一篇入选ACL 2024的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体上引发了广泛讨论。该论文探讨了当前语言模型是否可...