“机器之心”的搜索结果

OpenAI新模型用的嵌入技术被网友扒出来了
'MRL'方法的核心理念是通过学习Matryoshka表征的自适应部署设置,实现从粗到细的表征法,无需大量的训练或额外的部署开销。研究者将重点...
大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉
研究指出,预训练语言模型产生幻觉的原因是固有的统计学原因,与Transformer架构或数据质量无关。语言模型可以用于生成文本或预测下一个...
全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步
这篇文章主要介绍了谷歌 DeepMind发起的RT-X 项目,旨在打造通用机器人大脑。文章首先指出了生成式人工智能发展的核心关键词是“大”,即...
多模态大模型,阿里通义千问能和GPT-4V掰手腕了
文章介绍了通义千问的图像推理能力的大幅提升,以及大模型领域的未来发展方向。近期,OpenAI推出了GPT-4V,使大模型具备了前所未有的图...
大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一
Medusa 的核心在于它的解码头和树注意力机制。解码头可以与原始模型一起训练,而树注意力机制则能够同时处理多个候选者。研究者提出了两...
《幻兽帕鲁》爆火,大厂坐不住了:这游戏是AI设计的?
《幻兽帕鲁》的开发背后有着不寻常的故事。游戏由一个只有10人的小团队开始开发,项目社长溝部拓郎在公开信中透露了开发过程中的种种挑...
Yann LeCun:生成模型不适合处理视频,AI得在抽象空间中进行预测
这篇文章主要讨论了AI理解视频数据的挑战和未来发展方向。Yann LeCun和Daphne Koller在世界经济论坛的讨论中提到,当前的AI模型并不适合...
扎克伯格宣战AGI:Llama 3训练中,今年要囤35万块H100,砸近百亿美元
这篇报道总结了Meta公司首席执行官马克·扎克伯格宣布的一系列关于通用人工智能(AGI)的重大举措。Meta公司正在进行大规模的AI研究部门...
1 38 39 40