大模型

LLM,VLM,模型

英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快

英伟达团队提出了一种新的神经网络架构——归一化Transformer(nGPT),这一架构在超球面上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,同时保...

泡沫不可避免,但将有 1% AI 企业脱颖而出——对话哈佛商评总编,李彦宏谈 AI 泡沫

在《HBR Live:商业未来》节目中,百度创始人李彦宏与哈佛商业评论英文版总编辑殷阿笛探讨了人工智能(AI)的发展趋势、泡沫现象、AI与人类的关系等话题。李...

视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化

当前,文本生视频技术正处于快速发展阶段,其应用范围广泛,包括创意视频内容生成、游戏场景创建、动画和电影制作,甚至作为真实世界的模拟器。尽管如此,该...

硅谷深思:GPT应用迟未爆发,大模型泡沫根源初探

人工智能大模型行业在2022年取得了显著进展,特别是ChatGPT的推出,实现了大模型的Scaling law和通用能力涌现,商业化也取得了不错的进展。然而,OpenAI的发...

苹果一篇论文得罪大模型圈?Transformer不会推理,只是高级模式匹配器!所有LLM都判死刑

苹果研究者的最新研究对大型语言模型(LLM)的推理能力提出了质疑。研究发现,无论是闭源的OpenAI GPT-4o和o1模型,还是开源的Llama、Phi、Gemma和Mistral等...

AI 教父 Yann LeCun 怒批:今天的大模型比猫还笨,光会预测文本根本没在推理!

纽约大学教授、Meta公司高级研究员、A.M. Turing奖获得者Yann LeCun对当前人工智能的发展持怀疑态度。他认为,尽管大型语言模型能够操纵语言,但它们并不聪明...

大模型训练遭投毒损失千万美元?Anthropic惊人发现:LLM植入炸弹,代码库暗藏bug!

Anthropic最近的研究揭示了AI模型可能具有的破坏力,特别是在代码破坏、沙袋效应、人类决策破坏和破坏监督四个方面。研究者通过构建评估方法,测试了AI模型在...

苹果一篇论文把大模型圈子得罪了!“踩着”OpenAI、Meta大模型上位,Gary Marcus:早就说大模型不会推理!

苹果公司的六位AI研究人员发表了一篇论文,对当前领先的语言模型(LLM)进行了测试,以评估它们处理数学推理任务的能力。研究发现,即使是问题措辞的微小变化...

SAM 2.1上新、Lingua代码库发布,一大波Meta开源工具来袭

Meta公司近期分享了一系列研究和模型,旨在推动高级机器智能(AMI)的发展,并促进开放科学和可复现性。这些研究涵盖了AMI的多个构建模块,如感知、语音和语...

世界最好小参数开源大模型!超谷歌、Meta,手机、平板轻松运行

法国大模型平台Mistral.AI推出了专为移动设备设计的Ministraux模型,包含3B和8B两个版本。这些模型在文本生成、推理、函数调用和效率方面表现出色,性能超越...
1 37 38 39 40 41 391