大模型
LLM,VLM,模型
我们能够让开源小模型变得比人类更聪明吗
本文由安全研究员Harish SG撰写,旨在探讨如何提升开源大语言模型(LLM)的推理能力,以期达到或超越闭源模型的性能。Harish SG是德克萨斯大学达拉斯分校网络...
卷疯了!美国AI博士生「人手10篇顶会」,遭欧洲同行质疑
欧洲博士生在机器学习社区发表的帖子引发了广泛讨论,他质疑为何美国博士生能在AI顶会上发表如此多的论文。他分享了自己的经历,包括在CVPR上发表论文和管理...
Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散
智源研究院最近发布了一款名为Emu3的原生多模态世界模型,该模型通过预测下一个token来理解和生成文本、图像和视频三种模态数据,而无需依赖扩散模型或组合方...
上海交大、腾讯发布高效扩散模型微调方法,提升图像生成效率
近年来,扩散模型在图像、视频和3D生成等任务中发挥了重要作用,但在将预训练模型微调应用于实际业务场景时面临挑战。现有微调方法如AFT、RFT和SFT存在局限性...
假装被马斯克裁员的整活鬼才,现在AI创业融资3500万
Daniel Francis,曾因在马斯克收购推特后大裁员时冒充被裁员工而出名,最近他的创业公司Abel获得了500万美元融资。Abel开发了一款辅助警察完成文书工作的应用...
智源 Emu3 证明多模态模型新范式:只需基于下一个 token 预测
智源研究院于2024年10月21日发布了原生多模态世界模型Emu3,这一模型仅通过预测下一个token,就能实现对文本、图像、视频三种模态数据的理解和生成,无需依赖...
陶哲轩:纳维-斯托克斯方程或已不再是流体的良好模型
在巴塞罗那的最新专访中,著名数学家陶哲轩分享了他对人工智能在数学竞赛中表现的看法。他认为,尽管AI在某些竞赛中可能短期内超越人类,但在需要长期创造性...
国产3D虚拟人版《Her》「杀向」迪拜
在GITEX GLOBAL展会上,中国公司Soul展示了其在AI社交领域的最新进展。Soul的展位设有三个互动屏幕,分别用于体验与3D数字人互动、创建多语言交流的3D数字人...
132年未解开的李雅普诺夫函数谜题,被Symbolic Transformer攻克了
AI在解决高级数学问题上的能力再次取得突破。Meta和巴黎理工学院的研究人员合作,针对数学界长期未解的李雅普诺夫函数问题提出了新的研究。李雅普诺夫函数是...
聊了一百位硅谷大模型从业者后,我们对 AGI 投资产生了新的思考
大模型行业目前正处于发展的初期阶段,类似于“前浏览器或前IOS时代”,存在一定的泡沫现象。尽管OpenAI的年经常性收入(ARR)达到了41亿美元,但其背后是高昂...