大模型
LLM,VLM,模型
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
Meta近日发布了Llama 4系列模型,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth,宣称这些模型经过大量未标注的文本、图像和视频数据训练,视觉理...
AI PPT赛道,为什么Tome失败了,Gamma 却越活越好?
Tome,一家曾经在AI驱动演示工具领域占据领先地位的公司,宣布将在四月底关闭其核心功能Tome Slides,并转型至销售领域。这一决定标志着其在AI演示工具领域的...
四个维度深入剖析「 Test-Time Scaling 」!首篇系统综述,拆解推理阶段扩展的原理与实战
随着大模型训练成本的急剧攀升和优质数据的逐渐枯竭,推理阶段扩展(Test-Time Scaling, TTS)技术迅速成为后预训练时代的关键突破口。与传统的“堆数据、堆参...
Llama 4 详细评测:开源模型的全面倒退?
Meta最新发布的开源大模型Llama 4在技术社区引发了广泛争议。尽管其规格参数堪称“顶配开源”,包括两个混合专家(MoE)架构版本——Scout(109B总参数,17B活跃...
反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?
反向传播作为深度学习的主流方法,近年来因其生物学不合理性、内存消耗大以及并行计算受限等问题,逐渐受到质疑。Geoffrey Hinton等人一直致力于寻找替代方案...
2030 年 AGI 到来?谷歌 DeepMind 写了份「人类自保指南」
对于通用人工智能(AGI)的发展,硅谷巨头们正面临着一系列复杂的挑战和风险。谷歌 DeepMind 在近期发布的一份报告中,系统阐述了其对 AGI 安全的态度,并预...
Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
Meta最新发布的Llama 4本应成为AI领域的焦点,然而却因一系列问题引发了广泛争议。开源首日,Llama 4的代码能力表现极差,甚至不如GPT-4o等现有模型。更令人...
CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!
视觉自监督学习(SSL)在多模态任务中的潜力得到了验证,研究表明,通过扩展模型和数据规模,SSL能够媲美甚至超越语言监督方法(如CLIP)。这项研究由杨立昆...
Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
Meta最新发布的基础模型Llama 4在发布36小时后,引发了广泛的负面评价,尤其是在代码能力方面表现不佳。经典的小球反弹测试中,模型未能正确模拟物理效果,小...
论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」
Andrej Karpathy 的预言指出,未来绝大多数资料的处理工作将由大模型完成,而非人类。这一趋势在科研领域尤为明显,AI 助手已成为处理论文的常规工具。然而,...