标签:AI推理

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

Epoch AI联合六十余位全球数学家推出了全新的数学基准FrontierMath,旨在评估AI系统的高级推理能力。该基准包含数百个原创且极具挑战性的数学问题,覆盖从奥...

Transformer能否推理引争议,DeepMind连夜更新论文开源数据集:Transformer真的很强

DeepMind最近的研究在人工智能领域引起了广泛关注,他们训练了一个仅270M大小的Transformer模型,该模型在下棋任务中展现出了大师级的表现,且无需依赖搜索算...

红杉资本:套壳才是应用层王道,o1改变了大模型行业,年度行业报告更新

AI行业的两份年度报告,Air Street Capital的《State of AI 2024》和红杉资本的《Generative AI's Act o1》,对AI创业和模型发展进行了深入探讨。报告指出,A...

LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作

最新研究揭示了大型语言模型(LLM)之间合作的潜力,特别是在提升数学问题解决能力方面。蒙特利尔大学、剑桥大学、普林斯顿大学和谷歌DeepMind的研究人员发现...

三个大模型组队挑战o1,实测360多模型协作干掉提示词工程

OpenAI的o1模型引领了大模型发展的新趋势,即从训练阶段转向推理过程的投入,这一转变得到了英伟达AI科学家Jim Fan的认同。他引用了机器学习先驱Rich Sutton...

OpenAI 发布最新模型 o1,这次变为华人扛大旗?一分钟搞出 3D 版贪吃蛇,好用但小贵

OpenAI于9月12日推出了名为“草莓”(Strawberry)的o1模型,这是其推理模型家族的首个成员,旨在解决科学、编码和数学等领域的复杂问题,这些问题对于现有AI模...

OpenAI新模型o1大揭秘!官方在线大会来啦

OpenAI最近发布了o1模型,引起了科技界的广泛关注。为了解答公众的疑问,OpenAI举办了在线答疑会,以下是关键信息的总结:1. 模型命名:o1模型的命名意在表示...

AI 推理竞赛正在升温

在AI推理领域,尽管英伟达的GPU保持着其在AI训练领域的领导地位,但竞争对手正在迅速追赶,尤其是在能效方面。最近,ML Commons发布了MLPerf Inference v4.1...

英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生

MLCommons发布了MLPerf Inference v4.1的最新测试结果,其中英伟达的Blackwell架构芯片在大语言模型(LLM)推理任务中表现出色,刷新了部分任务的测试纪录。M...

GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

Cerebras公司最近推出了全球最快的AI推理架构——Cerebras Inference,其推理速度远超当前最先进的GPU。在运行Llama3.1 8B模型时,Cerebras Inference能够以180...
1 2