标签:性能提升
我们能够让开源小模型变得比人类更聪明吗
本文由安全研究员Harish SG撰写,旨在探讨如何提升开源大语言模型(LLM)的推理能力,以期达到或超越闭源模型的性能。Harish SG是德克萨斯大学达拉斯分校网络...
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
零一万物公司近日发布了其新旗舰模型Yi-Lightning(闪电),在大模型竞技场Chatbot Arena上取得了显著成绩,总榜单排名第六,数学分榜第三,代码等其他分榜也...
清华校友用AI破解162个高数定理,智能体LeanAgent攻克困扰陶哲轩难题!
由加州理工学院、斯坦福大学和华盛顿大学的研究人员开发的LeanAgent,是一个具有终身学习能力的AI智能体,能够证明数学定理。该智能体通过优化学习轨迹和动态...
联发科打响手机芯片“卷AI”的第一枪
联发科技近日发布了天玑9400,这是国内首个显著提升智能手机AI能力的旗舰芯片。采用第二代全大核架构,天玑9400在CPU和GPU性能上达到新高度,同时增强了端侧A...
OpenAI 突然推送推送高级语音模式「Her」,又抢了谷歌风头
9月25日,Google宣布了两款新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002的发布。Gemini Pro是Google系列模型中的中等规模模型,对付费用户开放,而Gemini...
o1带火的CoT到底行不行?新论文引发了论战
近期,德克萨斯大学奥斯汀分校、约翰·霍普金斯大学和普林斯顿大学的研究人员提出了一个关键问题:在大型语言模型(LLM)中,是否应该使用思维链(Chain-of-Th...
o1突发内幕曝光?谷歌8月论文已揭示原理,大模型光有软件不存在护城河
谷歌DeepMind的一篇论文揭示了一种新的计算策略,该策略与OpenAI的o1模型的工作方式几乎一致。这项研究指出,在测试时增加计算比扩展模型参数更有效,这使得...
微软用AI Agent生成2500万对高质量数据,极大提升大模型性能!
在AIGC领域,随着生成式AI产品如ChatGPT和Copilot的快速发展,对训练数据的需求急剧增加,这对提升大型语言模型(LLM)的性能至关重要。为了应对训练数据短缺...
大战打响!高通发布全新AI PC芯片骁龙X Plus 8,性能暴涨超61%,对抗英特尔和AMD|钛媒体AGI
在德国柏林的IFA大会上,高通公司推出了全新的AI PC芯片Snapdragon X Plus 8核处理器,这是其骁龙X系列产品线的新成员,旨在挑战英特尔和AMD在PC处理器市场的...
英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生
MLCommons发布了MLPerf Inference v4.1的最新测试结果,其中英伟达的Blackwell架构芯片在大语言模型(LLM)推理任务中表现出色,刷新了部分任务的测试纪录。M...