“基准测试”的搜索结果

GPT 未竟的革命,由 o1 接棒:或是 LLM 研究最重要的发现
OpenAI近期推出了o1系列,标志着其在人工智能领域的又一次重大突破。o1系列在处理复杂推理任务方面表现出色,其在国际数学奥林匹克(IMO...
3位牛津本科生学霸,4个月复现AlphaFold 3直接开源!
AlphaFold 3,由谷歌DeepMind在2022年5月发布,是一项在生物科学和计算机科学领域具有里程碑意义的成果,被认为具有诺贝尔奖潜力。该技...
这就翻车了?Reflection 70B遭质疑基模为Llama 3,作者:重新训练
AI写作初创公司HyperWrite开发的新模型Reflection 70B在开源大模型社区引起了广泛关注。该模型基于Meta Llama 3.1 70B Instruct构建,采...
微软用AI Agent生成2500万对高质量数据,极大提升大模型性能!
在AIGC领域,随着生成式AI产品如ChatGPT和Copilot的快速发展,对训练数据的需求急剧增加,这对提升大型语言模型(LLM)的性能至关重要。...
开源大模型新王干翻GPT-4o,新技术可纠正自己幻觉,数学99.2分刷爆测试集
最近,一个名为Reflection 70B的新型人工智能模型在业界引起了巨大轰动。这个由小创业团队开发的模型采用了创新的训练技术Reflection-Tu...
腾讯云升级 AI 全家桶,混元对标 GPT-4o
在2024年腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生分享了腾讯云的最新成就和AI领域的进展。过去一...
一款小而强大的编程助手:零一万物正式开源Yi-Coder系列模型
零一万物公司近期开源了Yi-Coder系列模型,这是继Yi-1.5系列模型之后的又一开源成果。Yi-Coder系列专为编程任务设计,提供1.5B和9B两种...
1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」
在虚拟现实游戏“我的世界”中,一个由1000多个智能体组成的文明被成功创建,这些智能体展现出了高度的自主性和复杂的社会互动。这些智能...
AI 推理竞赛正在升温
在AI推理领域,尽管英伟达的GPU保持着其在AI训练领域的领导地位,但竞争对手正在迅速追赶,尤其是在能效方面。最近,ML Commons发布了ML...
英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生
MLCommons发布了MLPerf Inference v4.1的最新测试结果,其中英伟达的Blackwell架构芯片在大语言模型(LLM)推理任务中表现出色,刷新了...
1 2 3 4 22