标签:性能提升

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

澳大利亚国立大学的研究团队提出了一种全新的图像生成模型ARINAR,该模型在生成质量和速度上均取得了显著提升。ARINAR全称为双层自回归逐特征生成模型,其核...

多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%

近年来,DeepSeek R1、OpenAI o1/o3等大语言模型在数学和编程领域的推理能力取得显著进展,但在国际数学奥林匹克竞赛(IMO)组合问题、抽象推理语料库(ARC)...

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席

OpenAI的最新模型GPT-4.5已经发布,这是一个规模更大、知识储备更丰富的模型,其特点在于高情商和类人交互。GPT-4.5向ChatGPT Pro版用户和付费开发者开放,但...

刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1

Anthropic发布全球首款混合推理模型Claude 3.7 Sonnet,该模型通过独特的双模式架构实现了即时响应与深度思考的融合。在扩展思考模式下,模型通过自我反思机...

超过DeepSeek、o3,双思维模型Claude 3.7来了

著名大模型平台Anthropic推出的Claude 3.7 Sonnet首次引入双思维模式,通过标准与扩展两种思考机制实现差异化响应。标准思考模式适用于即时问答场景,例如直...

Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了。

Claude 3.7 Sonnet作为Claude家族首个具备推理能力的模型正式发布,其混合推理架构引发行业关注。该模型通过下拉菜单实现普通模式与扩展模式的无缝切换,普通...

DeepSeek最新论文解读:NSA,物美价廉的超长上下文方案

DeepSeek最新提出的原生稀疏注意力(NSA)机制解决了传统稀疏注意力技术在训练与推理阶段的割裂问题。传统方法通常只能在推理阶段应用稀疏注意力,导致模型能...

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好

OpenAI的GPT-4o近期进行了版本更新,在大模型竞技场中与DeepSeek-R1并列第一,并在多个单项评测中表现突出。除数学能力排名第六外,其在创意写作、编程、指令...

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞

DeepSeek团队提出的CODEI/O方法通过代码输入/输出预测任务,显著提升了大型语言模型在多种推理任务中的表现。该方法将原始代码文件转换为可执行函数,并构建...

全球AI算力报告出炉,LLM最爱A100!谷歌坐拥超100万H100等效算力

全球机器学习硬件领域正经历前所未有的技术革新与规模扩张。Epoch AI最新报告显示,机器学习硬件计算能力以每年43%的速度增长,每1.9年实现翻倍,这种增速不...
1 2 3 14