标签:性能超越
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈
艾伦人工智能研究所(Ai2)推出了基于强化学习的新一代开源模型Tülu 3 405B,该模型在多项关键基准测试中超越了DeepSeek v3和GPT-4o。Tülu 3 405B在标准的基...
o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
OpenAI的最新模型o3-mini在AI领域取得了显著进展,其性能在多个基准测试中超越了DeepSeek R1。o3-mini在数学代码基准测试中取得了最高成绩,并在物理模拟挑战...
突发!DeepSeek除夕搞炸裂,开源多模态AI模型发布,仅128颗英伟达A100训练1周,性能碾压美国企业|钛媒体AGI
DeepSeek在人工智能领域取得了重大突破,发布了开源多模态人工智能模型Janus-Pro,该模型包含10亿和70亿参数规模的版本。Janus-Pro-7B在GenEval和DPG-Bench基...
非Transformer架构新模型爆火,从第一性原理出发,MIT CSAIL衍生团队打造
MIT初创团队Liquid AI推出了一种新型架构模型LFM(Liquid Foundation Model),在性能上超越了同等规模的Transformer模型如Llama3.2。LFM模型包含1.3B和3B两...
英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o
英伟达公司发布了一款名为Nemotron-4 340B的开源模型,该模型在人工智能领域具有潜在的革命性意义。Nemotron-4 340B能够生成合成数据,可能将改变训练大型语...
开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危
在人工智能领域,开源大模型Qwen2的亮相引起了广泛关注。这款由阿里巴巴推出的模型在性能上全面超越了同为开源标杆的Llama 3,仅在发布两小时后便登顶Hugging...
阿里云重磅发布开源模型Qwen2,性能超Llama3-70及国内众多闭源模型
阿里云更新了其技术博客,并发布了一款新的开源模型Qwen2-72B,这一模型在性能上超越了美国的Llama3-70B以及众多中国闭源大模型,如文心4.0、豆包pro和混元pr...
斯坦福AI团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路
斯坦福团队在Medium发布的文章中宣称,他们训练出了一个小型多模态模型Llama 3-V,其性能超越了GPT-4V、Gemini Ultra和Claude Opus等模型,且尺寸只有GPT4-V...
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k
斯坦福大学研究人员近日推出的 Octopus v2 模型在端侧 AI 应用领域引起了广泛关注。这个拥有 20 亿参数的模型不仅在智能手机、汽车、个人电脑等端侧设备上运...
3140亿参数,可商用!马斯克开源大模型Grok-1
3月18日,马斯克兑现了开源承诺,将旗下公司x.ai的大模型Grok-1正式开源,并支持商业化用途。在这段文本中,重点词语和句子已经使用HTML元素标记出来,使其更...
1
2