标签:AI模型

DeepSeek技术解析:如何冲击英伟达两大壁垒?

DeepSeek的V3模型通过557.6万美元的低成本训练实现了与OpenAI O1相近的性能,这一突破引发了对英伟达技术壁垒的重新审视。其核心创新在于基础模型能力的跃升...

DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页

随着人工智能技术的快速发展,评估前沿大语言模型能力的需求变得愈加迫切。为此,Center for AI Safety 与 Scale AI 共同开发了一个名为 Humanity's Last Exa...

网上关于DeepSeek的说法,哪些是错误的?

DeepSeek近期通过采用PTX编程优化了跨芯片通信能力,但这并不意味着它绕过了NVIDIA CUDA生态。PTX是CUDA编程模型的一部分,DeepSeek直接使用PTX编写程序,虽...

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

谷歌本周发布了新一代的AI模型系列Gemini 2.0,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite和旗舰模型Gemini 2.0 Pro实验版本,并在Gemini App中推出了推理...

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

DeepSeek R1,一款由中国公司DeepSeek开发的先进大模型,因其开源和性能与OpenAI的o1相当而引发全球关注。该模型以其相对较低的训练预算、易用性和良好的用户...

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

阿里巴巴推出的Qwen2.5-Max模型在大模型竞技场榜单上取得了显著成绩,以总分1332位列第七,并在编程和数学领域表现突出,与顶级模型并列第一。Chatbot Arena...

为什么说DeepSeek的R1-Zero比R1更值得关注?

DeepSeek发布的R1-Zero和R1两个模型在ARC-AGI-1上的得分与OpenAI的o1系统低计算量版本相当,显示出纯LLM scaling的局限性。R1-Zero特别值得关注,因为它完全...

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025年初,中国团队DeepSeek在全球AI领域引起广泛关注,他们仅用2048张H800 GPU在两个月内训练出一个与全球顶尖水平相媲美的AI模型,这一成就不仅挑战了英伟...

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

近期,AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引,这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能,引发了市场对AI硬件需求...

滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion

DeepSeek最近发布了新模型多模态Janus-Pro-7B,并立即开源。这一新模型在GenEval和DPG-Bench基准测试中超越了DALL-E 3和Stable Diffusion。Janus-Pro-7B基于D...
1 2 3 4 5 6 19