编程能力 | 学习AIGC

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek V3.1新版正式上线，带来诸多显著更新与提升。其上下文长度拓展到128k，拥有685B参数，支持从BF16到FP8的多种精度格式。此次更新亮点丰富：编程能力...

AIGC动态

3周前

GPT-5费尽心机“作弊”，只为超过心魔Claude

GPT5发布后未带来震撼，OpenAI聚焦大模型落地与应用，发布会上强调其编程能力，一众AI IDE工具也迅速接入。然而，有媒体披露OpenAI在编程能力测试中“作弊”，...

AIGC动态

4周前

OpenAI惊人自曝：GPT-5真「降智」了！但重现「神之一手」，剑指代码王座

GPT-5在门萨IQ测试中表现引发争议，离线测试仅得70分，但后续分析表明其智能受路由机制制约。OpenAI首席执行官奥特曼证实系统故障导致模型表现异常，而METR报...

AIGC动态

1个月前

利好独立开发，MiniMax Agent 现在连后端网站都能做了

ChatGPT 正式推出 Agent 模式，标志着 OpenAI 开始布局通用 Agent 领域。这一模式能够帮助用户完成复杂的电脑任务，重要性不亚于 GPT-5 的发布。然而，OpenAI...

AI-Agent

2个月前

Claude 4正式发布，我在兴奋中恍惚的问：程序员路在何方？

Anthropic最新发布的大模型Claude Opus 4和Claude Sonnet 4在多个领域展现了显著的进步，尤其是在推理、编程和复杂任务解决能力方面。这两款模型在复杂推理和...

AI-Agent

4个月前

Claude 3.7成精了！偷偷将OpenAI模型换成自己，卡帕西：迄今最好笑的一趴

开发者Tibo在使用代码编辑器Cursor时意外发现模型被自动切换为Claude 3.7，而用户并未下达相关指令。这一现象引发了关于AI系统自主行为的讨论，OpenAI联合创...

AIGC动态

6个月前

实测Claude 3.7：3200行代码一口气输出，物理规律手拿把掐，弱智吧已失守

Claude 3.7 Sonnet的最新发布引发广泛关注，其核心突破集中在编程能力与复杂任务处理效率的显著提升。测试显示，该模型仅需单个样本即可生成超过3200行代码，...

AIGC动态

7个月前

人类自愧不如：DeepSeek R1、o3-mini和Gemini 2.0 思考过程大横评，AI们比你脑子清楚多了

本次评测针对o3-mini、DeepSeek R1和Gemini 2.0 Flash Thinking三款推理模型展开七项核心任务测试。逻辑推理测试中，三款模型均正确解答阶乘数列问题，但思维...

AIGC动态

7个月前

OpenAI内部模型曝光！编程能力跻身全球Top50程序员，年底不再有人类对手

OpenAI首席执行官山姆·奥特曼在东京大学对话活动中披露了多项关键进展。内部推理模型已具备全球前50位程序员的编程能力水平，预计2023年底将超越人类顶尖程序...

AIGC动态

7个月前

超越Claude 3.5紧追o1！DeepSeek-V3-Base开源，编程能力暴增近31％

DeepSeek AI公司在2024年底开源了其最新的混合专家（MoE）语言模型DeepSeek-V3-Base，该模型拥有685B参数，包含256个专家，并采用sigmoid路由方式，每次选取...

AIGC动态

9个月前

标签：编程能力

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

GPT-5费尽心机“作弊”，只为超过心魔Claude

OpenAI惊人自曝：GPT-5真「降智」了！但重现「神之一手」，剑指代码王座

利好独立开发，MiniMax Agent 现在连后端网站都能做了

Claude 4正式发布，我在兴奋中恍惚的问：程序员路在何方？

Claude 3.7成精了！偷偷将OpenAI模型换成自己，卡帕西：迄今最好笑的一趴

实测Claude 3.7：3200行代码一口气输出，物理规律手拿把掐，弱智吧已失守

人类自愧不如：DeepSeek R1、o3-mini和Gemini 2.0 思考过程大横评，AI们比你脑子清楚多了

OpenAI内部模型曝光！编程能力跻身全球Top50程序员，年底不再有人类对手

超越Claude 3.5紧追o1！DeepSeek-V3-Base开源，编程能力暴增近31％

热门网址

标签：编程能力

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址