标签:AI模型

Altman 秀新模型“翻车”,谷歌补刀躺赢!OpenAI 前员工爆肝3天,编程再赢老东家模型!

近期,OpenAI和谷歌DeepMind在多个领域展示了其AI模型的强大能力,尤其是在数学和编程竞赛中的表现引发了广泛关注。OpenAI宣布其新AI模型在国际数学奥林匹克...

为什么 DeepSeek 大规模部署很便宜,本地很贵

AI模型的推理服务在吞吐量和延迟之间存在权衡,这种权衡的核心在于批处理大小的选择。GPU擅长执行大型矩阵乘法(GEMMs),因此同时计算一批补全比逐个处理tok...

跟着Google出海:教你怎么落地Gemini

Founder Park 与 Google 合作推出的「从模型到行动」系列 AI 工作坊,旨在帮助开发者将顶尖 AI 模型的能力转化为实际商业价值。该系列工作坊将在深圳、上海和...

长文本推理 5 倍提速!面壁MiniCPM4 端侧模型发布,0.5B模型效果秒杀同级

新一代端侧AI模型MiniCPM4.0发布,包含8B和0.5B两种参数规模,在性能、速度和部署效率上实现显著突破。8B稀疏闪电版通过5%的极致稀疏度实现长文本推理速度5倍...

一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。

在火山引擎发布会上,展示了多项前沿技术,包括豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型以及端到端语音模型等。其中,Seedance 1.0 p...

华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群

华为首次推出了一项名为“数字化风洞”的技术,旨在通过虚拟环境平台在正式训练和推理复杂AI模型之前进行预演,从而优化资源配置并减少算力浪费。该技术由华为...

苹果憋一年终超同参数 Qwen 2.5?三行代码即可接入 Apple Intelligence,自曝如何做推理

苹果在WWDC全球开发者大会上推出了新一代专为增强Apple Intelligence功能开发的基座语言模型。该模型家族包括一个约3B参数的紧凑型设备端模型和一个基于服务...

Claude 4正式发布,我在兴奋中恍惚的问:程序员路在何方?

Anthropic最新发布的大模型Claude Opus 4和Claude Sonnet 4在多个领域展现了显著的进步,尤其是在推理、编程和复杂任务解决能力方面。这两款模型在复杂推理和...

全球最强编码模型 Claude 4 震撼发布:自主编码7小时、给出一句指令30秒内搞定任务,丝滑无Bug

Anthropic在首届开发者大会上正式发布了Claude 4系列模型,包括Claude Opus 4和Claude Sonnet 4两个型号。Claude Opus 4是该公司迄今为止最强大的AI模型,能...

太疯狂了。Windsurf另辟蹊径发布了自己的AI模型。

Windsurf近期发布了一系列专门为软件工程设计的AI模型,包括SWE-1、SWE-1-lite和SWE-1-mini。这一举措标志着AI编程工具领域正在从依赖第三方大模型转向自研模...
1 2 3 20