标签:AI模型
Altman 秀新模型“翻车”,谷歌补刀躺赢!OpenAI 前员工爆肝3天,编程再赢老东家模型!
近期,OpenAI和谷歌DeepMind在多个领域展示了其AI模型的强大能力,尤其是在数学和编程竞赛中的表现引发了广泛关注。OpenAI宣布其新AI模型在国际数学奥林匹克...
为什么 DeepSeek 大规模部署很便宜,本地很贵
AI模型的推理服务在吞吐量和延迟之间存在权衡,这种权衡的核心在于批处理大小的选择。GPU擅长执行大型矩阵乘法(GEMMs),因此同时计算一批补全比逐个处理tok...
跟着Google出海:教你怎么落地Gemini
Founder Park 与 Google 合作推出的「从模型到行动」系列 AI 工作坊,旨在帮助开发者将顶尖 AI 模型的能力转化为实际商业价值。该系列工作坊将在深圳、上海和...
长文本推理 5 倍提速!面壁MiniCPM4 端侧模型发布,0.5B模型效果秒杀同级
新一代端侧AI模型MiniCPM4.0发布,包含8B和0.5B两种参数规模,在性能、速度和部署效率上实现显著突破。8B稀疏闪电版通过5%的极致稀疏度实现长文本推理速度5倍...
一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。
在火山引擎发布会上,展示了多项前沿技术,包括豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型以及端到端语音模型等。其中,Seedance 1.0 p...
华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群
华为首次推出了一项名为“数字化风洞”的技术,旨在通过虚拟环境平台在正式训练和推理复杂AI模型之前进行预演,从而优化资源配置并减少算力浪费。该技术由华为...
苹果憋一年终超同参数 Qwen 2.5?三行代码即可接入 Apple Intelligence,自曝如何做推理
苹果在WWDC全球开发者大会上推出了新一代专为增强Apple Intelligence功能开发的基座语言模型。该模型家族包括一个约3B参数的紧凑型设备端模型和一个基于服务...
Claude 4正式发布,我在兴奋中恍惚的问:程序员路在何方?
Anthropic最新发布的大模型Claude Opus 4和Claude Sonnet 4在多个领域展现了显著的进步,尤其是在推理、编程和复杂任务解决能力方面。这两款模型在复杂推理和...
全球最强编码模型 Claude 4 震撼发布:自主编码7小时、给出一句指令30秒内搞定任务,丝滑无Bug
Anthropic在首届开发者大会上正式发布了Claude 4系列模型,包括Claude Opus 4和Claude Sonnet 4两个型号。Claude Opus 4是该公司迄今为止最强大的AI模型,能...
太疯狂了。Windsurf另辟蹊径发布了自己的AI模型。
Windsurf近期发布了一系列专门为软件工程设计的AI模型,包括SWE-1、SWE-1-lite和SWE-1-mini。这一举措标志着AI编程工具领域正在从依赖第三方大模型转向自研模...