大模型
LLM,VLM,模型
刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
DeepSeek在开源周连续发布核心技术成果,继首日开源MLA解码核FlashMLA后,次日推出专为混合专家系统(MoE)设计的通信库DeepEP。该库针对分布式训练中专家并...
2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来
2025 WAIC云帆奖正式启动全球华人AI青年人才征集计划,聚焦人工智能领域新生代力量的成长与突破。随着中国自主研发的DeepSeek等成果展现国际竞争力,华人青年...
DeepSeek 等浙大系创业者的组织文化密码是什么?
在探讨DeepSeek等浙大系创业公司成功经验的对话中,多位创业者从组织文化、地域优势和技术创新等维度展开深度剖析。DeepSeek创始人梁文峰坚持的'创始人模式'...
AI说书媲美真人!豆包语音大模型升级长上下文理解
豆包语音模型团队通过技术革新实现了AI合成语音在小说演播场景的突破性进展。基于改进的Seed-TTS框架,该系统无需人工标注标签即可端到端生成高自然度语音,...
特斯拉在华发布 FSD,智驾的「狼」,真的来了
特斯拉FSD(Full Self-Driving)系统在中国市场的正式推送,标志着其高阶智能驾驶功能首次落地国内。此次更新通过2024.45.32.12版本软件分批次推送,新增了匝...
中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”!
Anthropic正式发布Claude 3.7 Sonnet模型,该模型作为市场首个混合推理系统,允许用户通过标准模式和扩展思考模式灵活控制模型的响应速度与思考深度。标准模...
实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守
Claude 3.7 Sonnet的最新发布引发广泛关注,其核心突破集中在编程能力与复杂任务处理效率的显著提升。测试显示,该模型仅需单个样本即可生成超过3200行代码,...
DeepSeek引发推理侧革命,火山引擎凭什么做到最优解?
DeepSeek-R1作为新一代推理模型的代表,对云计算基础设施提出了全方位挑战,推动云服务商在性能、成本和稳定性等维度展开技术竞争。火山引擎凭借20ms内延迟响...
Claude 3.7 Sonnet发布:别提什么AGI,我Anthropic要赚企业客户的钱!
Anthropic正式发布Claude 3.7 Sonnet模型,宣称这是其首个'混合推理模型',通过'标准思考'和'扩展思考模式'实现不同响应策略。该模型在编程领域表现突出,SWE...
Monica上线国内版,基于满血版R1,FP读者专享内测码限量领取
知名AI工具Monica推出国内版Monica.cn,基于DeepSeek R1与V3模型构建,新增多项创新功能。该产品通过实时联网搜索与长期记忆能力的结合,实现了动态知识更新...