大模型

刚刚，DeepSeek开源MoE训练、推理EP通信库DeepEP，真太Open了！

DeepSeek在开源周连续发布核心技术成果，继首日开源MLA解码核FlashMLA后，次日推出专为混合专家系统（MoE）设计的通信库DeepEP。该库针对分布式训练中专家并...

AIGC动态

6个月前

2025 WAIC云帆奖正式启动全球华人AI青年人才征集计划，聚焦人工智能领域新生代力量的成长与突破。随着中国自主研发的DeepSeek等成果展现国际竞争力，华人青年...

AIGC动态

6个月前

在探讨DeepSeek等浙大系创业公司成功经验的对话中，多位创业者从组织文化、地域优势和技术创新等维度展开深度剖析。DeepSeek创始人梁文峰坚持的'创始人模式'...

AIGC动态

6个月前

豆包语音模型团队通过技术革新实现了AI合成语音在小说演播场景的突破性进展。基于改进的Seed-TTS框架，该系统无需人工标注标签即可端到端生成高自然度语音，...

AIGC动态

6个月前

特斯拉FSD（Full Self-Driving）系统在中国市场的正式推送，标志着其高阶智能驾驶功能首次落地国内。此次更新通过2024.45.32.12版本软件分批次推送，新增了匝...

AIGC动态

6个月前

Anthropic正式发布Claude 3.7 Sonnet模型，该模型作为市场首个混合推理系统，允许用户通过标准模式和扩展思考模式灵活控制模型的响应速度与思考深度。标准模...

AIGC动态

6个月前

Claude 3.7 Sonnet的最新发布引发广泛关注，其核心突破集中在编程能力与复杂任务处理效率的显著提升。测试显示，该模型仅需单个样本即可生成超过3200行代码，...

AIGC动态

6个月前

DeepSeek-R1作为新一代推理模型的代表，对云计算基础设施提出了全方位挑战，推动云服务商在性能、成本和稳定性等维度展开技术竞争。火山引擎凭借20ms内延迟响...

AIGC动态

6个月前

Anthropic正式发布Claude 3.7 Sonnet模型，宣称这是其首个'混合推理模型'，通过'标准思考'和'扩展思考模式'实现不同响应策略。该模型在编程领域表现突出，SWE...

AI-Agent

6个月前

知名AI工具Monica推出国内版Monica.cn，基于DeepSeek R1与V3模型构建，新增多项创新功能。该产品通过实时联网搜索与长期记忆能力的结合，实现了动态知识更新...

AIGC动态

6个月前