标签:大模型
阶跃Agent生态首曝光:手机汽车IoT机器人全覆盖,千行百业唰唰落地
在阶跃星辰Step UP生态开放日上,公司展示了AI大模型技术落地的最新进展与战略布局。Agent技术被确立为核心发展方向,其爆发的关键支撑在于多模态能力与推理...
中国首个“AI算力生态超市”发布,企业将获100万元补贴|钛媒体AGI
上海市正加速推进智能算力基础设施建设,以应对未来算力需求并推动人工智能产业发展。模速空间算力生态平台作为国内首个大模型创新生态社区的核心载体,通过...
“大模型六虎”阶跃星辰3月将开源图生视频模型|钛媒体AGI
在首届Step UP生态开放日上,阶跃星辰公布了多项技术进展与战略规划。创始人姜大昕强调,公司正通过多模态与推理能力双轮驱动,推进AGI技术路线。今年3月将开...
钛媒体AGI独家|MiniMax副总裁魏伟离职,曾任腾讯云副总裁
中国AI大模型独角兽企业MiniMax(稀宇科技)合伙人、副总裁魏伟近期确认离职。公司回应称,国内B端业务将进入新阶段,由其他负责人接任,并强调技术能力提升...
DeepSeek满血微调秘籍来了,全网首发打破低价内卷!解锁升级版全家桶
Colossal-AI近期发布了开源大模型后训练工具箱,旨在帮助开发者通过低成本方式对DeepSeek V3/R1等大规模模型进行监督微调与强化学习优化。该工具箱支持高达67...
杨植麟和梁文锋,论文撞车了
在马斯克发布Grok3的同一天,DeepSeek与月之暗面分别发布论文,针对Transformer架构的核心注意力机制提出创新方案。DeepSeek的原生稀疏注意力(NSA)通过语义...
全球首测!OpenAI开源SWELancer,大模型冲击100万年薪
OpenAI近日开源了名为SWE-Lancer的新型大模型代码能力评估基准,该测试基准通过真实软件开发任务和端到端测试方法,为评估大语言模型的工程实践能力提供了新...
马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI
xAI团队发布了Grok-3系列模型及配套工具,标志着大规模算力与模型能力结合的新里程碑。该模型在20万块GPU集群上完成训练,成为首个突破10万GPU同步训练规模的...
20万卡吞金兽 Grok 3 炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源
埃隆·马斯克旗下的人工智能公司xAI正式发布新一代AI模型Grok 3及其迷你版本Grok 3-mini,宣称这是迄今为止最强大的AI模型。Grok 3的核心突破在于首次将推理能...
DeepSeek掀低成本革命,中科院系黑马闯入全球TOP 10!破解高精度-低能耗困局
2025年中国大模型领域迎来重要突破,DeepSeek与YAYI-Ultra两大模型展现出显著技术优势。DeepSeek-R1通过算法优化突破算力限制,其深度推理能力为国内大模型行...