标签:大模型
腾讯推出快思考模型:API 成本只有 deepseek 不到一半
腾讯混元团队近期推出自研快思考模型Turbo S,该模型通过架构创新实现首字时延降低44%,部署成本较前代模型下降数倍,定价仅为0.8元/百万tokens输入费用。该...
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线
2月27日,腾讯混元自研快思考模型Turbo S正式发布,首字时延降低44%,吐字速度提升一倍,实现“秒回”级响应。该模型通过Hybrid-Mamba-Transformer混合架构创新...
得一微发布AI-MemoryX显存扩展技术,助力DeepSeek训推一体机
得一微电子推出的AI-MemoryX显存扩展解决方案,通过自研存储控制芯片和系统级创新,将单机显存容量从传统显卡的几十GB提升至10TB级别,解决了大模型微调训练...
超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!
阿里云旗下的视觉生成基座模型万相2.1(Wan)近日宣布开源,采用宽松的Apache2.0协议,公开了14B和1.3B两个参数规格的全部推理代码和权重。这一开源动作使得...
还得是上海!百亿级大模型项目现场对接,只用3天
DeepSeek大模型的广泛应用正推动AI技术深入社会各领域,从国民级APP到医疗、金融、教育等行业,AI技术落地的浪潮持续升级。卫宁健康发布的医疗大语言模型WING...
阶跃Agent生态首曝光:手机汽车IoT机器人全覆盖,千行百业唰唰落地
在阶跃星辰Step UP生态开放日上,公司展示了AI大模型技术落地的最新进展与战略布局。Agent技术被确立为核心发展方向,其爆发的关键支撑在于多模态能力与推理...
中国首个“AI算力生态超市”发布,企业将获100万元补贴|钛媒体AGI
上海市正加速推进智能算力基础设施建设,以应对未来算力需求并推动人工智能产业发展。模速空间算力生态平台作为国内首个大模型创新生态社区的核心载体,通过...
“大模型六虎”阶跃星辰3月将开源图生视频模型|钛媒体AGI
在首届Step UP生态开放日上,阶跃星辰公布了多项技术进展与战略规划。创始人姜大昕强调,公司正通过多模态与推理能力双轮驱动,推进AGI技术路线。今年3月将开...
钛媒体AGI独家|MiniMax副总裁魏伟离职,曾任腾讯云副总裁
中国AI大模型独角兽企业MiniMax(稀宇科技)合伙人、副总裁魏伟近期确认离职。公司回应称,国内B端业务将进入新阶段,由其他负责人接任,并强调技术能力提升...
DeepSeek满血微调秘籍来了,全网首发打破低价内卷!解锁升级版全家桶
Colossal-AI近期发布了开源大模型后训练工具箱,旨在帮助开发者通过低成本方式对DeepSeek V3/R1等大规模模型进行监督微调与强化学习优化。该工具箱支持高达67...