一天开源五个模型,AI 热潮将加速今年中国智算规模增长43%|钛媒体AGI

文章摘要
【关 键 词】 开源模型、视频生成、语音交互、算力优化、行业趋势
阶跃星辰与吉利汽车集团联合宣布开源两款多模态大模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V和首款产品级开源语音交互模型Step-Audio。Step-Video-T2V参数量达300亿,支持生成204帧、540P分辨率视频,在指令遵循、运动平滑性等11项评测维度中表现优异;Step-Audio则以1300亿参数实现超自然语音交互,支持方言、歌声及音色复刻,并在HSK-6评测中成绩突出。此外,阶跃星辰还开源了视频质量评测基准数据集Step-Video-T2V-Eval,覆盖多维度内容评估。
昆仑万维同日推出开源视频生成模型SkyReels-V1及表情动作可控算法SkyReels-A1,SkyReels-V1在同等分辨率下指标达开源SOTA水平,单台RTX4090显卡可80秒生成544P视频,端到端延迟较腾讯混元HunyuanVideo减少58.3%。该模型支持文生视频与图生视频,并通过自研推理框架优化显存占用与分布式计算效率,进一步降低用户使用门槛。
中国智能算力市场呈现高速增长态势,2024年规模与市场规模同比增幅分别达74.1%和86.9%,预计2025年市场规模将突破259亿美元。算力相关企业注册量同比激增52.21%,超40%企业注册资本超千万元。人才需求方面,计算机硬件与软件行业求职人数环比增长近50%,人工智能工程师岗位薪资涨幅显著,反映行业技术竞争加剧。
国际层面,OpenAI宣布将开源下一代模型,可能推出适配手机端的小型化版本;马斯克旗下xAI发布Grok 3模型,训练算力较前代提升10倍,使用20万张GPU集群完成两阶段训练,性能超越OpenAI o3-mini-high与DeepSeek R1。这一系列动态表明,开源生态与算力竞赛正加速推动AI技术向多模态、高效率方向迭代,同时促进跨行业应用场景的深度融合。
原文和模型
【原文链接】 阅读原文 [ 1868字 | 8分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 deepseek-r1
【摘要评分】 ★★★☆☆