音频生成

音频,audio

最大参数 300 亿!阶跃星辰与吉利联合开源两款多模态大模型

阶跃星辰与吉利汽车集团联合宣布,将Step系列多模态大模型向全球开发者开源。此次开源包含参数量达300亿的Step-Video-T2V视频生成模型,以及产品级开源语音交...

OpenAI CTO的新创业公司,我没理解要干嘛。

Mira Murati与多位OpenAI前高管共同创立的人工智能初创公司Thinking Machines Lab,正致力于开发增强人类与机器协作能力的多模态AI系统。该公司的核心目标是...

全球最大开源视频模型,现在也Created in China了,阶跃出品

阶跃星辰与吉利汽车集团联合开源两款多模态大模型——Step-Video-T2V和Step-Audio,引发行业关注。Step-Video-T2V是目前全球参数量最大的开源视频生成模型,采...

一天开源五个模型,AI 热潮将加速今年中国智算规模增长43%|钛媒体AGI

阶跃星辰与吉利汽车集团联合宣布开源两款多模态大模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V和首款产品级开源语音交互模型Step-Audio。Step-...

接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型

国内AI创业公司阶跃星辰与吉利汽车集团联合开源Step-Video-T2V视频生成模型和Step-Audio语音交互模型。Step-Video-T2V以300亿参数量成为当前性能最优的开源视...

最强全模态模型Ola-7B横扫图像、视频、音频主流榜单,腾讯混元Research&清华&NTU联手打造

腾讯混元Research、清华大学i-Vision实验室与南洋理工大学S-Lab联合推出的Ola全模态语言模型,通过渐进式模态对齐策略实现了图像、视频和音频理解能力的突破...

2024年Product Hunt产品榜:Cursor年度最佳,众多AI产品上榜

Product Hunt 2024年度金喵奖榜单揭示了技术领域多维度创新趋势。在年度产品评选中,Cursor凭借AI协作编程能力摘得冠军,其通过实时反馈机制显著提升开发者效...

官宣!阿里巴巴确定与苹果合作,为中国iPhone提供AI

技术落地层面,阿里巴巴的AI解决方案已渗透多个场景:Qwen2-Audio在电商客服、跨语言翻译、物流调度等领域验证了实用性;Qwen2.5-VL则拓展了智能终端的人机交...

DeepSeek 不够用吗?你的团队为什么还需要招人?!

春节期间,极客公园编辑部发现AI技术已深度渗透至三四线城市家庭场景。长辈们不仅主动讨论DeepSeek与豆包等AI工具的使用体验,甚至开始反向指导年轻一代操作A...

苹果抛弃DeepSeek,选择与阿里合作开发中国iPhone AI 功能|钛媒体AGI

苹果公司与阿里巴巴集团达成合作,共同开发面向中国市场的AI功能,相关成果已提交审批。这一合作被视为苹果应对在华销量连续两年下滑的重要软件升级战略,计...
1 2 3 4 36