音频生成

音频,audio

邱锡鹏团队新作:让机器人学会「察言观色」

复旦大学、上海创智学院及新加坡国立大学研究团队近期发布的RoboOmni框架,突破了传统视觉-语言-动作(VLA)模型的局限,通过全模态整合实现了机器人对隐含意...

美团开源全模态,比肩顶级闭源模型,开源新SOTA

美团LongCat团队发布了5600亿参数的开源全模态模型LongCat-Flash-Omni,该模型能够实现毫秒级的实时音频-视觉交互。其核心是一个端到端的全模态架构,能够接...

SkyReels全新上线:昆仑万维盯上AI短剧

昆仑万维旗下AI视频创作平台SkyReels于近期全面焕新上线,同步推出Web端与移动端APP,标志着其技术布局进入新阶段。该平台诞生于2023年,核心目标是解决长视...

151% 的增长背后,它正在成为 AI 的「新入口」

AI语音技术正以前所未有的速度发展,成为价值1500亿美元的新兴赛道。在声网与RTE开发者社区联合主办的Convo AI & RTE 2025大会上,专家们探讨了实时互动(RTE...

实测全新 SkyReels :AI 创作,终于连成了一体

生成式AI技术虽快速发展,但视频创作仍面临高门槛问题。当前流程涉及脚本撰写、画面生成、配音剪辑等多个环节,依赖不同软件工具,导致普通创作者需承担较高...

刚刚,AI视频的天花板被掀翻!测完SkyReels后飘了:我亦有成为专业导演的潜质

昆仑万维近日推出全新升级的AI视频创作平台SkyReels,标志着多模态内容生成技术进入新阶段。该平台通过'模型+平台'双轨模式,集成图像、音频、视频、数字人等...

美团新独立APP,点不了菜只能点AI

美团最新开源的多模态模型LongCat-Flash-Omni实现了全模态实时交互能力,在Omni-Bench等综合性基准测试中超越同类开源模型,达到与闭源Gemini-2.5-Pro相当的...

iQOO Neo11 :一杯即满配的“超神游戏机”来了

10月的国产手机市场竞争异常激烈,中高端市场尤其是性价比性能机领域,iQOO、红米、一加三大品牌几乎同期推出新品。vivo在发布iQOO 15后,又推出了iQOO Neo11...

从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

AI视频技术从极客专属到全民可用的跨越,标志着生成式AI进入新阶段。2025年第四季度,OpenAI的Sora 2与阿里的Wan2.5-Preview两大模型引发全球热潮,前者通过'...

模力工场 017 周 AI 应用榜: 从营销工具到情感共鸣,最“温柔”AI 应用榜单来袭

模力工场与极客时间联合举办的八周年直播活动聚焦“程序员如何成为AI时代超级个体”,邀请多位行业专家进行圆桌讨论。与会者认为,AI工具正在重塑开发方式,推...
1 2 3 50