音频生成
音频,audio
Suno不再是唯一答案,企业开始选择这个国产AI音乐
企业级客户正逐步将生成式音频技术从原有非官方或高成本路径转向专用解决方案,底层性能的跨越式进阶与配套体系的完善主导了此次产业替换潮。在过往缺乏成熟...
Product Hunt月榜盘点:单纯做Agent已经不够了,要切进真实、高频的工作流中
四月AI新产品市场数据折射出行业范式的显著迁移。前期依赖命名红利与生态占位的趋势逐步消退,产品形态走向稳定。AI系统正跨越单一的能力演示阶段,全面转向...
GPT-5级推理能力塞进语音模型,OpenAI把同传翻译成本砍穿地板价
OpenAI正式推出三款实时语音交互模型,涵盖高维逻辑推演、流式多语翻译与低延迟语音转写,全面拓展了端到端交互的技术边界。新一代语音架构通过极低的响应延...
非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品
针对大语言模型的情感与主观体验评估,研究人员通过五十六个基础模型系统性地构建了功能性幸福感测评框架。该框架摒弃了意识真伪的哲学争议,转而依赖经验效...
他用AI办了个音乐节,主题:别读博
科研工作者因意外骨折被迫中止实验室工作,在此期间利用AI技术创作了“不读博音乐节”音乐改编系列。该系列聚焦研究生群体面临的实验受挫、论文拒稿、延期毕业...
实测纳逗 Pro:能做专业影视级内容的智能平台长啥样
当前人工智能视频技术已跨越早期功能验证阶段,全面进入追求画面质感、叙事逻辑与商业可用性深度融合的专业化发展新周期。行业竞争焦点逐步转向能否将生成式...
20岁了!劈柴哥发帖庆生:谷歌翻译换了4代AI,第一次有了「呼吸感」
四月二十八日,谷歌翻译迎来二十周年发展节点,其系统升级路径完整映射出底层人工智能算法的迭代轨迹。早期架构依赖统计机器翻译技术,通过海量语料库计算词...
说实话,Kimi这次的东西挺难描述的
Kimi 近期发布了多项新功能,包括 K2.6 模型、Agent 集群以及 Claw Group 群聊协作模式,这些更新标志着人机协作方式正在发生重大转变。当真人与 AI 坐进同一...
字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列
字节跳动旗下现象级 AI 视频技术 Seedance 2.0 已在 arXiv 正式发布论文,公开了长达 26 页的评测基准及完整的 170 位团队成员名单,署名和尊重细节十分到位...
字节Seed最新模型,让豆包学会闭嘴听人说话(骂人也更自然了!)
字节跳动旗下 AI 研究团队_seed 于 4 月 9 日发布全新语音模型 Seeduplex 并在豆包 App 完成全量部署,其核心在于解决了长期存在的通信延迟与状态分离问题。...



