音频生成

音频,audio

历史性时刻!Google Veo 3杀疯了,AI视频终于不再是“哑巴”

谷歌在今年的I/O大会上发布了一系列重磅AI产品,其中最引人注目的是DeepMind推出的Veo 3视频生成模型。Veo 3的突破性在于它将AI视频生成直接带入了有声时代,...

这才是现在最强的AI声音模型。

MiniMax公司近期发布了其新一代AI声音模型Speech-02,标志着在AI音频领域的技术突破。这一新模型在多个关键指标上表现出色,特别是在语音识别准确度(WER)和...

2025年哪款模型最受欢迎?Poe最新报告:DeepSeek降温、可灵成黑马

Poe 平台发布的最新人工智能模型使用趋势报告,涵盖了 2025 年 1 月至 5 月期间用户在文本、推理、图像、视频和音频领域的使用数据。报告揭示了多个关键趋势...

倒计时3天,纳芯微汽车电子技术研讨会火热报名中

在智能化与电动化趋势的推动下,汽车产业正经历深刻变革,芯片作为核心技术,成为系统演进的关键驱动力。5月15日,纳芯微将在广州举办【汽车电子技术研讨会】...

秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一

Kimi-Audio 是一个全新的通用音频基础模型,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在多个音频基准测试中实现了最先进的性能。结果显示,...

哥大退学网红AI作弊器,亲测翻车!搅黄会议划水90s,创始人承认仅是雏形

外媒记者对哥大退学网红Roy Lee的AI作弊工具「Cheat Everything」进行了实测,结果发现该工具在实际使用中存在诸多问题。记者在与编辑对话和团队会议中使用Cl...

用AI做“跳看”,爱奇艺要让用户掌握主动权

爱奇艺在最新的App更新中推出了“跳看”功能,用户只需在屏幕两侧上下划动即可直接跳转到精彩剧情点。这一功能的实现依赖于AI技术,能够识别视频中的关键情节,...

刚刚,o4-mini发布!OpenAI史上最强、最智能模型

OpenAI在技术直播中发布了其最新的多模态模型o4-mini和满血版o3,这两款模型能够同时处理文本、图像和音频,并具备调用外部工具的能力。这一创新使得模型能够...

谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命

谷歌最新推出的DolphinGemma大模型,基于30年的海豚研究数据,试图破解海豚的语言密码。这一仅有400M参数的轻量级模型能够在普通Pixel手机上运行,不仅能够识...

“字节暗示我太穷”:Seed团队1000张H100训练7B模型,发布全球首个25秒AI视频,验证视觉生成Scaling Law?

字节跳动近日发布了全球首个由AI生成的25秒视频,这一成果由Seaweed-7B模型完成。该模型参数量仅为70亿,但在核心任务上的表现超越了参数量为其两倍的主流模...
1 2 3 4 41