音频生成

音频,audio

全国首个上手机的AI视频通话来了!《黑神话:悟空》经文也能破译

智谱AI最新推出了一项AI视频通话功能,该功能允许AI在观看视频的同时与用户进行交流。这一创新功能已经在智谱清言App中上线,并且是全国首个正式开放的AI视频...

《黑神话》火到破纪录,老黄都要到游戏展秀一把:全景光追英伟达独享,同款技术还有20+游戏在路上

《黑神话》是一款引起全球玩家广泛关注的单机游戏,其峰值在线人数达到222.3万,位列Steam平台总榜第二、单机游戏历史第一。游戏上线24小时内,预售销量超过1...

Fireworks 乔琳:AI 产品上市时间从五年压缩到五天,我们的秘诀是什么?

Fireworks AI是一家提供生成式人工智能(GenAI)推理和调优服务的SaaS平台,其目标是为客户提供快速、经济、高度定制化的解决方案。公司在7月完成B轮融资,筹...

谷歌版Her大翻车:试了3次且换手机才成功…网友:我手动只需10秒

谷歌近期发布了一款名为Gemini Live的智能助手,旨在与OpenAI的GPT-4o竞争。Gemini Live具备拍照问答、实时对话等功能,能够查看用户日历、查询票价等。然而...

全球首个AI流媒体音乐App来了!中国造的

全球首个AI流媒体音乐应用Melodio由中国公司昆仑万维开发,提供基于用户输入的Prompt无限生成音乐的功能。Melodio支持中文,用户可通过输入描述性文字生成个...

​一夜之间,谷歌版GPT-4o和AI手机全上市了

谷歌在Made by Google活动上发布了Gemini Live,这是一款与OpenAI的高级语音模式GPT-4o竞争的产品。Gemini Live提供了一种移动对话体验,允许用户与Gemini进...

阿里开源新语音模型,比OpenAI的Whisper更好!

阿里巴巴公司在Qwen-Audio的基础上推出了新一代的开源语音模型Qwen2-Audio,该模型在多个方面进行了显著的优化和改进。Qwen2-Audio模型包含基础版和指令微调...

载入历史,YC新项目屠榜Product Hunt,病毒营销玩出新高度

Wordware,一个集成开发环境(IDE)的应用搭建平台,通过自然语言编程,允许用户构建复杂的人工智能代理(AI Agent)和应用。该平台在Product Hunt上的AI产品...

GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉

OpenAI的GPT-4o模型在经过一系列安全测试后,其语音功能因存在潜在风险而迟迟未能上线。该模型在高背景噪声环境下可能模仿用户声音,且在特定提示下可能发出...

比OpenAI的Whisper快50%,最新开源语音模型

生成式AI公司aiOla在其官网开源了一款名为Whisper-Medusa的语音模型,该模型在推理效率上相较于OpenAI的Whisper模型提升了50%。Whisper-Medusa在Whisper的基...
1 7 8 9 10 11 31