音频生成
音频,audio
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
谷歌和Meta两大科技巨头近日在AI播客领域动作频频,引发业界关注。上个月,谷歌宣布对其AI笔记应用NotebookLM进行重大更新,新增了生成YouTube视频和音频文件...
百度又放大招!视觉生成模型 Hallo2 或将落地数字人等场景
百度与复旦大学联合发布了Hallo2,这是一个创新的视觉模型,能够生成长达数小时、分辨率高达4K的人物动画。Hallo2的发布在海外引起了广泛关注,其开源模型和...
钛媒体AGI独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品
AI大模型领域的独角兽MiniMax计划于11月推出一款Realtime API服务,旨在提升端到端实时多模态处理能力,提供更低延时、更自然、更沉浸的实时语音对话体验。这...
NotebookLM核心负责人访谈: 项目不到 10个人,体验惊艳全球,但它还只是个技术demo
Google在2024年推出了一个名为NotebookLM的项目,该项目在设计和体验上获得了行业的高度评价。NotebookLM的负责人Raiza Martin在Lenny's Podcast的采访中分享...
Voice-first,闭关做一款语音产品的思考
在硅谷深入研究了两个多月后,作者发现语音产品是AI在C端领域的核心变革点。语音作为一种信息模态,正成为人们与产品交互的新接口,拓宽了物理边界。作者认为...
字节的第一款 AI 硬件,只是一次悄悄试水?
字节跳动通过其品牌豆包发布了AI智能体耳机Ola Friend,标志着公司在AI硬件领域的进一步扩展。这款开放式耳机重量轻,单耳仅6.6克,提供几乎无感的佩戴体验。...
手机 AI 2.0 时代,OriginOS 5 找到了哪些「成功密码」?
智能手机系统正迈入AI浪潮的2.0时代,厂商们在推出AI功能手机的同时,面临如何将AI大模型能力融入手机的挑战。vivo在2024开发者大会上推出的OriginOS 5系统,...
OpenAI 发布实时 API,AI 实时语音时代如何抢占风口?
今年的RTE大会上,实时互动与AI的结合将展现巨大潜力。OpenAI发布的实时API公开测试版,基于GPT-4o语音到语音的AI应用和智能体,标志着实时语音交互能力的新...
谷歌这款AI应用凭什么在一年后爆红?大神卡帕西:或是下一个ChatGPT
NotebookLM是一款由谷歌实验室开发的AI助手,最初名为Tailwind,后更名为NotebookLM,以更好地反映其帮助用户管理大量信息的功能。该产品能够处理Google Docs...
国外游戏作家:吓死了,谷歌NotebookLM的假AI播客正在评论我的书!
谷歌NotebookLM的文字生播客功能引起了广泛关注,其能够将文字内容迅速转换成播客形式,为听众提供一种新颖的信息接收方式。游戏作家Kyle Orland发现自己的扫...