音频生成
音频,audio
独立开发者idoubi:一年做11个产品,「也许砍掉一半会更开心」
独立开发者idoubi在辞职一年后开发了11个AI产品,包括AI红包、AI壁纸、AI虚拟试衣等。尽管外界视他为开发大神,idoubi自认为还是独立开发的初学者,面临的挑...
鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库,实测在此
鹅厂新推出的AI助手ima copilot以其独特的功能在公众号领域引起关注。该工具不仅能够一键将微信公众号的优质内容整合进个人知识库,还能进行内容检索和总结,...
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
谷歌和Meta两大科技巨头近日在AI播客领域动作频频,引发业界关注。上个月,谷歌宣布对其AI笔记应用NotebookLM进行重大更新,新增了生成YouTube视频和音频文件...
百度又放大招!视觉生成模型 Hallo2 或将落地数字人等场景
百度与复旦大学联合发布了Hallo2,这是一个创新的视觉模型,能够生成长达数小时、分辨率高达4K的人物动画。Hallo2的发布在海外引起了广泛关注,其开源模型和...
钛媒体AGI独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品
AI大模型领域的独角兽MiniMax计划于11月推出一款Realtime API服务,旨在提升端到端实时多模态处理能力,提供更低延时、更自然、更沉浸的实时语音对话体验。这...
NotebookLM核心负责人访谈: 项目不到 10个人,体验惊艳全球,但它还只是个技术demo
Google在2024年推出了一个名为NotebookLM的项目,该项目在设计和体验上获得了行业的高度评价。NotebookLM的负责人Raiza Martin在Lenny's Podcast的采访中分享...
Voice-first,闭关做一款语音产品的思考
在硅谷深入研究了两个多月后,作者发现语音产品是AI在C端领域的核心变革点。语音作为一种信息模态,正成为人们与产品交互的新接口,拓宽了物理边界。作者认为...
字节的第一款 AI 硬件,只是一次悄悄试水?
字节跳动通过其品牌豆包发布了AI智能体耳机Ola Friend,标志着公司在AI硬件领域的进一步扩展。这款开放式耳机重量轻,单耳仅6.6克,提供几乎无感的佩戴体验。...
手机 AI 2.0 时代,OriginOS 5 找到了哪些「成功密码」?
智能手机系统正迈入AI浪潮的2.0时代,厂商们在推出AI功能手机的同时,面临如何将AI大模型能力融入手机的挑战。vivo在2024开发者大会上推出的OriginOS 5系统,...
OpenAI 发布实时 API,AI 实时语音时代如何抢占风口?
今年的RTE大会上,实时互动与AI的结合将展现巨大潜力。OpenAI发布的实时API公开测试版,基于GPT-4o语音到语音的AI应用和智能体,标志着实时语音交互能力的新...