“语音”的搜索结果

钛媒体AGI独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品
AI大模型领域的独角兽MiniMax计划于11月推出一款Realtime API服务,旨在提升端到端实时多模态处理能力,提供更低延时、更自然、更沉浸的...
趣丸科技联合港中大(深圳)开源首个语音大模型
趣丸科技与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”已在Amphion系统中开源,供全球用户使用。该模型采用掩码生成模型与语音...
Voice-first,闭关做一款语音产品的思考
在硅谷深入研究了两个多月后,作者发现语音产品是AI在C端领域的核心变革点。语音作为一种信息模态,正成为人们与产品交互的新接口,拓宽...
长文本、语音、视觉、结构化数据全覆盖,中国移动九天善智多模态大模型震撼发布
中国移动在第十二届全球合作伙伴大会上发布了九天善智多模态基座大模型,标志着其在人工智能领域的全面升级。该模型以全栈国产化和复杂...
OpenAI 发布实时 API,AI 实时语音时代如何抢占风口?
今年的RTE大会上,实时互动与AI的结合将展现巨大潜力。OpenAI发布的实时API公开测试版,基于GPT-4o语音到语音的AI应用和智能体,标志着...
AI 时代,语音会成为主流交互方式吗
语音交互技术正逐渐成为我们日常生活的一部分。十年前,与手机进行语音对话可能还显得有些不自然,但随着技术的发展,现在人们已经习惯...
OpenAI大礼包:实时语音、模型蒸馏都上了,要卖最好的货赚最多的钱
OpenAI在2024年的首场开发者日(DevDay)上展示了其最新的API工具和平台更新,旨在提升开发者体验并增强其AI技术的应用能力。尽管今年的...
史上首个AI+人类大合唱,ChatGPT语音模式玩出新高度!
OpenAI为ChatGPT Plus和Team用户推出了高级语音模式,允许用户与AI进行更丰富的互动。标普全球AI副总监AJ Smith展示了与ChatGPT合唱《El...
终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」
OpenAI公司最近推出了其高级语音功能,名为GPT-4o,该功能将向Plus和Team用户开放,但免费用户无法体验。Plus用户每月需支付20美元,而T...
OpenAI 突然推送推送高级语音模式「Her」,又抢了谷歌风头
9月25日,Google宣布了两款新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002的发布。Gemini Pro是Google系列模型中的中等规模模型,对付...
1 2 3 43