音频生成
音频,audio
亚马逊全球AI报告:2025年,企业加大生成式AI落地和投资
全球电商和云计算巨头亚马逊近期发布了一份《全球企业生成式AI应用指数报告》,该报告基于对9个国家3,739位高级IT决策者的深度调查,揭示了生成式AI在企业中...
谷歌Gemini 2.5全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机
谷歌最新发布的Gemini 2.5系列模型,标志着其在人工智能领域的又一次重大突破。此次更新包括Gemini 2.5 Pro、Gemini 2.5 Flash以及首次亮相的Gemini 2.5 Flas...
松下发布多模态大模型,文本、图像、音频随意切换
随着大模型技术的快速发展,多模态数据处理逐渐成为研究热点。多模态生成任务通过整合文本、图像、音频等多种类型的数据,实现不同模态之间的相互转换与生成...
AI改变世界!微软发布700个真实AI Agent、Copilot应用案例
微软作为全球AI领域的领导者,发布了700个真实的Agent智能体和Microsoft Copilot应用案例,展示了AI如何在不同行业中改变工作模式。这些案例涵盖了金融、医疗...
从高考到实战,豆包大模型交卷了
在火山引擎原动力大会 Force 2025 上,火山引擎发布了多项 AI 新产品和升级,展示了其在 AI 领域的全面布局。豆包大模型 1.6 成为焦点,其性能在一般任务和推...
谷歌悄咪咪上线了 10 款 AI 应用,下一个 NotebookLM 可能在里面
Google Labs作为谷歌官方的AI实验平台,已成为生成式AI创新的重要孵化器。该平台近期密集上线了十余款兼具实用性和趣味性的AI工具,涵盖内容创作、生活服务、...
太逼真!豆包·播客模型来了:一句话生成「苏超联赛」播客,很懂13太保的梗
火山引擎发布了豆包·播客模型,这一AI工具能够生成高度拟真的双人对话播客,其语音表现力与真人几乎无异。用户只需在豆包PC版中点击“网页播客”按钮,即可快速...
手机芯片,大变局
领先智能手机厂商正面临本地生成式AI、标准功能与云端数据交互带来的计算与功耗挑战。高端智能手机的SoC普遍采用异构架构,通过不同模块协同处理多样化任务。...
AI文本转语音进入“Next Level”!独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制
ElevenLabs最新发布的AI语音合成模型Eleven v3,标志着文本转语音技术的显著进步。该模型支持70多种语言,包括中文,并能够进行多人对话,展现出丰富的情感表...
专访 TI 副总裁王凡:三大市场+两大技术如何重塑行业未来?
在科技快速发展的背景下,智能汽车、机器人、工业自动化、新能源等领域正经历深刻变革,为半导体行业带来新的机遇。德州仪器 (TI) 作为全球领先的模拟与嵌入...