音频生成

刚刚，OpenAI首发语音Agent，智能体实现重大突破

OpenAI在凌晨的技术直播中发布了三款全新的语音模型，分别是GPT-40 Transcribe、GPT-4 Mini Transcribe和GPT-40 Mini TTS。这些模型专注于语音AI Agent的开发...

AI-Agent

6个月前

OpenAI近期发布了一系列新的语音和文本处理模型，包括两个语音转文本（STT）模型和一个文本生成语音（TTS）模型。这些模型通过API提供接入方式，旨在提升语音...

AIGC动态

6个月前

百度在文心一言两周年之际，推出了两款新模型——文心大模型4.5和文心大模型X1，并宣布免费向用户开放。这一消息迅速在海外社交媒体上引发热议，尤其是关于是否...

AIGC动态

6个月前

百度近日发布了两款大模型——文心4.5和X1，均已上线并免费向用户开放。文心4.5是一款多模态模型，能够对文字、图片、视频、音频等多种内容进行综合解读，其能...

AIGC动态

6个月前

百度最新发布的文心4.5和推理模型X1引起了广泛关注。文心4.5是一个原生多模态模型，能够理解音频、视频和图片，但不具备输出能力。相比之下，X1是一个推理模...

AIGC动态

6个月前

百度近日发布了两款全新的大模型——文心大模型 X1 和文心大模型 4.5，标志着其在 AI 领域的进一步突破。这两款模型不仅在功能上各有侧重，还通过技术创新和优...

AIGC动态

6个月前

米哈游创始人蔡浩宇在离开公司后，于硅谷创立了新公司Anuttacon，并推出了首款AI驱动的游戏《Whispers from the Star》。这款游戏于3月15日发布了首支预告片...

AIGC动态

6个月前

语音模型平台Cartesia宣布获得6400万美元A轮融资，由Kleiner Perkins领投。同时，Cartesia推出了最新语音模型Sonic 2.0和Sonic Turbo，其中Sonic 2.0的语音克...

AIGC动态

6个月前

自2014年苹果发布Apple Watch和2016年推出AirPods以来，苹果在智能穿戴领域的创新一直备受关注。Apple Watch经过十代迭代，已从一款简单的智能手表发展为功能...

AIGC动态

6个月前

GRPO训练作为一种基于PPO算法的改进方法，近年来在强化学习领域引起了广泛关注。GRPO通过采样替代value model的方式，简化了训练过程，提升了稳定性和可维护...

AIGC动态

6个月前