音频生成

音频,audio

Meta发布多模态模型Chameleon:34B、类GPT-4o、性能接近GPT-4V

在多模态人工智能领域,GPT-4o 的问世开创了一个新纪元,被称为首个“原生”多模态模型,因其能无缝融合文本、视觉和音频。区别于传统多模态模型采用的特定模态...

刚刚!OpenAI发文澄清:ChatGPT声音是由400多个配音演员数据训练的,并非知名女歌手|钛媒体AGI

OpenAI公司针对社区关于其人工智能助手ChatGPT中的声音相似性问题进行了澄清。该声音被误认为与美国女演员斯嘉丽·约翰逊相似,但OpenAI表明这是由超过400名配...

Sam Altman:GPT-4o幕后揭秘,GPT-5会很特别

在最近的一次专访中,OpenAI首席执行官Sam Altman与红点风险投资公司董事总经理Logan Bartlett讨论了GPT-4o的幕后技术以及未来产品的展望。GPT-4o作为一个多...

18个月,OpenAI这支团队搞出了GPT-4o

在人工智能领域,OpenAI的新一代旗舰生成模型GPT-4o的发布引起了广泛关注。该模型的诞生得益于多位研究人员的共同努力,其中Prafulla Dhariwal作为Omni团队的...

前脚OpenAI,后脚谷歌,“个性化教育、因材施教”正从理想走向现实

在未来教育的发展中,多模态AI产品的出现预示着个性化教学和因材施教的理念正逐步变为现实。OpenAI的GPT-4o和谷歌推出的LearnLM等多模态AI工具,在实时交互、...

对标GPT4o!谷歌发布Project Astra,全民AI代理时代来啦

在5月15日的谷歌“ I/O 2024”大会上,生成式AI成为焦点,谷歌DeepMind发布了一款名为Project Astra的AI代理产品。Project Astra能够实现跨文本、音频、视频的...

微软宣布GPT-4o模型,可在 Azure OpenAI上使用

模型发布与应用平台:微软在官网宣布,OpenAI的多模态模型GPT-4o已在Azure OpenAI云服务中可用。GPT-4o能够进行跨文本、视频、音频的多模态推理,例如,可以...

GPT-4o干掉初创全网实测,马斯克Karpathy等大佬纷表不服:OpenAI不过如此

新智元报道了OpenAI的全能模型GPT-4o的上线,这一事件对初创公司产生了巨大影响。GPT-4o以其卓越的推理速度和能力,被认为将导致许多初创公司面临倒闭的风险...

谷歌2小时疯狂复仇,终极杀器硬刚GPT-4o!Gemini颠覆搜索,视频AI震破Sora

Gemini 1.5 Pro:谷歌宣布了其大型语言模型Gemini的新版本,Gemini 1.5 Pro,其上下文长度达到了200万token,远超现有的大型语言模型。这一特性使得模型能够...

昨晚,谷歌发布「AI 超级全家桶」,但最大的创新却被 OpenAI 狙击了

在最近的谷歌I/O大会上,谷歌展示了其在人工智能领域的最新进展,包括一系列基于Gemini的AI产品和应用。然而,尽管谷歌的展示内容丰富,OpenAI的GPT-4o AI智...
1 2 3 16