音频生成

Gemini一眼识破Sora视频是AI生成？百万token上下文能力碾压GPT-4

新智元报道：谷歌的Gemini 1.5模型在AI圈大佬们的极限测试中展现出了强大的实力。这些测试包括分析视频内容、处理长视频和音频、翻译稀有语言、理解长论文和...

AIGC动态

10个月前

OpenAI发布Sora视频生成模型，引发全球关注OpenAI近日发布了一个名为Sora的视频生成模型，该模型能够生成长达60秒的高清视频，与以往只能生成几秒钟视频的模...

AIGC动态

10个月前

AI语音克隆公司ElevenLabs即将推出AI Sound Effects功能，该功能可以根据用户输入的提示自动生成声音，为视频添加逼真的背景声音。ElevenLabs的这项新功能在...

AIGC动态

10个月前

谷歌DeepMind近日发布了新一代多模态大模型——Gemini 1.5系列。Gemini 1.5 Pro是谷歌最强的MoE大模型，最高可支持10,000K token超长上下文。Gemini 1.5 Pro在...

AIGC动态

10个月前

步骤2：摘要总结新智元报道了AI初创公司ElevenLabs宣布获得8000万美元的B轮融资，估值超过10亿美元，成为独角兽之一。该公司由前Google机器学习工程师和前Pal...

AIGC动态

11个月前

文章主要介绍了谷歌的AI视频生成模型VideoPoet的最新研究成果。VideoPoet是一个大型语言模型（LLM），用于零样本视频生成，能够执行多种视频生成任务，包括文...

AIGC动态

11个月前

谷歌的对话式AI工具Bard即将迎来一周年纪念，并进行了新的升级。Bard最初因回答不够贴近人类而落后，后来引入了Gemini AI模型，使其学习范围从文本扩展到视频...

AIGC动态

11个月前

h2oGPT 是一个基于Apache V2协议的开源项目，旨在提供一个100%私密的文档和图像问答、摘要以及与本地GPT模型的聊天体验。以下是h2oGPT的核心功能：1. 私人文...

AIGC动态

11个月前

Amphion是一个面向音频、音乐和语音生成的工具包，旨在支持可复制研究，并帮助初级研究人员和工程师进入音频、音乐和语音生成领域。它提供了多种功能，包括TT...

AIGC动态

11个月前

在2月初，谷歌发布了全新的AI生成工具，包括ImageFX、MusicFX和TextFX。其中，ImageFX基于DeepMind的文生成图技术Image2，支持高分辨率图片和创意性强，最大...

AIGC动态

11个月前