音频生成

音频,audio

阿里又在AI上大出血了

步骤2:阿里巴巴正在大力投资AI大模型产业,最近领投了中国AI大模型初创公司MiniMax的新一轮大规模融资。这是阿里在2024年的第二笔AI大模型项目领投投资,之...

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

新智元报道介绍了微软亚洲研究院推出的基于字节的Transformer模型bGPT,该模型能够处理不同类型的数据,生成文本、图像和音频,甚至模拟计算机行为。bGPT与传...

AGI万字长文(下) | 2024,分叉与洪流

太长不看版摘要总结本文由Lian于2024年撰写,围绕AI技术的多方面发展进行了深入探讨。文章首先预测了2024-25年可能发生的AI技术进展,包括AI多模态的大爆发、...

万字梳理:阿里、腾讯等8家中国互联网大厂的50款大模型及应用,能否全面超越GPT-4? | 钛媒体AGI

自OpenAI推出ChatGPT以来,全球科技巨头纷纷加速布局AI大模型领域。钛媒体AGI整理了2023年以来,包括阿里巴巴、百度、字节跳动、腾讯、华为等在内的8家科技公...

字节模型来了!把字节当作token,统一一切,预测一切?

本文介绍了一种名为bGPT(byte GPT,字节GPT)的深度学习模型,它专门用于处理二进制数据和模拟数字世界。bGPT突破了传统语言模型的局限,能够直接理解和操作...

Pika放大招:今天起,视频和音效可以“一锅出”了!

文章介绍了Pika发布的新功能——Sound Effects,允许用户为视频生成无缝音效。用户可以通过两种方式生成音效:给出描述或让Pika自动生成。该功能受到网友们的好...

你花钱想消除的 AI 水印,其实也是虚假内容的克星

近几个月来,深度伪造(deepfakes)或人工智能生成内容的新闻报道层出不穷,涉及多个知名人物,如泰勒·斯威夫特、汤姆·汉克斯和美国总统乔·拜登。这些内容的...

ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

在2024年世界经济论坛上,图灵奖得主Yann LeCun提出了视频模型应该在抽象表征空间中进行预测的观点。本文研究者基于最优传输理论,提出了一种鲁棒的长视频学...

AGI万字长文:2023回顾与反思

2023年对于人工智能(AI)的发展来说,是一个充满惊喜和挑战的一年。本文作者Lian,MK通过深入分析,为我们描绘了一个关于通用人工智能(AGI)和大模型发展的...

马克.扎克伯格谈空间计算、Meta 的雷朋智能眼镜和 Quest 3

本文主要讨论了作者在上海和硅谷生活的最大区别,即消费观念的差异。作者表示,当手上有300美金闲钱时,他会选择购买不同的物品,如天猫包包或最新电子设备。...
1 16 17 18 19 20 23