音频生成

8人半年肝出开源版GPT-4o，0延迟演示全网沸腾！背后技术揭秘，人人免费用

法国AI实验室kyutai近日发布了一款名为Moshi的实时原生多模态AI模型，该模型在演示中展示了接近GPT-4o水平的性能，引起了广泛关注和AI界大佬的转发。Moshi的...

AIGC动态

1年前 (2024)

阿里巴巴通义实验室开发的EMO技术，通过一张图片和一段音频，能够生成与音频同步的生动视频。这项技术在央视《2024中国·AI盛典》中成功'复活'了北宋文学家苏...

AIGC动态

1年前 (2024)

互联网大厂们已经开始合法地使用用户数据进行AI训练。随着AI竞赛的加剧，科技公司需要大量数据来训练模型，当普通数据挖掘殆尽时，用户个人内容成为了新的数...

AIGC动态

1年前 (2024)

华为和腾讯的研究人员联合开发了一种创新的视频模型AniPortrait，该模型能够通过音频和人物图片自动生成与音频同步的视频。AniPortrait的核心框架分为两大块...

AIGC动态

1年前 (2024)

2023年第二季度，人工智能领域经历了一系列重要事件和发展，包括新模型的发布、公司裁员、成功上市以及产品争议等。以下是本季度AI领域的主要亮点：1. Meta发...

AIGC动态

1年前 (2024)

旷视科技近期推出了一款名为MegActor的开源AI人像视频生成框架，该框架允许用户通过输入一张静态肖像图片和一段视频，生成表情丰富、动作一致的AI人像视频。M...

AIGC动态

1年前 (2024)

快手搜索部门技术专家许坤在QCon 2024北京的分享中，深入探讨了大模型技术在快手搜索领域的应用，特别是多模态理解和生成方面的最新科研进展。许坤介绍了快手...

AIGC动态

1年前 (2024)

随着生成式AI产品如ChatGPT和Sora等的流行，Transformer架构已成为处理文本、图像、视频和音频等数据的大型语言模型（LLM）的基础。谷歌提出了一种名为Infini...

AIGC动态

1年前 (2024)

月之暗面正在为进军美国市场做准备，计划通过新一轮融资将估值提升至30亿美元，新的投资者包括腾讯。今年2月，该公司已获得阿里领投的10亿美元融资，当时估值...

AIGC动态

1年前 (2024)

专注于AIGC领域的专业社区，关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态。谷歌Deepm...

AIGC动态

1年前 (2024)