我用豆包，生成了AI版《红楼梦》MV

2,346 0 0

文章摘要

【关键词】 AI视频生成、PixelDance、音乐视频、豆包模型、同声传译

字节跳动公司近期推出了一系列先进的AI视频生成模型，包括PixelDance和Seaweed模型，这些模型因其出色的效果而受到广泛关注。为了测试这些模型的能力，作者尝试使用这些AI工具制作了一部《红楼梦》主题的音乐视频。

制作过程中，首先利用豆包查询《红楼梦》中的经典片段作为生成图片的提示（Prompt），然后使用即梦模型生成画作。接着，将生成的图片输入PixelDance模型，并提供相应的动作提示来生成视频片段。此外，还使用了海绵音乐模型根据简单的情感描述生成背景音乐，最后通过剪映进行视频剪辑。

PixelDance模型展现出了四个关键能力：精准的语义理解，能够处理多动作和多主体交互；强大的动态效果和炫酷的运镜技术；在多镜头生成中保持一致性；以及支持多种风格和比例。这些能力使得生成的视频在质量上达到了影视级别。

除了视频模型，字节跳动还发布了豆包音乐模型和同声传译模型，后者能够实时翻译并保持高准确性和自然度。此外，豆包通用模型也得到了显著提升。

豆包大模型家族的日均tokens使用量已经超过1.3万亿，显示出广泛的应用和接受度。字节跳动采取了“先To C，再To B”的策略，即先在消费者层面达到极致效果，再将模型应用于商业领域。随着大模型价格的下降，创新的成本障碍正在降低。

文章最后提到，字节跳动的AI技术不仅限于视频生成，还包括音乐创作和同声传译等多个领域，展现了公司在AI领域的全面进步和潜力。

原文和模型

【原文链接】 阅读原文 [ 4549字 | 19分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # GPT-GPTs # 大模型 # 视频生成 # AI视频生成 # PixelDance # 同声传译 # 豆包模型 # 音乐视频

文章版权归作者所有，未经允许请勿转载。

智谱AI版Sora来了！人人免费不限次，有手机就能玩，API也开放了

量子位

3,028

字节内部AI“赛马”结束，大模型全跟豆包姓，一出手就点名阿里百度

admin

2,792

3 个月 9 次升级，可灵 AI 进化到什么程度了?

极客公园

1,811

北大发起复现Sora，框架已搭！袁粒田永鸿领衔，AnimateDiff大神响应

量子位

2,939

老便宜了！字节跳动豆包大模型开始营业，一元钱能买125万Tokens，月活用户量达2600万

AI前线

3,084

谷歌VideoPoet负责人蒋路跳槽TikTok！对标Sora，AI视频模型大战在即

新智元

3,118

暂无评论

暂无评论...

我用豆包，生成了AI版《红楼梦》MV

文章摘要

原文和模型

一款颠覆性的RISC-V芯片

打造一个 Cursor 只需要三步

相关文章

暂无评论

热门网址

热门文章

我用豆包，生成了AI版《红楼梦》MV

文章摘要

原文和模型

一款颠覆性的RISC-V芯片

打造一个 Cursor 只需要三步

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章