深度！超详细文本提示词技巧，Gen-3发布保姆级教程

AIGC动态1年前 (2024)发布 AIGCOPEN

3,581 0 0

文章摘要

生成式AI平台Runway于7月9日在其官网发布了针对其最新文生视频模型Gen-3 Alpha的文本提示教程。该教程旨在帮助用户更精准地生成视频，解决用户在使用Gen-3等产品时遇到的生成结果与预期不符的问题。

正确的文本提示应包含场景环境、视觉描述等详细信息，如“夕阳下的海滩，金色阳光洒在波光粼粼的海面上，海鸥飞翔，远处渔船航行，高清写实风格慢动作”。对于带音频的视频模型，还应添加鸟叫、汽笛声等音乐关键词，以实现音画融合。这些文本提示技巧不仅适用于Gen-3，也适用于其他免费产品。

技术层面上，输入的文本提示会被转换成向量，包含场景、人物、动作等关键信息，这些向量在视频生成过程中起到引导作用。模型会根据这些向量生成与文本描述一致的视频内容，同时考虑时间序列和连贯性，确保视频在视觉上和动作逻辑上都与描述相符。

Runway建议将场景、主题和镜头运动的细节分为不同模块，以实现最佳效果。Gen-3的标准提示结构包括镜头移动和额外细节。例如，近景特写镜头可以描述为“高清的指头上站着好奇的迷你小狗”。此外，Gen-3模型还包含相机风格、灯光效果、移动效果、运动类型、风格与审美以及文本样式等六大类别的提示词，以帮助用户精准控制视频的呈现风格。

文本提示词在大模型生成过程中起到关键作用，相当于“指导员”，引导模型创造与描述相匹配的内容。掌握一种提示技巧后，学习其他类型的提示将变得更加容易。AIGC开放社区分享了使用提示词的心得，并提供了Gen-3官方提示词教程，以帮助用户更有效地使用该模型生成视频。