第5章:Prompt 结构详解:从灵感到镜头
Prompt 是连接创意与视频生成的桥梁。 当你学会使用结构化思维去表达视觉语言,就能让 AI 精确理解你的创作意图。
第 5 课|Prompt 结构详解:从灵感到镜头
一、Prompt 的本质:文字即镜头
在前几课中,我们学习了如何用文字生成视频,并了解了商业视频中不同类型的 Prompt 写法。 从这一课开始,我们将更深入地掌握 Prompt 的结构逻辑——也就是如何让一句文字真正转化为符合你想象的视频画面。
Prompt 不只是“指令”,而是“镜头语言”。 它决定了 AI 如何理解你的创意、构图、光线与情绪。
Sora 2 的视频生成逻辑建立在视觉语言之上。 当你输入一段文字时,系统会自动解析其中的语义结构,将其拆分为“场景、主体、动作、光线、情绪、镜头”等要素,然后组合成连贯的视觉表现。
二、Prompt 的核心语法结构
每一条高质量的 Prompt,实质上都是一句“完整的镜头描述”。 写 Prompt 的思维方式,类似于导演对摄影师下达拍摄指令。
基本语法公式:
场景 → 主体 → 动作 → 光线 → 情绪 → 镜头运动
这六个部分构成了一句 Prompt 的核心逻辑。 在实际写作时,可以根据需要省略某些部分,但整体顺序建议保持一致,以便 Sora 2 正确理解你的意图。
示例讲解
Prompt:
“A silver car drives along a coastal highway, aerial view, golden sunset, cinematic tone.”
结构拆解:
| 要素 | 内容 | 说明 |
|---|---|---|
| 场景 | coastal highway | 画面空间与环境基调 |
| 主体 | silver car | 视频的主要对象 |
| 动作 | drives along | 体现动态与方向 |
| 光线 | golden sunset | 决定视觉氛围 |
| 镜头 | aerial view | 定义观众视角 |
| 风格 | cinematic tone | 控制整体影调与色彩感 |

通过这样清晰的结构,你不仅能让 Sora 理解“你想要什么”,还可以让生成画面具有更稳定的风格与故事感。
三、六要素的逻辑与控制重点
让我们更具体地理解每个要素在 Prompt 中的作用。
1. 场景(Scene)
定义画面的空间环境与时间背景,是视频的“舞台”。
- 示例:
in a modern office,on a beach at sunrise,inside a cozy cafe - 建议:场景越明确,AI 越容易生成一致的空间感。
2. 主体(Subject)
决定画面的核心焦点。 主体可以是人物、物体、动物或抽象元素。
- 示例:
a young woman,a red sports car,a flying drone - 建议:尽量明确性别、年龄、特征,有助于画面细节更真实。
3. 动作(Action)
体现画面的动态与节奏,是构图的“生命力”。
- 示例:
walking through,opening,spinning,holding,running - 建议:动词尽量具体,不使用模糊词如 “doing something”。
4. 光线(Lighting)
控制画面的亮度与质感,塑造空间与氛围。
- 示例:
soft light,golden sunset,neon reflection,morning light - 建议:用时间与光线词结合能强化自然感,例如 “sunset light” 或 “foggy morning”。
5. 情绪(Mood)
传达画面给人的感受,是商业视频中非常关键的一环。
- 示例:
romantic,energetic,mysterious,calm,elegant - 建议:根据视频目标匹配情绪词,如品牌广告常用
inspiring、modern。
6. 镜头运动(Camera Movement)
决定视频的视觉节奏与观众视角。
- 示例:
close-up,tracking shot,wide shot,panning,aerial view - 建议:加入“镜头词”能显著提升视频的专业感与方向感。
四、视觉修辞词汇推荐
掌握一些常用的视觉修辞词汇,可以让你的 Prompt 更具表现力与专业性。 以下是常见词汇分类表,建议在写作时参考使用。
| 功能 | 示例词汇 |
|---|---|
| 光影 | soft light, golden hour, neon light, foggy atmosphere |
| 镜头 | close-up, tracking shot, wide shot, dolly zoom |
| 风格 | cinematic, dreamy, minimalistic, high contrast |
| 情绪 | energetic, elegant, mysterious, inspiring |
这些词汇能够帮助你在画面中创造不同的质感与叙事效果。 例如:
golden hour表示傍晚的柔金光线;high contrast强调黑白或明暗对比;dreamy用于柔光或浪漫氛围场景。

五、Prompt 写作思路与灵感转化
许多创作者在写 Prompt 时会遇到困难:脑中有画面,但不知道如何准确表达。 解决方法是把视觉印象转化为语言结构。
步骤:
- 先想画面,不想词汇:脑海中构思你要的镜头。
- 列出关键词:场景、人物、光线、情绪。
- 串联成句:使用“从大到小”的顺序组织文字。
示例:
灵感画面:
一个年轻女性在早晨的咖啡馆里打开笔记本电脑,阳光洒在桌面上,氛围安静。
Prompt:
A young woman opens a laptop in a cozy cafe, sunlight shines through the window, calm morning mood.
拆解结构:
| 要素 | 内容 |
|---|---|
| 场景 | cozy cafe |
| 主体 | young woman |
| 动作 | opens a laptop |
| 光线 | sunlight through the window |
| 情绪 | calm |
| 镜头 | morning mood(氛围与节奏感) |

六、练习任务
请你完成以下练习,熟悉 Prompt 的结构化写作方式。
- 拆解练习 将下面这条 Prompt 拆分为六个要素(场景、主体、动作、光线、情绪、镜头):
“A young woman opens a laptop in a cozy cafe, sunlight shines through the window, calm morning mood.”
-
创作练习 尝试编写你自己的 Prompt,描述一个你想要的视频场景。 要求包含至少四个要素(场景、主体、动作、光线、情绪)。
-
延伸思考 尝试用不同光线或情绪词改写同一场景,例如:
- 改写为傍晚版本
- 改写为都市风格版本
七、本课总结
通过本课学习,你已经掌握:
| 学习重点 | 收获 |
|---|---|
| 理解 Prompt 的核心语法结构 | 能写出完整、连贯的镜头描述 |
| 掌握六要素写作逻辑 | 能控制画面构图、光线、情绪与镜头感 |
| 熟悉常用视觉修辞词汇 | 提升 Prompt 的专业性与艺术感 |
| 能从灵感转化为语言 | 把脑海中的画面清晰表达出来 |
Prompt 是连接创意与视频生成的桥梁。 当你学会使用结构化思维去表达视觉语言,就能让 AI 精确理解你的创作意图。