第2章:主体 (Subject) —— 你的焦点
模块二:主体 (Subject) —— 你的焦点
关键词定位: 谁(Who) + 什么(What) + 如何呈现(How it appears)
一、概述:主体是故事的灵魂
在AI视频生成中,主体(Subject) 是镜头的中心,是观众视线最先聚焦的元素。 如果“场景”是画布,那么“主体”就是画布上的主角与焦点。
主体决定画面的故事导向:
- 是人物? → 聚焦情感与行为。
- 是物体? → 聚焦形态与质感。
- 是动物或生物? → 聚焦动作与象征意义。
一个优秀的Prompt,必须让AI明确知道焦点是谁,以及它应当以什么视觉语气出现。
举例对比:
- 错误
a man walking on the street- 正确
a weary middle-aged detective in a wrinkled trench coat, walking alone down a rain-soaked alley under flickering neon lights第二个Prompt通过“年龄 + 职业 + 服装 + 情绪”层层构建,让AI理解了“他是谁、他经历了什么”,自然生成更具故事感的画面。
二、主体的四大要素
1. 角色(Character)——让主角“有面孔、有性格”
当主体是人物时,要像编剧一样塑造角色:身份、年龄、气质、外貌、特征。 AI 对“人物描述”的解析,直接影响画面的真实性与细节层次。
| 分类 | 英文关键词 | 描述 | 示例Prompt片段 |
|---|---|---|---|
| 身份 (Identity) | a detective, a ballerina, a samurai, a scientist | 决定人物的气质与服装风格。 | a cyberpunk detective |
| 年龄与特征 (Age & Traits) | an elderly man, a young woman, a child, a teenage boy | 影响面部特征与姿态。 | an old man with a scarred face |
| 性格外化 (Personality Projection) | grizzled, nervous, confident, melancholic, curious | 用形容词表达内在气质。 | a melancholic woman staring into the distance |
| 种族与物种 (Species) | a robot, an alien, a phoenix, a wolf, a humanoid android | 适合奇幻与科幻题材。 | a humanoid android with glowing blue eyes |
专业技巧:
- 用形容词塑造“视觉人格”: “a tired detective” 比 “a detective” 多了一个叙事维度。
- 尽量避免模糊词汇如 someone、a person。用职业或特征替代。
推荐写法模板:
[年龄/身份] + [显著外貌] + [心理特征] + [动作/姿态]例如:a young woman with messy red hair, wearing a worn leather jacket, looking cautiously over her shoulder
2. 服装与造型(Wardrobe & Style)——定义时代与风格的“视觉信号”
服装是AI识别“风格与时代背景”的最直观标识。 它不仅塑造人物外观,更是故事世界的象征性语言。
| 分类 | 英文关键词 | 视觉特征 | 常用场景 |
|---|---|---|---|
| 时代服装 | wearing a 1920s flapper dress, in Victorian attire, wearing medieval armor | 明确时代与社会阶层。 | 历史、复古题材。 |
| 风格造型 | in a cyberpunk jacket, wearing a futuristic exosuit, in a gothic gown | 突出世界观与文化基调。 | 科幻、奇幻、都市题材。 |
| 职业特征 | in a chef's uniform, wearing a soldier’s tactical gear, in a scientist’s lab coat | 增加角色识别度。 | 剧情、纪录片风格。 |
| 状态描述 | battle-damaged, blood-stained, dust-covered, rain-soaked | 体现环境互动与故事瞬间。 | 战斗、冒险、灾难场面。 |
专业技巧:
- 服装描述与场景结合更有效:
a samurai in rain-soaked armor under stormy skies→ 画面更具戏剧张力。 - AI会将“造型”理解为风格关键词,可影响画面材质与色彩层次。
例如
in a cyberpunk jacket会自动生成金属质感与蓝红霓虹反光。
3. 物体(Object)——赋予物以人格的叙事焦点
当主体不是人物而是物体时,要像拍广告或道具特写一样对待。 AI根据物体描述的形状、质地、光线反射生成影像,因此细节词越丰富,越具真实感。
| 分类 | 英文关键词 | 描述 | 示例Prompt片段 |
|---|---|---|---|
| 机械类 | a vintage sports car, a rusty typewriter, a futuristic drone, an old film camera | 具有金属反光和年代感的物件。 | a vintage sports car parked under a streetlight at night |
| 自然或魔法类 | a glowing magical orb, a floating crystal, a burning candle, a single red rose | 光源和质感是重点。 | a glowing orb floating over an ancient altar |
| 日常类 | a cup of coffee steaming on a wooden table, an open book with handwritten notes | 常用于静物、情绪镜头。 | a cup of coffee steaming in the morning light |
高阶技巧:
- 为物体添加“情绪修饰词”,能赋予其象征性。
例如:
a lonely red balloon drifting across a gray sky→ 带有隐喻意味。 - 若物体为主角,可加入“构图指令”:
close-up of a rusty pocket watch ticking slowly under dim light。
4. 数量(Quantity)——画面构图的节奏控制
数量决定画面的空间密度与叙事节奏。 在Prompt中,数量词是AI决定“群体感或孤独感”的关键因素。
| 分类 | 英文关键词 | 视觉效果 | 使用建议 |
|---|---|---|---|
| 单一主体 | a lone wolf, a single dancer, a solitary astronaut | 强调孤独、聚焦力强。 | 用于情感或心理表达。 |
| 双人组合 | a pair of dancers, two soldiers, a couple walking hand in hand | 对称构图、互动叙事。 | 适合浪漫、对比主题。 |
| 群体场景 | a crowd of people, hundreds of birds flying, a group of monks | 传达规模感、社会感。 | 适合史诗或社会题材。 |
提示:
AI会根据数量自动调整景深与镜头构图: 单人 → 特写; 群体 → 全景或中景; 因此,数量描述本身就是隐性镜头指令。
三、让主体“活起来”:五步构建法
以下是一个从抽象到具象的专业Prompt编写路径:
| 步骤 | 要素 | 示例 |
|---|---|---|
| 1. 定义身份 | 谁是主角? | a young samurai |
| 2. 增加特征 | 外貌、表情、姿态 | with a scar across his face, looking determined |
| 3. 加入服装 | 风格与质感 | wearing battle-damaged armor |
| 4. 补充情绪 | 内在状态 | tired but resolute |
| 5. 与场景呼应 | 环境对角色的影响 | standing in the rain on a deserted street |
综合示例:
A young samurai with a scar across his face, wearing battle-damaged armor, standing in the rain on a deserted street, tired but resolute.
→ 生成结果通常具备人物张力、光线层次与叙事深度。
四、AI实践技巧与应用思路
技巧 1:用动词或姿态表达“状态中的人物”
a woman leaning against a wall, smoking under dim light相比静态描述(just “a woman”),动作使画面更具动态性和故事感。
技巧 2:加入职业/身份关键词提升语义控制
a firefighter covered in soot,a ballet dancer in mid-pirouetteAI会自动识别与对应职业相关的身体语言与环境逻辑。
技巧 3:为物体添加“材质 + 光效”
a polished chrome helmet reflecting city lights这种写法可让AI理解金属反光与光源分布,更接近真实摄影效果。
技巧 4:数量与镜头结合优化构图
a lone rider in the desert, wide shotPrompt会自动生成低饱和度、空旷构图的史诗感。
五、专业模板与实用句式参考
| 用途 | 模板 | 示例 |
|---|---|---|
| 人物型主角 | [年龄/身份] + [外貌特征] + [服装风格] + [动作/情绪] | A weary old detective in a wrinkled trench coat, lighting a cigarette under the flickering neon sign. |
| 物体型主角 | [材质] + [状态/光线] + [象征性形容] | A cracked glass hourglass glowing faintly in the dark. |
| 群体型主角 | [数量] + [动作/空间关系] + [环境背景] | A crowd of protesters holding signs in the rain. |
六、总结:主体的导演级控制逻辑
- 主体是“叙事焦点”——任何镜头的能量都围绕它展开。
- 从身份到外貌、从服装到情绪,逐层增加信息密度,让AI理解“这个人是谁”。
- 物体也能成为主角,关键在于赋予它“故事性”与“象征性”。
- 数量影响构图,单一主体营造孤独感,群体则强调规模与对比。
- 记住:AI理解的不是单词,而是“画面语句”。 每个描述词,都是一笔光影。