模块二：主体 (Subject) —— 你的焦点

关键词定位： 谁（Who） + 什么（What） + 如何呈现（How it appears）

一、概述：主体是故事的灵魂

在AI视频生成中，主体（Subject） 是镜头的中心，是观众视线最先聚焦的元素。如果“场景”是画布，那么“主体”就是画布上的主角与焦点。

主体决定画面的故事导向：

是人物？ → 聚焦情感与行为。
是物体？ → 聚焦形态与质感。
是动物或生物？ → 聚焦动作与象征意义。

一个优秀的Prompt，必须让AI明确知道焦点是谁，以及它应当以什么视觉语气出现。

举例对比：

错误 a man walking on the street

正确 a weary middle-aged detective in a wrinkled trench coat, walking alone down a rain-soaked alley under flickering neon lights 第二个Prompt通过“年龄 + 职业 + 服装 + 情绪”层层构建，让AI理解了“他是谁、他经历了什么”，自然生成更具故事感的画面。

二、主体的四大要素

1. 角色（Character）——让主角“有面孔、有性格”

当主体是人物时，要像编剧一样塑造角色：身份、年龄、气质、外貌、特征。 AI 对“人物描述”的解析，直接影响画面的真实性与细节层次。

分类	英文关键词	描述	示例Prompt片段
身份 (Identity)	`a detective`, `a ballerina`, `a samurai`, `a scientist`	决定人物的气质与服装风格。	`a cyberpunk detective`
年龄与特征 (Age & Traits)	`an elderly man`, `a young woman`, `a child`, `a teenage boy`	影响面部特征与姿态。	`an old man with a scarred face`
性格外化 (Personality Projection)	`grizzled`, `nervous`, `confident`, `melancholic`, `curious`	用形容词表达内在气质。	`a melancholic woman staring into the distance`
种族与物种 (Species)	`a robot`, `an alien`, `a phoenix`, `a wolf`, `a humanoid android`	适合奇幻与科幻题材。	`a humanoid android with glowing blue eyes`

专业技巧：

用形容词塑造“视觉人格”： “a tired detective” 比 “a detective” 多了一个叙事维度。
尽量避免模糊词汇如 someone、a person。用职业或特征替代。

推荐写法模板： [年龄/身份] + [显著外貌] + [心理特征] + [动作/姿态] 例如：a young woman with messy red hair, wearing a worn leather jacket, looking cautiously over her shoulder

2. 服装与造型（Wardrobe & Style）——定义时代与风格的“视觉信号”

服装是AI识别“风格与时代背景”的最直观标识。它不仅塑造人物外观，更是故事世界的象征性语言。

分类	英文关键词	视觉特征	常用场景
时代服装	`wearing a 1920s flapper dress`, `in Victorian attire`, `wearing medieval armor`	明确时代与社会阶层。	历史、复古题材。
风格造型	`in a cyberpunk jacket`, `wearing a futuristic exosuit`, `in a gothic gown`	突出世界观与文化基调。	科幻、奇幻、都市题材。
职业特征	`in a chef's uniform`, `wearing a soldier’s tactical gear`, `in a scientist’s lab coat`	增加角色识别度。	剧情、纪录片风格。
状态描述	`battle-damaged`, `blood-stained`, `dust-covered`, `rain-soaked`	体现环境互动与故事瞬间。	战斗、冒险、灾难场面。

专业技巧：

服装描述与场景结合更有效： a samurai in rain-soaked armor under stormy skies → 画面更具戏剧张力。
AI会将“造型”理解为风格关键词，可影响画面材质与色彩层次。例如 in a cyberpunk jacket 会自动生成金属质感与蓝红霓虹反光。

3. 物体（Object）——赋予物以人格的叙事焦点

当主体不是人物而是物体时，要像拍广告或道具特写一样对待。 AI根据物体描述的形状、质地、光线反射生成影像，因此细节词越丰富，越具真实感。

分类	英文关键词	描述	示例Prompt片段
机械类	`a vintage sports car`, `a rusty typewriter`, `a futuristic drone`, `an old film camera`	具有金属反光和年代感的物件。	`a vintage sports car parked under a streetlight at night`
自然或魔法类	`a glowing magical orb`, `a floating crystal`, `a burning candle`, `a single red rose`	光源和质感是重点。	`a glowing orb floating over an ancient altar`
日常类	`a cup of coffee steaming on a wooden table`, `an open book with handwritten notes`	常用于静物、情绪镜头。	`a cup of coffee steaming in the morning light`

高阶技巧：

为物体添加“情绪修饰词”，能赋予其象征性。例如：a lonely red balloon drifting across a gray sky → 带有隐喻意味。
若物体为主角，可加入“构图指令”： close-up of a rusty pocket watch ticking slowly under dim light。

4. 数量（Quantity）——画面构图的节奏控制

数量决定画面的空间密度与叙事节奏。在Prompt中，数量词是AI决定“群体感或孤独感”的关键因素。

分类	英文关键词	视觉效果	使用建议
单一主体	`a lone wolf`, `a single dancer`, `a solitary astronaut`	强调孤独、聚焦力强。	用于情感或心理表达。
双人组合	`a pair of dancers`, `two soldiers`, `a couple walking hand in hand`	对称构图、互动叙事。	适合浪漫、对比主题。
群体场景	`a crowd of people`, `hundreds of birds flying`, `a group of monks`	传达规模感、社会感。	适合史诗或社会题材。

提示：

AI会根据数量自动调整景深与镜头构图：单人 → 特写；群体 → 全景或中景；因此，数量描述本身就是隐性镜头指令。

三、让主体“活起来”：五步构建法

以下是一个从抽象到具象的专业Prompt编写路径：

步骤	要素	示例
1. 定义身份	谁是主角？	`a young samurai`
2. 增加特征	外貌、表情、姿态	`with a scar across his face, looking determined`
3. 加入服装	风格与质感	`wearing battle-damaged armor`
4. 补充情绪	内在状态	`tired but resolute`
5. 与场景呼应	环境对角色的影响	`standing in the rain on a deserted street`

综合示例：

A young samurai with a scar across his face, wearing battle-damaged armor, standing in the rain on a deserted street, tired but resolute.

→ 生成结果通常具备人物张力、光线层次与叙事深度。

四、AI实践技巧与应用思路

技巧 1：用动词或姿态表达“状态中的人物”

a woman leaning against a wall, smoking under dim light 相比静态描述（just “a woman”），动作使画面更具动态性和故事感。

技巧 2：加入职业/身份关键词提升语义控制

a firefighter covered in soot, a ballet dancer in mid-pirouette AI会自动识别与对应职业相关的身体语言与环境逻辑。

技巧 3：为物体添加“材质 + 光效”

a polished chrome helmet reflecting city lights 这种写法可让AI理解金属反光与光源分布，更接近真实摄影效果。

技巧 4：数量与镜头结合优化构图

a lone rider in the desert, wide shot Prompt会自动生成低饱和度、空旷构图的史诗感。

五、专业模板与实用句式参考

用途	模板	示例
人物型主角	`[年龄/身份] + [外貌特征] + [服装风格] + [动作/情绪]`	`A weary old detective in a wrinkled trench coat, lighting a cigarette under the flickering neon sign.`
物体型主角	`[材质] + [状态/光线] + [象征性形容]`	`A cracked glass hourglass glowing faintly in the dark.`
群体型主角	`[数量] + [动作/空间关系] + [环境背景]`	`A crowd of protesters holding signs in the rain.`

六、总结：主体的导演级控制逻辑

主体是“叙事焦点”——任何镜头的能量都围绕它展开。
从身份到外貌、从服装到情绪，逐层增加信息密度，让AI理解“这个人是谁”。
物体也能成为主角，关键在于赋予它“故事性”与“象征性”。
数量影响构图，单一主体营造孤独感，群体则强调规模与对比。
记住：AI理解的不是单词，而是“画面语句”。 每个描述词，都是一笔光影。

AI视频生成Prompt手册

第2章：主体 (Subject) —— 你的焦点