AI视频生成Prompt手册

9分钟阅读

第2章主体 (Subject) —— 你的焦点

模块二:主体 (Subject) —— 你的焦点

关键词定位: 谁(Who) + 什么(What) + 如何呈现(How it appears)


一、概述:主体是故事的灵魂

在AI视频生成中,主体(Subject) 是镜头的中心,是观众视线最先聚焦的元素。 如果“场景”是画布,那么“主体”就是画布上的主角与焦点

主体决定画面的故事导向:

  • 是人物? → 聚焦情感与行为。
  • 是物体? → 聚焦形态与质感。
  • 是动物或生物? → 聚焦动作与象征意义。

一个优秀的Prompt,必须让AI明确知道焦点是谁,以及它应当以什么视觉语气出现

举例对比:

  • 错误 a man walking on the street
  • 正确 a weary middle-aged detective in a wrinkled trench coat, walking alone down a rain-soaked alley under flickering neon lights 第二个Prompt通过“年龄 + 职业 + 服装 + 情绪”层层构建,让AI理解了“他是谁、他经历了什么”,自然生成更具故事感的画面。

二、主体的四大要素

1. 角色(Character)——让主角“有面孔、有性格”

当主体是人物时,要像编剧一样塑造角色:身份、年龄、气质、外貌、特征。 AI 对“人物描述”的解析,直接影响画面的真实性与细节层次。

分类英文关键词描述示例Prompt片段
身份 (Identity)a detective, a ballerina, a samurai, a scientist决定人物的气质与服装风格。a cyberpunk detective
年龄与特征 (Age & Traits)an elderly man, a young woman, a child, a teenage boy影响面部特征与姿态。an old man with a scarred face
性格外化 (Personality Projection)grizzled, nervous, confident, melancholic, curious用形容词表达内在气质。a melancholic woman staring into the distance
种族与物种 (Species)a robot, an alien, a phoenix, a wolf, a humanoid android适合奇幻与科幻题材。a humanoid android with glowing blue eyes

专业技巧:

  • 用形容词塑造“视觉人格”: “a tired detective” 比 “a detective” 多了一个叙事维度。
  • 尽量避免模糊词汇如 someonea person。用职业或特征替代。

推荐写法模板: [年龄/身份] + [显著外貌] + [心理特征] + [动作/姿态] 例如:a young woman with messy red hair, wearing a worn leather jacket, looking cautiously over her shoulder


2. 服装与造型(Wardrobe & Style)——定义时代与风格的“视觉信号”

服装是AI识别“风格与时代背景”的最直观标识。 它不仅塑造人物外观,更是故事世界的象征性语言

分类英文关键词视觉特征常用场景
时代服装wearing a 1920s flapper dress, in Victorian attire, wearing medieval armor明确时代与社会阶层。历史、复古题材。
风格造型in a cyberpunk jacket, wearing a futuristic exosuit, in a gothic gown突出世界观与文化基调。科幻、奇幻、都市题材。
职业特征in a chef's uniform, wearing a soldier’s tactical gear, in a scientist’s lab coat增加角色识别度。剧情、纪录片风格。
状态描述battle-damaged, blood-stained, dust-covered, rain-soaked体现环境互动与故事瞬间。战斗、冒险、灾难场面。

专业技巧:

  • 服装描述与场景结合更有效: a samurai in rain-soaked armor under stormy skies → 画面更具戏剧张力。
  • AI会将“造型”理解为风格关键词,可影响画面材质与色彩层次。 例如 in a cyberpunk jacket 会自动生成金属质感与蓝红霓虹反光。

3. 物体(Object)——赋予物以人格的叙事焦点

当主体不是人物而是物体时,要像拍广告或道具特写一样对待。 AI根据物体描述的形状、质地、光线反射生成影像,因此细节词越丰富,越具真实感。

分类英文关键词描述示例Prompt片段
机械类a vintage sports car, a rusty typewriter, a futuristic drone, an old film camera具有金属反光和年代感的物件。a vintage sports car parked under a streetlight at night
自然或魔法类a glowing magical orb, a floating crystal, a burning candle, a single red rose光源和质感是重点。a glowing orb floating over an ancient altar
日常类a cup of coffee steaming on a wooden table, an open book with handwritten notes常用于静物、情绪镜头。a cup of coffee steaming in the morning light

高阶技巧:

  • 为物体添加“情绪修饰词”,能赋予其象征性。 例如:a lonely red balloon drifting across a gray sky → 带有隐喻意味。
  • 若物体为主角,可加入“构图指令”: close-up of a rusty pocket watch ticking slowly under dim light

4. 数量(Quantity)——画面构图的节奏控制

数量决定画面的空间密度叙事节奏。 在Prompt中,数量词是AI决定“群体感或孤独感”的关键因素。

分类英文关键词视觉效果使用建议
单一主体a lone wolf, a single dancer, a solitary astronaut强调孤独、聚焦力强。用于情感或心理表达。
双人组合a pair of dancers, two soldiers, a couple walking hand in hand对称构图、互动叙事。适合浪漫、对比主题。
群体场景a crowd of people, hundreds of birds flying, a group of monks传达规模感、社会感。适合史诗或社会题材。

提示:

AI会根据数量自动调整景深与镜头构图: 单人 → 特写; 群体 → 全景或中景; 因此,数量描述本身就是隐性镜头指令。


三、让主体“活起来”:五步构建法

以下是一个从抽象到具象的专业Prompt编写路径:

步骤要素示例
1. 定义身份谁是主角?a young samurai
2. 增加特征外貌、表情、姿态with a scar across his face, looking determined
3. 加入服装风格与质感wearing battle-damaged armor
4. 补充情绪内在状态tired but resolute
5. 与场景呼应环境对角色的影响standing in the rain on a deserted street

综合示例:

A young samurai with a scar across his face, wearing battle-damaged armor, standing in the rain on a deserted street, tired but resolute.

→ 生成结果通常具备人物张力、光线层次与叙事深度。


四、AI实践技巧与应用思路

技巧 1:用动词或姿态表达“状态中的人物”

a woman leaning against a wall, smoking under dim light 相比静态描述(just “a woman”),动作使画面更具动态性和故事感。

技巧 2:加入职业/身份关键词提升语义控制

a firefighter covered in soot, a ballet dancer in mid-pirouette AI会自动识别与对应职业相关的身体语言与环境逻辑。

技巧 3:为物体添加“材质 + 光效”

a polished chrome helmet reflecting city lights 这种写法可让AI理解金属反光与光源分布,更接近真实摄影效果。

技巧 4:数量与镜头结合优化构图

a lone rider in the desert, wide shot Prompt会自动生成低饱和度、空旷构图的史诗感。


五、专业模板与实用句式参考

用途模板示例
人物型主角[年龄/身份] + [外貌特征] + [服装风格] + [动作/情绪]A weary old detective in a wrinkled trench coat, lighting a cigarette under the flickering neon sign.
物体型主角[材质] + [状态/光线] + [象征性形容]A cracked glass hourglass glowing faintly in the dark.
群体型主角[数量] + [动作/空间关系] + [环境背景]A crowd of protesters holding signs in the rain.

六、总结:主体的导演级控制逻辑

  1. 主体是“叙事焦点”——任何镜头的能量都围绕它展开。
  2. 从身份到外貌、从服装到情绪,逐层增加信息密度,让AI理解“这个人是谁”。
  3. 物体也能成为主角,关键在于赋予它“故事性”与“象征性”。
  4. 数量影响构图,单一主体营造孤独感,群体则强调规模与对比。
  5. 记住:AI理解的不是单词,而是“画面语句”。 每个描述词,都是一笔光影。
主体 (Subject) —— 你的焦点 - AI视频生成Prompt手册 - 教程 - Ciliy - Ciliy