logo
03

图像生成与构图技巧

⏱️ 25分钟

图像生成与构图技巧

图像生成不仅是点击“生成”按钮,更是一个将抽象创意转化为精准视觉语言的过程。掌握 AI 图像生成,意味着你需要学会如何控制构图、风格、光影与叙事细节。


什么是 AI 图像生成?

AI 图像生成主要基于扩散模型 (Diffusion Models) 技术。简单来说,AI 学习了海量图片与文字的对应关系,通过从“噪声”中逐渐还原出符合描述的像素,最终合成图片。

┌─────────────────────────────────────────────────────────────┐ │ 图像生成的基本逻辑 │ ├─────────────────────────────────────────────────────────────┤ │ │ │ 文本指令 (Prompt) → 特征提取 → 噪声消除 → 最终图像 │ │ [你的描述] [理解语义] [像素重组] [视觉呈现] │ │ │ └─────────────────────────────────────────────────────────────┘


为什么图像生成对你很重要?

应用场景具体用途业务价值
电商营销生成产品模特图、场景图降低 80% 拍摄成本,快速出图
内容运营社媒配图、文章插图、封面告别版权风险,风格高度统一
UI/UX 设计图标生成、背景纹理、原型素材加速创意碰撞,快速产出占位图
个人品牌个人头像、数字艺术创作零绘画基础实现专业级视觉表达

核心 Prompt 框架:万能公式

想要生成的图片“听话”,你需要一个结构化的 Prompt。建议参考以下公式:

[主体] + [动作/状态] + [环境/背景] + [风格/媒介] + [构图/镜头] + [光影/色调] + [高质量修饰词]

维度拆解:

  • 主体 (Subject): 画面中心是谁?(例如:一个戴墨镜的宇航员)
  • 风格 (Style): 摄影、油画、3D 渲染、吉卜力动漫、赛博朋克?
  • 构图 (Composition): 特写 (Close-up)、俯拍 (Top view)、黄金分割 (Rule of thirds)?
  • 光影 (Lighting): 电影感光效 (Cinematic lighting)、丁达尔效应 (Tyndall effect)、夕阳漫反射?

常用 AI 图像工具对比

工具优势适用人群
Midjourney艺术感极强,构图审美一流设计师、数字艺术家
DALL-E 3指令理解最强,支持中文输入初学者、快速配图需求
Stable Diffusion插件丰富 (ControlNet),完全可控技术发烧友、商业工作流定制
Flux真实感极高,文字渲染效果好写实摄影、平面设计

Quick Start:第一个高质 Prompt

尝试在 Midjourney 或 DALL-E 3 中输入:

A futuristic coffee shop on Mars, red dust outside the window,
earth visible in the sky, cinematic lighting, ultra-realistic, 8k, --ar 16:9

场景示例 1-5

示例 1:电商产品图(极简风)

  • Prompt: A high-end glass perfume bottle on a smooth white marble surface, soft morning sunlight through a window, minimalist aesthetic, 8k resolution, product photography style.
  • 关键点: 强调材质(玻璃、大理石)和光影(早晨阳光)。

示例 2:人物人像(电影感)

  • Prompt: Close-up portrait of an elderly fisherman with a weathered face, intense blue eyes, rainy harbor background, cinematic lighting, moody atmosphere, shot on 35mm film.
  • 关键点: 使用镜头语言(35mm film)和细节描述(weathered face)。

示例 3:二次元动漫(吉卜力风格)

  • Prompt: A peaceful summer meadow with a small cottage, white fluffy clouds, vibrant colors, Studio Ghibli art style, hand-drawn texture, peaceful mood.
  • 关键点: 直接调用特定艺术家或工作室风格。

示例 4:室内设计(北欧风)

  • Prompt: Modern Scandinavian living room, large windows, cozy fireplace, neutral color palette, architectural photography, symmetrical composition, daylight.
  • 关键点: 强调构图方式(Symmetrical composition)。

示例 5:科幻视觉(赛博朋克)

  • Prompt: Neon-drenched streets of a futuristic Tokyo, heavy rain, reflections on the wet ground, cyberpunk aesthetic, pink and teal color palette, wide-angle shot.
  • 关键点: 确定特定的色调(Pink and teal)。

进阶技巧:如何精准微调?

  1. 负向提示 (Negative Prompt): 明确告诉 AI “不要”什么(如:--no blur, low quality, extra limbs)。
  2. 比例控制 (Aspect Ratio): 在 Midjourney 中使用 --ar 16:9--ar 9:16
  3. 权重调整 (Weight): 使用 :: 强调某些词的重要性(如:mountain::2 clouds::1)。
  4. 垫图 (Image Prompt): 上传参考图,让 AI 学习参考图的构图或色彩。
  5. 风格参考 (SREF): Midjourney 的 --sref 功能可以复刻特定图片的风格。

常见问题与解决方案

问题原因解决方案
主体模糊不清Prompt 描述太泛增加具体的细节词和纹理词
手部结构扭曲AI 对解剖学理解有限使用 Negative Prompt 或改图工具修复
风格不统一每次生成的风格词变动固定一套“风格关键词”作为模板
背景太乱缺乏空间引导词加入 "simple background" 或 "bokeh" (背景虚化)

动手练习

  1. 模仿练习: 找一张你喜欢的电影海报,试着用公式拆解它的 Prompt 并重新生成。
  2. 变量替换: 将“示例 1”中的香水瓶替换成“运动鞋”或“智能手表”,观察光影如何影响产品质感。
  3. 风格混搭: 尝试用“赛博朋克”风格生成一张“古代中国园林”的图片。

相关阅读


小结

  1. 构图是灵魂: 决定了观众看哪里的视觉引导。
  2. 公式是基础: 主体 + 环境 + 风格 + 镜头,缺一不可。
  3. 工具选对路: Midjourney 选审美,DALL-E 选逻辑,SD 选控制。
  4. 迭代是常态: 极少有一次生成的完美图,学会微调 Prompt 才是核心竞争力。
  5. 细节决定质感: 材质、光影、镜头参数是区分小白与高手的关键。