Stable Diffusion 文生图教程:提示词技巧,从新手到绘图魔法师

AI教程 2025-03-13 51
堆友

堆友

  • AI绘画
  • 231
  • 5.10015.duiyou

在 AI 绘画领域,Stable Diffusion 是一款强大且受欢迎的工具。掌握其文生图的技巧和方法,能让你轻松创作出理想的作品。接下来,让我们深入学习如何使用 Stable Diffusion 进行文生图创作,以及提示词编写和参数设置的关键要点。

一、Stable Diffusion 文生图基础操作

(一)界面认识

Stable Diffusion 文生图界面主要包含模型设置栏、提示词输入栏、参数操作栏、设置栏、查看栏、插件栏和脚本栏等部分。即使你更换过主题相关的扩展插件,主要操作项依然相似。

(二)操作流程

选择模型:模型决定了最终画作的风格。比如,想要绘制二次元风格的作品,可以选择专门的二次元风格模型;若追求写实效果,则选择写实类模型。不同模型对提示词的敏感度和表现效果不同,选择合适的模型是出图的关键第一步。

填写提示词:提示词用于描述你期望生成的画面内容。这是控制绘图结果的核心环节,后续会详细讲解提示词的编写技巧。

设置参数:参数用于调整图像的预设属性,包括采样迭代步数、采样方法、面部修复、平铺图、宽高设置、高清修复、总批次数、单批数量、提示词相关性和随机种子等。这些参数会影响图像的生成质量、细节、风格等多个方面,下面将逐一介绍其作用和设置技巧。

点击生成:完成上述步骤后,点击 “生成” 按钮,等待片刻,就能得到 AI 绘制的图片啦。

QQ20250304-000225.jpg

二、提示词编写技巧

(一)提示词的概念

提示词是我们与 AI 模型沟通的桥梁。由于人工智能基于大模型数据库学习,简单的自然语言难以让其准确理解。提示词就是用于指导模型行为的信息,通过提供正面或负面反馈,约束模型生成符合我们需求的图像。在图像生成领域,提示词能调节绘图模型,输入想要的内容和效果,模型就能理解并绘制出相应图片。

(二)基本语法

书写规范:大部分模型基于英文训练,需在英文输入法下输入提示词。它不要求严格的语法结构,以词组形式分段输入,词组间用英文逗号分隔。提示词有正向关键词(描述想要的图像内容)和反向关键词(排除不想出现的内容),如为避免手部变形,可在反向关键词中输入手部相关描述。目前部分反向提示词已集成到 Embedding 模型,使用时输入模型触发词即可。此外,提示词有 75 字符数量限制,超出部分会被截成两段理解,但并非按单词计算,一个单词可能对应多个参数。而且,提示词并非越多越好,过多可能导致语意冲突,影响模型理解。

万能公式:一段好的提示词应内容丰富、描述清晰。可参考 “主体内容、环境背景、构图镜头、图像设定、参考风格” 的公式编写。比如绘制一个在森林中拍照的女孩,主体内容可以描述女孩的外貌、穿着;环境背景描述森林的景色;构图镜头选择中景突出人物与环境;图像设定添加 “高清”“细节丰富” 等词;参考风格可加上 “宫崎骏动漫风格” 等。不过,公式只是参考,可先填写主体内容看效果,再按需优化。

(三)高阶语法

强调关键词:通过括号和数值控制特定关键词权重。圆括号 () 使关键词权重变为 1.1 倍,花括号 {} 为 1.05 倍,方括号 [] 是 0.9 倍,括号可多层叠加。也可直接填写数值(0.1 - 100)控制权重,如 (关键词:1.2) 。但权重过高或过低会影响出图效果,建议控制在 0.5 - 1.5 。例如,想要突出画面中花朵的颜色,可给描述花朵颜色的关键词加上圆括号提高权重。

分步绘制:语法格式为 [desert : forest :N],N 表示在整个采样迭代过程中,前面的关键词(如 desert)绘制的占比。比如 N = 0.3 时,前面 30% 的迭代步数绘制 desert,剩下 70% 绘制 forest,可控制画面不同元素的融合比例。

停止绘制:语法是 [A ::N],用于控制单个关键词的绘制步数占比。N 大于 1 时表示具体采样迭代步数,小于 1 时表示占整个采样迭代步数的百分比。例如 [water ::0.4] ,表示在采样迭代总步数的前 40% 绘制 water,之后不再绘制。

打断提示词:在提示词之间加上【BREAK】,可减少提示词之间的相互影响,避免提示词污染。如描述女孩服装时,在颜色描述之间加入【BREAK】,可防止颜色相互干扰。

融合提示词:使用【AND】将前后提示词内容联系起来,模型会关联前后元素特征。比如 “yellow hair AND green hair”,模型会理解为草绿色,从而绘制出融合颜色的效果。

交替绘制:语法为 [A|B|⋅.⋅],模型会在多个提示词内容间交替切换绘制。常用于绘制猎奇、魔幻等克苏鲁风格作品,与融合提示词不同,它每次只理解单独关键词,只能融合视觉特征,无法深度融合颜色等信息。

矩阵排列:语法是 A|B|⋅.. ,需配合提示词矩阵 Prompt matrix 使用(脚本中开启)。开启后,模型会将提示词交叉组合,每个组合生成一张图像,可实现批量出图。

三、文生图参数设置解析

(一)采样迭代步数

数值范围一般控制在 20 - 30 之间。理论上,迭代步数越高图像越精细,但步数过小会使图像绘制不完整,出现变形等问题;步数过高则占用过多资源,且 30 步左右画面内容基本确定,后续增加步数只是优化微小细节。

(二)采样方法

不同采样算法预设了不同的图像降噪步骤和随机性等参数,会影响出图效果。可优先使用模型作者推荐的算法,如深渊橘作者推荐的 DPM++ SDE Karras;也可优先选择带加号的优化算法;或者尝试常用的 Euler A、DPM++2S a Karras、DPM++ 2M Karras 、DPM++ SDE Karras 等算法。

(三)面部修复

多用于真实摄影类或偏写实的 2.5D 风格人像绘制,用于修复面部扭曲问题。但如今很多模型已加强人脸训练,开启面部修复可能会干扰图像生成,部分模型作者会建议避免开启。

(四)平铺 / 分块

用于绘制重复的花纹或图案纹理,平时使用较少。

(五)宽高设置

图片尺寸影响容纳的信息和细节丰富度,尺寸越大细节越丰富,但对显卡要求也越高,还可能出现黑图、爆显存或多人多肢体拼接等问题。目前多数模型训练时使用 512512 或 768768 像素大小图片,超出一定范围可能出现问题。

(六)高清修复

开启高清修复后会进行一次额外绘图操作,用于放大图片。可选择放大算法、设置高分迭代步数和重绘幅度等参数,是解决图片尺寸和细节问题的常用功能。

(七)总批次数 & 单批数量

总批次数表示同一提示词和设置项下触发的生成操作次数,单批数量表示每个批次绘制的图片数量,总图片生成数量 = 总批次数 x 单批数量。单批数量默认 1 张,更多时候通过设置总批次数来提高出图效率,多批次生成时会默认生成一张拼合图。

(八)提示词相关性

CFG Scale 用于控制提示词与出图的相关性,数值越高,绘图时越关注提示词内容,发散性越低。通常使用默认值 7 即可,数值过低或过高可能导致出图效果不佳。

(九)随机种子

AI 绘图具有不确定性,每次绘图都有对应的随机 Seed 值。固定种子值可锁定绘图结果的随机性,比如保存满意图片的种子值,下次使用相同提示词和参数时,能最大程度重现原图内容。右侧骰子按钮可重置 seed 为随机状态,回收按钮可固定最后绘制图片的 seed 值。

掌握了以上 Stable Diffusion 文生图的操作方法、提示词编写技巧和参数设置要点,你就可以在 AI 绘画的世界里自由创作啦。多尝试不同的组合,发挥创意,不断提升自己的绘图水平,成为专业的 “绘图魔法师”!

文章由本站整理发布,转载请注明地址:https://www.12330.com.cn/view-3962bb2e

文章目录