AI 艺术生成手册/Stable Diffusion 风格的提示/GUI 界面
外观
假设你成功安装了 Stable Diffusion, 按照这里的说明 ,你可以看到以下界面
标签 | 功能/描述 |
---|---|
text2img | 在这个标签页中,输入的文本(从这里开始称为提示)将神奇地转化为或多或少符合描述的图像(结果通常看起来与你想象的不同/相似)。 |
img2img | 这个标签页通常用于使用简单的草图以及提示来指导图像的最终外观(ControlNet 的前身)。 |
Extras | 这个标签页用于放大图像。 |
PNG 信息 | 在这个标签页中,你可以根据元数据恢复使用的设置信息(提示、种子、CFG 比例等)。 注意1:如果图像来源是 Reddit/Facebook,元数据通常会被清除,无法检索到任何可用的信息。 注意2:这仅适用于使用 Automatic1111 或 SD.Next 生成的图像。 |
模型合并 | 如果你想合并多个模型而无需进行任何模型训练,可以使用此标签页。 |
训练 | 这是使用 TI(文本反转)方法进行训练的。 |
设置 | 这个标签页包含所有 SD 设置。 |
扩展 | 这个标签页用于管理扩展。有关更多详细信息,请参阅 这里 。 |
要开始在 Stable Diffusion 中进行 AI 艺术生成,只需在第一个文本字段中输入任何你想到的(是的,任何东西)。
请记住,Stable Diffusion 的令牌数量上限为75个。
所以,你可能会想知道什么是令牌?
令牌是代表文本中单个语义单元的字符序列。它是 NLP 中的一个基本概念,因为大多数 NLP 模型都在令牌级别上运行,这意味着它们一次处理一个令牌。
为了理解令牌,让我们考虑以下句子:“The quick brown fox jumped over the lazy dog”。在这个句子中,每个词都是一个令牌。每个令牌都有自己的含义,它们共同表达了整个句子的含义,其中每个词都是一个单独的令牌。
在 AI 语言模型的上下文中,令牌通常通过称为令牌化的过程创建,该过程涉及将文本分解为单个令牌或单词。此过程可能涉及删除标点符号、将文本转换为小写以及处理其他特殊情况,例如缩写。
文本令牌化后,令牌可以被 AI 语言模型进一步处理和分析。
对于人类面部的图像生成,强烈建议使用 Codeformer(而不是 GPFGAN)。
以下是一些我生成的样本模板。
更改括在< > 括号中的参数名称。
目标 | 样本提示 | 负面提示 |
---|---|---|
逼真的真实人脸 | 一个真实的照片, <种族> 穿着 <服装类型>, <描述活动> 在 <描述地点> | 卡通、动漫、绘画、素描、CGI |
产品拍摄,如电子商务网站所示 | 高质量的专业工作室产品拍摄 <产品> 产品,((白色背景隔离)),(等轴测视图) | 杂乱、偏心、裁剪、拼贴画、蒙太奇、网格、系列、人类 |
带有水下效果镜头的美人鱼 | 美丽的 <种族> 美人鱼尾巴的真实照片,部分水下拍摄,下半身在水中,下半部分画面为水下。上半部分画面为天空,蓝天 | 裸体、腿、大腿、小腿、分开尾巴、连体尾巴 |
外太空场景图像 | 电影、暗光、高分辨率、锐利焦点 |