跳转至内容

AI 艺术生成手册/训练/数据集

来自维基教科书,开放的书籍,开放的世界

训练类型

[编辑 | 编辑源代码]

在开始训练之前,首先考虑您想要使用的概念。

根据有限的研究,Dreambooth 似乎能够执行四种类型的训练。

(i) 向模型引入全新的概念

根据现有的 Stable Diffusion 版本,虽然 SD 模型能够生成各种类型的图像,但是 SD 模型无法生成一些东西,例如眼球。


(ii) 向现有概念添加数据集,但创建单独的“标记”

这是“男性”/“女性”现有概念的更常见路线,但您想添加自己面部数据集,以创建一个更类似于您自己的外观到数据集图像中。

(iii) 微调现有概念

一个已经存在的概念,但由于 CLIP 的限制/有限的图像数据集,它可能无法正常生成。

例如,关于人马的新概念(基本上是半人半马)。

(iv) 强制现有概念学习不同的概念

例如,您可能强制现有的关键字“bank”与银行密切相关,就像将您的钱存入“bank”一样,但指的是河岸。这种做法强烈不鼓励,因为许多与该关键字相关的概念是相关的,并且可能会导致“模型崩溃”。

图像来源

[编辑 | 编辑源代码]

当您想要训练您找到的图像模型时,可以选择各种免费照片。

以下是您可以使用的免费库存照片网站列表。

维基共享资源 (https://commons.wikimedia.org/wiki/Main_Page)*

Unsplash (https://unsplash.com/)

Pexels (https://www.pexels.com/)

Pixabay (https://pixabay.com/)

Flickr 创意共享 ( https://www.flickr.com/creativecommons/ )

FreeImages ( https://www.freeimages.com/ )

公共领域图片 (https://www.publicdomainpictures.net/)

Game Art for Glitch ( https://www.glitchthegame.com/public-domain-game-art/)

Josh Game Asset ( https://gameassets.joshmoody.org/)

图像质量

[编辑 | 编辑源代码]

您可能从许多 Dreambooth 教程中听到很多关于数据集必须有质量的信息。AI 艺术生成模型生成的输出图像质量与用于训练模型的输入图像质量直接相关。如果用于训练模型的输入图像质量低下,包含噪声或伪像,或者构图不良,则生成的输出图像也会出现类似问题。


图像应具有以下属性。

(a) 多样但一致 -

这是一个创建用于训练对象/风格的多样数据集的示例,但确保主体(在本例中是犀牛)始终是训练主体的中心。

<注意,这仅供参考,您的特定用例可能与这里陈述的内容不同:>

构图

活动

照明


媒介类型

注意:尽可能,请不要包含具有以下特征的图像进行训练。

(i) 在同一图片中有多个主体(尽管是相同的主体)

(ii) 具有明显但共同的特征(如果您用 1 只角进行训练,确保所有图像数据集理想情况下都具有 1 只角)

(b) 噪声或压缩伪像等

(c) 模糊或分辨率不足

华夏公益教科书