注意:如果您有关于“高难度”提示的想法要让我测试,请 在这里开始讨论。
在这个对决格式中,我们坚持以下格式
(i) 每个实体/作者只有一个模型,并且得到社区的良好支持(SD3 不在等式中)
(ii) 每个模型有 4 次机会生成图像
(iii) 本地 WebUI 的参数保持不变(生成的图像数量除外)
(iv) 评分如下
图例 |
得分 |
备注 |
|
1 分 |
完全符合提示 |
|
0.5 分 |
部分符合提示(能够根据要求生成,但与提示描述/隐含含义不完全相同) |
|
0 分 |
不符合提示 |
提示 1
一位印度女演员身穿黄色纱丽,站在红色房间里,她面前有3 个盒子:左边的盒子装着黑色毛线球,中间的盒子装着小狗,右边的盒子装着水瓶
背景
(i) 测试 AI 模型的“概念渗透”,即:红色的墙壁是否会“渗透”到纱丽上或其他地方 / 盒子里的物品是否会散布到其他区域
(ii) 测试 AI 模型的“相对位置”,即:能够识别图像中左右和中间位置的区域
(iii) 测试 AI 模型的“构图生成”,即:能够以其特定的排列生成多个项目
AI 模型 |
统计得分 |
图像 1 |
图像 2 |
图像 3 |
图像 4 |
SDXL
|
Img 1: 3.5 Img 2: 3.5
Img 3: 4 Img 4: 3 总计:14 得分:50%
|
|
|
|
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
DALL-E 3
|
Img 1: 4 Img 2: 6
Img 3: 5.5 Img 4: 5 总计:20.5 得分:73%
|
|
|
|
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
Flux
|
Img 1: 5 Img 2: 7
Img 3: 7 Img 4: 7 总计:20.5 得分:92%
|
|
|
|
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
印度女演员
黄色纱丽
红色房间
3 个盒子
黑色毛线球
小狗
水瓶
|
提示 2
一位年迈的日本人裁缝正在他位于长崎的裁缝店里的缝纫台上工作,时间是早上。他正在使用一把剪刀剪带圆点的蓝色布料。从裁缝店往外看,是一条繁忙而狭窄的街道,有人们和一辆出租车。
背景
(i) 测试 AI 模型的“透视渲染”,即从室内往外看不同场景的准确透视。
(ii) 测试 AI 模型的“物体交互”,即人们如何使用剪刀并用它来剪布料
AI 模型 |
统计得分 |
图像 1 |
图像 2 |
图像 3 |
图像 4 |
SDXL
|
Img 1: 4 Img 2: 3
Img 3: 3 Img 4: 4 总计 得分:43%
|
|
|
|
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
DALL-E 3
|
Img 1: 6.5 Img 2: 7
Img 3: 5 Img 4: 6 总计 Score: 76%
|
|
|
|
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
Flux
|
Img 1: 6.5 Img 2: 7.5
Img 3: 7.5 Img 4: 6.5 总计 Score: 89%
|
|
|
|
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
年迈的日本人
裁缝店
缝纫台 使用 剪刀 蓝色带 圆点的布料 繁忙狭窄的街道
人们
出租车
|
Prompt 3
俯视角度拍摄的广告照片,重点关注6 片装泡罩包装的药片,泡罩包装口袋里的药片看起来像不同社交媒体平台的logo(例如 Snapchat、Instagram、YouTube、WhatsApp、Facebook、Twitter)。
背景
(i) 测试 AI 模型识别文本并渲染所有提到的品牌元素(例如:在本例中是知名社交媒体平台的logo)。
(ii) 测试 AI 模型的计数概念(例如:能够生成 6 个泡罩包装的口袋)。
(iii) 测试 AI 模型的“透明材质模拟概念”(例如:能够理解泡罩包装通常是透明的)。