什么玩意
我家有两个三花猫。
下面是大的,叫咩咩。左脸黑。聪明得不像个猫,偶尔黏人,有点心机。
上面是小的,叫啾啾。右脸黑。可爱活泼,看起来没什么脑子。
这篇文章提供了一个三花猫的拟人角色尽可能全面的设定图,方便稳定、准确地用此角色生成各种图片。
一些方法
通过提供设定图,可以让模型生成精确、一致的内容。
以 Nano Banana Pro 为例,可以按需选择设定图片,然后参考这些提示思路做图片生成:
提示词示例 1:房间打盹
[设定图]
这是我设计的一个角色,和用它画的一系列设定图,灵感来自我的三花猫。
帮我从头重新生成一张她在房间打盹的照片,笔触细腻,又不失赛璐珞风格。
提示词示例 2:表情包贴纸
[设定图1] [设定图2] [类似的表情图]
这是我设计的角色的一系列设定图,给我做个 line sticker 风格的正方形表情。文字是「不赖」。
角色参考图片1和图片2。
提示词示例 3:构图重绘
[透视草稿图] [设定图1] [设定图2]
将第一张构图草稿中的木偶人换成第二和第三张图(角色设定)中的角色,重新绘制一张。
角色以我的三花猫为灵感设计。
笔触和质感要清新、通透,笔触利落。赛璐珞风格。
图片生成的一点技巧,不一定对
让多模态 LLM 生成「你脑子里的那张画」不一定是件简单的事,需要一些技巧和经验。
一种思路是,把自己当画师,让 Nano Banana 这种模型协助自己工作。可以看看画师直播,了解工作流程,结合模型能力做简化,让模型一步步生成,过程中修整成自己想要的样子,比如:
- 用木偶形式定义姿态,「生成姿态图片」;
- 提供场景和透视,「生成简单的透视草稿」;
- 提供角色设定图,「生成线稿」;
- 决定笔触,画风,厚薄涂,细化程度,「生成成品」;
另一种思路是,收集一些参考图。在生成图片的时候:
- 提供角色设定图中必要的部分(可以手工裁剪 -- 如果你希望生成侧脸,就提供侧脸);
- 让模型分析和模仿参考图的画风,笔触、上色方式、风格。但不要生搬硬套,要让模型「全新生成图片」;
- 多抽几次卡,效果一般会不错。
一些注意点:
- 不要连续生成图片太多次(从 A -> B,从 B -> C, ....),LLM 的指令遵循一般会在过长之后出问题,导致角色变掉。每次都提供原始设定图可以控制生成结果始终是相同的角色。
- 了解一些绘画/摄影/电影术语,可以有效指导 LLM 生成想要的风格和构图。
一些例子
如果你要试试看,注意
- 仅全年龄向谢谢。
- 不要直接描「真人类画师的商业图」害我猫吃官司啦。