用于练习图片生成的猫咪角色设定

我家有两个三花猫。

下面是大的，叫咩咩。左脸黑。聪明得不像个猫，偶尔黏人，有点心机。

上面是小的，叫啾啾。右脸黑。可爱活泼，看起来没什么脑子。

这篇文章提供了一个三花猫的拟人角色尽可能全面的设定图，方便稳定、准确地用此角色生成各种图片。

通过提供设定图，可以让模型生成精确、一致的内容。

以 Nano Banana Pro 为例，可以按需选择设定图片，然后参考这些提示思路做图片生成：

提示词示例 1：房间打盹
[设定图]
这是我设计的一个角色，和用它画的一系列设定图，灵感来自我的三花猫。
帮我从头重新生成一张她在房间打盹的照片，笔触细腻，又不失赛璐珞风格。

提示词示例 2：表情包贴纸
[设定图1] [设定图2] [类似的表情图]
这是我设计的角色的一系列设定图，给我做个 line sticker 风格的正方形表情。文字是「不赖」。
角色参考图片1和图片2。

提示词示例 3：构图重绘
[透视草稿图] [设定图1] [设定图2]
将第一张构图草稿中的木偶人换成第二和第三张图（角色设定）中的角色，重新绘制一张。
角色以我的三花猫为灵感设计。
笔触和质感要清新、通透，笔触利落。赛璐珞风格。

让多模态 LLM 生成「你脑子里的那张画」不一定是件简单的事，需要一些技巧和经验。

一种思路是，把自己当画师，让 Nano Banana 这种模型协助自己工作。可以看看画师直播，了解工作流程，结合模型能力做简化，让模型一步步生成，过程中修整成自己想要的样子，比如：

另一种思路是，收集一些参考图。在生成图片的时候：

一些注意点：

不要连续生成图片太多次（从 A -> B，从 B -> C, ....），LLM 的指令遵循一般会在过长之后出问题，导致角色变掉。每次都提供原始设定图可以控制生成结果始终是相同的角色。
了解一些绘画/摄影/电影术语，可以有效指导 LLM 生成想要的风格和构图。

chocho-miemie gallery, cats of cafe3310