全本成语词典每个成语配插图

由 James Qi, 2024年2月28日

前段时间一直在为词典批量生成图片，最早做的是台湾繁体版本的《成語典》，感觉效果不错，比去年更早时候用Stable Diffusion生成的效果好，比OpenAI的Dall-E 2生成的图片质量要高，比用Mid Journey来生成又方便了许多，综合还是GPT-4 + Dall-E3的理解能力、图片质量和使用方便性要好很多。

几千个成语配图生成后我也是每幅图片都检查过，一次性合格率很高，需要重新绘制的不到5%，当然，如果质量要求更高的话，可能10-20%的图片需要再次尝试绘制来供比较挑选。

但AI对一些特殊成语的理解力还是有限，对一些特殊的事物也很难画出来，最后必须人工来改提示词绘图的情况也存在，例如：

例如：

閉月羞花