前段時間一直在為詞典批量生成圖片,最早做的是台灣繁體版本的《成語典》,感覺效果不錯,比去年更早時候用Stable Diffusion生成的效果好,比OpenAI的Dall-E 2生成的圖片質量要高,比用Mid Journey來生成又方便了許多,綜合還是GPT-4 + Dall-E3的理解能力、圖片質量和使用方便性要好很多。
幾千個成語配圖生成後我也是每幅圖片都檢查過,一次性合格率很高,需要重新繪制的不到5%,當然,如果質量要求更高的話,可能10-20%的圖片需要再次嘗試繪制來供比較挑選。
但AI對一些特殊成語的理解力還是有限,對一些特殊的事物也很難畫出來,最後必須人工來改提示詞繪圖的情況也存在,例如:
例如:
上面這個成語讓AI自動配圖的時候,開始隻畫出“月”和“花”,沒有畫出真正的主角,直到人工修改提示詞才畫出一個“美人”。
又例如:
這裡的為蛇畫腳的過程至少讓ChatGPT重繪了10多次,都是各種異常的蛇身、蛇足,因為現實生活中不存在這種組合,所以繪圖AI也沒有學習的對象。
這本成語典一共有5153個常用成語,配圖的整個工作量還是相當大的,如果沒有AI的加持就太難了。這也是我們目前看到配圖最多的一套成語詞典,希望得到用戶的喜愛。
评论