AI絵(t2i)仕組みを説明

いろんな作家さんにAI絵(t2i)仕組みを説明してみて、一番わかりやすかったと言われたポンチ絵を投下してみる。

大雑把に端折ってるんでそこはご容赦なんだけど、元の絵にノイズ少しずつ加えたものを教えていって、絵とノイズの関連性を教えるんです。それとテキストを紐づけることで入出力させている

なのでAIは厳密に言えばノイズから絵を生成しているに近い。実際にAIがノイズから画像を生成している過程がこんな感じ。
Stable Diffusionで画像1枚に関するパラメータが10憶で、それを20億個の画像とテキストのペアで学習しているそうだ。

で、そんなわけでAIの絵ってのが元がノイズなので、塗りの概念が人間と違う。人間が塗るときはカラーパレットから色を選ぶので基本的に塗りつぶしは単色になるけど、AI絵は1ドット隣の色が若干違うとかそういうことになるはず。すでにお気づきの人はやってますね。

AIイラスト特有の塗りについて調べてる
画像生成時にノイズが除去しきれず、同じような色でも微妙に異なるRGB値で表現された結果があの独特な塗り感を出してるんじゃないかなーと

ということでRGB空間を100クラスタに分類して可視化してみた

あとは何が描かれているのかを理解はしているけど、それが何なのか本質的には理解していないから、左右で対称になっているものがなっていなかったり、ありえないものを描いたりする。

実際にSkebがAI絵を判定するAIを導入しているけど、自動でAI絵を判定することは技術的に可能っぽい。

今現在AIをとりまく言論は先鋭化・過激化しているけど、とりあえずt2i(テキストtoイメージ)のAIがやっていることは上記の通りなんで、コラージュでも切り貼りでもないんですよ。

問題化してるのはi2iのほうなんだけど、ほとんど使う側の人間の悪意が原因なのでそれを大雑把に語ることはしないです。