https://news.mixi.jp/view_news.pl?id=6370509&media_id=128
シェアしました。
2021年01月08日 15:50 ねとらぼ
限定公開( 13 )
写真 テキスト「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」を画像生成したもの |
イーロン・マスクが参加する人工知能研究の非営利団体OpenAIは、入力したテキストを画像で描くAIシステム「DALL・E(ダリー)」を発表しました。人間でも難しそうなお題が的確にイラスト化されている……!
発表によると「DALL・E」は、「テキストと画像ペアのデータセットをもとに、テキスト説明から画像を生成するために訓練されたGPT-3」とのこと。GPT-3は、精度の高い文章を作成できる言語AI。前バージョンのGPT-2が開発された段階から、開発陣はフェイクニュース生成などの悪用を心配して公開に慎重な姿勢をとっていました。
発表では「DALL・E」に入力したテキストと、そこから生成された画像を公開。「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」や「ヌードルの立方体」といった不気味なテキストをそれらしい画像に仕上げています。
発表ページでは、テキストを部分的に変更した画像も確認できます。例えば「五角形」の「緑色」をした「時計」では、「五角形」を「八角形」にしたり、「緑色」を「黄色」に、「時計」を「トイレ」に変更した結果を公開しています。
さらにイラストでも細かく指定した場合の結果を公開しており、「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」の「赤ちゃんダイコン」を「ウサギ」に変更したり、「ヒゲを生やしてテレビを見る赤ちゃんチンゲンサイのイラスト」にしたりといった違いを見られます。
完成度の高さにTwitterからは「これは、、いらすとやさんの仕事が」「生きてる間に、もうこんなんできてしもうたん??」など、驚きつつもあまりの発展の速さに戸惑う声が寄せられています。ちなみに「DALL・E」の名前の由来は、画家「サルバドール・ダリ」とPixar作品「WALL-E」を掛け合わせた言葉だそうです。
また、「DALL・E」と合わせて使い、たくさん作った画像にランク付けなどをするシステム「CLIP」も同時に発表されています。
0 件のコメント:
コメントを投稿