イーロン・マスクが参加する人工知能研究の非営利団体OpenAIは、入力したテキストを画像で描くAIシステム「DALL・E(ダリー)」を発表しました。人間でも難しそうなお題が的確にイラスト化されている……!

テキスト「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」を画像生成したもの(画像はOpenAIより)
発表によると「DALL・E」は、「テキストと画像ペアのデータセットをもとに、テキスト説明から画像を生成するために訓練されたGPT-3」とのこと。GPT-3は、精度の高い文章を作成できる言語AI。前バージョンのGPT-2が開発された段階から、開発陣はフェイクニュース生成などの悪用を心配して公開に慎重な姿勢をとっていました。
発表では「DALL・E」に入力したテキストと、そこから生成された画像を公開。「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」や「ヌードルの立方体」といった不気味なテキストをそれらしい画像に仕上げています。

「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」(画像はOpenAIより)

「ヌードルの立方体」(画像はOpenAIより)
発表ページでは、テキストを部分的に変更した画像も確認できます。例えば「五角形」の「緑色」をした「時計」では、「五角形」を「八角形」にしたり、「緑色」を「黄色」に、「時計」を「トイレ」に変更した結果を公開しています。

「五角形」の「緑色」をした「時計」(画像はOpenAIより)

「五角形」を「八角形」に(画像はOpenAIより)

「緑色」を「黄色」に(画像はOpenAIより)

「時計」を「トイレ」に(画像はOpenAIより)
さらにイラストでも細かく指定した場合の結果を公開しており、「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」の「赤ちゃんダイコン」を「ウサギ」に変更したり、「ヒゲを生やしてテレビを見る赤ちゃんチンゲンサイのイラスト」にしたりといった違いを見られます。

「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」(画像はOpenAIより)

「赤ちゃんダイコン」を「ウサギ」に(画像はOpenAIより)

「ヒゲを生やしてテレビを見る赤ちゃんチンゲンサイのイラスト」(画像はOpenAIより)
完成度の高さにTwitterからは「これは、、いらすとやさんの仕事が」「生きてる間に、もうこんなんできてしもうたん??」など、驚きつつもあまりの発展の速さに戸惑う声が寄せられています。ちなみに「DALL・E」の名前の由来は、画家「サルバドール・ダリ」とPixar作品「WALL-E」を掛け合わせた言葉だそうです。

「キリンとカメのキメラをプロ品質のイラストで」(画像はOpenAIより)

「恋するラーメンどんぶりをプロ品質の絵文字で」(画像はOpenAIより)

「輪」の「ヌードル」(画像はOpenAIより)

「立方体」の「レゴブロック」(画像はOpenAIより)

「立方体」の「ヤマアラシ」(画像はOpenAIより)
また、「DALL・E」と合わせて使い、たくさん作った画像にランク付けなどをするシステム「CLIP」も同時に発表されています。
コメントランキング
「東横イン、美味しすぎ」「朝食ならルートイン」 “食事がおいしい”と思う「ビジネスホテル」は?【アンケート実施中】(投票結果) | ライフスタイル ねとらぼ
水木一郎、影山ヒロノブ、LiSA…… あなたが好きな「アニソンシンガー」は?【アンケート実施中】 | アニメ ねとらぼ
「ルートインの大浴場 最高」「設備が充実のドーミーイン」 “お風呂が最高”だと思う「ビジネスホテル」は?【アンケート実施中】(投票結果) | ライフスタイル ねとらぼ
姫路城、松本城、会津若松城…… あなたが好きな「日本の城」は?【アンケート実施中】(投票結果) | ライフスタイル ねとらぼ
「普通に読めん」 千葉県の“難読市町村名”といえば? ランキング上位に「千葉県、難読駅が地味に多いと思う」「文違は絶対読めません」の声(コメント一覧) | 千葉県 ねとらぼリサーチ