イーロン・マスクが参加する人工知能研究の非営利団体OpenAIは、入力したテキストを画像で描くAIシステム「DALL・E(ダリー)」を発表しました。人間でも難しそうなお題が的確にイラスト化されている……!
発表によると「DALL・E」は、「テキストと画像ペアのデータセットをもとに、テキスト説明から画像を生成するために訓練されたGPT-3」とのこと。GPT-3は、精度の高い文章を作成できる言語AI。前バージョンのGPT-2が開発された段階から、開発陣はフェイクニュース生成などの悪用を心配して公開に慎重な姿勢をとっていました。
発表では「DALL・E」に入力したテキストと、そこから生成された画像を公開。「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」や「ヌードルの立方体」といった不気味なテキストをそれらしい画像に仕上げています。
発表ページでは、テキストを部分的に変更した画像も確認できます。例えば「五角形」の「緑色」をした「時計」では、「五角形」を「八角形」にしたり、「緑色」を「黄色」に、「時計」を「トイレ」に変更した結果を公開しています。
さらにイラストでも細かく指定した場合の結果を公開しており、「バレリーナ衣装で犬の散歩をする赤ちゃんダイコンのイラスト」の「赤ちゃんダイコン」を「ウサギ」に変更したり、「ヒゲを生やしてテレビを見る赤ちゃんチンゲンサイのイラスト」にしたりといった違いを見られます。
完成度の高さにTwitterからは「これは、、いらすとやさんの仕事が」「生きてる間に、もうこんなんできてしもうたん??」など、驚きつつもあまりの発展の速さに戸惑う声が寄せられています。ちなみに「DALL・E」の名前の由来は、画家「サルバドール・ダリ」とPixar作品「WALL-E」を掛け合わせた言葉だそうです。
また、「DALL・E」と合わせて使い、たくさん作った画像にランク付けなどをするシステム「CLIP」も同時に発表されています。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- モザイクのような状態から再現 Google、元画像を推測して高解像度化する技術を開発
どんな風に実用化できるのか、想像力がふくらみますな。 - 「お空にはキメラがいっぱーい」グーグル画像認識AIが描いた「夢」画像が完全にキマってる
画像認識に使われるニューラルネットワーク。 - なぜこの絵で分かるんだ! Googleが「急いで描いた落書きを人工知能に当てさせるゲーム」を公開
手書き文字認識技術を応用。適当に描いた絵でも、ちゃんと推測してくれます。 - Googleの作画AIにさらなる進展 ユーザーが描きかけた落書きに線を足して完成してくれる
横棒1本引いただけで、草木を描き足して庭の絵にしてくれました。 - 人工知能「Tay」の不適切発言、米Microsoftが謝罪 「システムの悪用について準備を重ねてきたが、重大な見落としがあった」
悪用あるユーザーとのやりとりの中で問題発言をしていました。 - ロボットに心は宿るのか 捨てられたロボットと“友達”になった少女の漫画に胸が熱くなる
「ロボットくん」と少女の友情が心に刺さる。 - 「ダメだハゲ」 マイクロソフト製の女子高生AI「りんな」がWindows公式アカウントにリプライでオラつく
消されるぞ。 - Twitterが実在しない選挙候補者に認証済みバッジ 休暇中の高校生が暇つぶしで作った偽アカウントだった
高校生は匿名取材で手の内を明かしました。