advertisement
文章を入力すると、その内容に合わせた動画を生成するAI(人工知能)システム「Make-A-Video」を、Facebookなどを運営するMetaが発表しました。
生成の結果。上から「空を飛んでいる、スーパーヒーローの衣装と赤いマントを身につけた犬」「窓の側にテーブルがあり積まれた本に日の光が差している」「タイムズスクエアで踊るロボット」「ビーチを走るユニコーンの精細な絵」
このシステムはテキストと画像がセットになったデータと、テキストのない動画から学習。数個の単語や数行の文章で想像を実現し、鮮やかな色、キャラクター、風景の独特の動画を生成するとしています。画像から動画を生成したり、既存の動画から類似の新しい動画を生成することも可能。
Metaは特設サイトと研究論文を公開しており、入力したテキストと生成した動画の例を見られます。例えば「A dog wearing a Superhero outfit with red cape flying through the sky(空を飛んでいる、スーパーヒーローの衣装と赤いマントを身につけた犬)」というテキストからは、ヒーローのような姿で空に浮いている犬の動画が生成されています。
「A dog wearing a Superhero outfit with red cape flying through the sky(空を飛んでいる、スーパーヒーローの衣装と赤いマントを身につけた犬)」の生成結果
Make-A-Videoは現時点では一般公開されていませんが、マーク・ザッカーバーグCEOは「今後デモとして公開する」としています。Metaは今後リリースされたときに利用したい人向けに登録フォームを用意しています。
Metaは生成技術の研究の一環として、先に画像生成AIシステム「Make-A-Scene」を発表しており、Make-A-Videoはそれに続くもの。クリエイターやアーティストに新たな機会をもたらす可能性があると同社は述べています。
Copyright © ITmedia, Inc. All Rights Reserved.