なぜ短期間で大ヒット作「脳トレ」ができたのか――任天堂 島田健嗣氏講演リポート:GDC 2007(1/2 ページ)
「脳トレ」シリーズは、日本で爆発的なヒットを記録し、ニンテンドーDSの一大ブームを巻き起こす要因となった。その脳トレシリーズは、少人数開発チームが短期間で製作したことは有名だ。なぜ短期間で製作できたのか、その秘密が語られた。
将来を見据え、あらかじめ研究を進めていた
「東北大学未来科学技術共同研究センター川島隆太教授監修 脳を鍛える大人のDSトレーニング」(以下、「脳トレ」)は、10名に満たない小規模な開発チームが、3カ月ほどという非常に短期間で作り上げたタイトルであるということは有名だ。にも関わらず、続編となる「東北大学未来科学技術共同研究センター川島隆太教授監修 もっと脳を鍛える大人のDSトレーニング」(以下、「脳トレ2」)と合わせ日本だけで300万本を超すセールスを記録する大ヒット作となっている。なぜ、これほどまでの大ヒット作を、少人数の製作チームが短期間に作り上げることができたのか。任天堂で開発ツールの制作を担当し、脳トレシリーズの制作にも関わった島田健嗣氏が、効率的なゲーム開発を行うために不可欠な要素について語った。
島田氏は、脳トレシリーズの開発に関わってはいるものの、脳トレ開発チームの一員ではない。任天堂内に組織されている、SDKやミドルウェアなど任天堂ハード向けの開発ツールを製作するグループの一員で、要素ミドルウェアを開発するチームのリーダーである。その島田氏が脳トレシリーズの開発に携わるきっかけとなったのは、島田氏が率いる開発チームが、ニンテンドーDS(以下、DS)向けの音声認識ライブラリと手書き文字認識ライブラリの開発を行っていたからだ。
あるタイトルの製作が決定し、その段階から必要となるミドルウェアなどの要素技術の開発を行うとすると、要素技術の開発だけでもかなりの時間が必要となってしまう。特に、当初から3カ月程度しか開発期間が確保されていなかった脳トレでは、音声認識や手書き文字認識などの技術を確立するだけで開発期間のほとんどが費やされてしまうはず。しかし、島田氏のグループでは、DSにマイクやタッチパネルが搭載されているという点に注目し、利用されることが確定していない音声認識や手書き文字認識の検討に、かなり早い段階から着手していたため、脳トレが非常に短期間に製作できたのである。
脳トレが発売されたのは、2005年5月19日。そして、脳トレの開発がスタートしたのは2004年11月頃のこと。2004年といえば、日米でDSが発売された年だ。そのため、島田氏のグループも、2004年はDSのローンチタイトルを無事に開発できる環境を提供しサポートしていくことが最重要課題となっていた。しかし、ローンチタイトルをみると、音声認識や手書き文字認識を行うタイトルはまったくない。にもかかわらず島田氏は、早い段階から将来DSで音声認識や手書き文字認識が必要になると考え、調査を開始していた。
新ハード立ち上げの非常に大事な時期から、その時点で必要とされていない要素技術に開発スタッフのリソースを割くのはリスクが大きい。しかし、DSが持つハードの機能を見ると、将来要望が出てくるであろう機能は想像に難くない。また、音声認識や手書き文字認識の技術は、長期間の研究の上に成り立っているようなもので、一朝一夕で実現できるものではない。そこで、音声認識や手書き文字認識の技術を持つ外部の開発会社と情報交換を行いつつ、機能面の比較検討を早い段階から行っていたそうだ。
そんなある時、任天堂の社長である岩田聡氏のもとに数名のソフト開発スタッフが集まり、「新しいユーザーを獲得するためにはどういったタイトルが必要なのか」、というテーマの議論が行われていた。“ゲーム離れ”が深刻化していた日本で健全なゲーム市場を復活させるには、これまでゲームをプレイしたことのない人や、以前はゲームをプレイしていたが最近プレイしなくなっている人の心をつかむことが必要。そう結論づけ、その結論に対応できるタイトルとしてどういったものが相応しいかを議論していたわけだ。
その中で、当時ベストセラーとなっていた「川島隆太教授の脳を鍛える大人の計算ドリル」という本が話題となり、この素材を利用し、音声認識や手書き文字認識を組み合わせれば、新たなユーザー層を獲得できるタイトルになると考え、開発がスタートした。そして、脳トレのプロデューサが島田氏に、「DSで使える音声認識と手書き文字認識のエンジンがあると聞いたけど、試せますか?」と尋ねてきたことがきっかけとなり、島田氏率いるチームも脳トレの開発に関わることとなった。この時点で事前の準備がなければ、脳トレの開発にはかなりの時間を要していたはず。しかし、DS発売前、それも音声認識や手書き文字認識が必要とされていない段階から調査を行っていたからこそ、その後の開発もスムーズに進んでいったというわけだ。
エンジンの弱点をソフトで補う工夫を盛り込む
脳トレの開発がスタートした段階では、音声認識や手書き文字認識のエンジンはまだ完成していなかった。双方ともに「乗り越えなければならない壁があった」、と島田氏は語った。
まず音声認識エンジン。当時存在した音声認識エンジンは、大人の声をベースにチューニングされていた。脳トレは子供をターゲットとしていたわけではないが、DSで利用される音声認識エンジンでは当然子供の声もカバーされている必要がある。それには、静かな環境と騒音のある環境において、130単語以上の子供の声を20人分集める必要がある。そこで、社員の協力の下にベースとなるサンプルを収集し用意したそうだ。
また、音声入力の終了判定も課題のひとつだったそうだ。音声認識を行う場合、音声入力が終了したことは一定時間の無音状態を検出することによって判定している。この無音状態の判定時間を長く取れば安定した音声認識ができるようになるが、それでは機敏な反応は難しくなる。特に脳トレでは、画面に表示される文字の色を読み上げるテストがあり、ある程度機敏な判定が不可欠だ。かといって、判定時間を短くすれば、1つの単語なのに複数の単語として判定されてしまう場合が出てくる。この、無音状態の判定時間の調整には、かなり苦労したとのこと。
このあたりを調整してテストを行ってみたところ、今度は想定していなかった問題が発覚したそうだ。脳トレは、ユーザー層を拡大するための戦略的なタイトルだったこともあり、モニターテストも年齢層を拡げて行われたのだが、その時に50〜70歳台の人で「きいろ」という言葉に誤認識が頻発した。人間は歳をとると滑舌が悪くなる。本人は「きいろ」と発音しているつもりだが、音声認識エンジンが「ちいろ」や「いいろ」と認識しているために、誤認識が頻発していたのだ。そこで、誤認識の多かったものを副辞書として登録し、そちらも正解にしてしまう、という方法を採ることで認識率を改善したそうだ。
また、音声認識エンジンは長い単語は認識率が高く、短い単語は認識率が低くなる傾向にあるそうだが、脳トレでは短い単語しか利用されておらず、その部分でも誤認識が発生することがあった。そこで、音声認識時には複数の認識結果を返すようにし、マッチングレベル上位2位までに正解が含まれていれば正解とするようにソフト側で対応することによって認識率を上げている。他にも、テスト時に、声を出せる環境にあるかどうかをプレーヤーに問い、その上で音声認識が必要となるテストを行うかどうか決定する、という工夫も盛り込むことによって、音声認識エンジンの弱点をカバーする用にしているわけだ。
Copyright © ITmedia, Inc. All Rights Reserved.