俺、歌声になってみたから、歌わせてみない? 楽譜を入力すれば歌ってくれる「Sinsy」の中の人体験

自分の知らないところで、自分の声が、知らない曲を歌っている――そんな展開を期待してます。

» 2013年12月26日 17時52分 公開
[松尾公也,ねとらぼ]

 2009年のクリスマス、Sinsyという歌声合成技術がデビューした。サンプリングした音の素片を結合させるVOCALOIDやUTAUとは違う、HMM(隠れマルコフモデル)という統計的な手法を用いて人間の歌声をモデリングし、本物の人間のようにリアルな歌い方が可能となっている。

 Sinsyは名古屋工業大学が提供している無料のWebサービスで、電子フォーマットの楽譜をインプットすると歌声のオーディオデータを吐き出してくれる。この技術をベースにCeVIO Creative Studioという製品も今年発売された。

 そして2013年のクリスマス、筆者はそのSinsyの歌声の「中の人」になった。ブラウザから誰でも使えるバーチャルシンガーになったのだ。Sinsyではこのシンガーを「ボイス」と呼ぶ。「Sinsyボイス m003e_beta 松尾P」の誕生である。

画像 ボーカル一覧に筆者の声が!!! 言語は英語です

中の人になるためにすべきこと

 きっかけは学会への取材だ。昨年2月に開催された情報処理学会 音楽情報科学研究会・音声言語情報処理研究会の「歌声情報処理最前線!!」で、名古屋工業大学国際音声技術研究所の徳田恵一教授と大浦圭一郎特任助教による講演「自動学習により人間のように歌う音声合成システム ―Sinsy―」があった。このとき「英語音源あると便利でいいんですよね。あと、ローカルで処理できるとうれしい」と要望を出したら、「中の人をやってみませんか?」という逆提案されたのだ。

 この時点では英語を歌えるボイスはまだなかった。徳田教授は筆者が英語のカバー曲を歌っているのを知っていたのでもちかけてくれたようだ。UTAUを使って自分の英語音源を作ってみたいと考えていたけどなかなか正しいやり方にたどりつけずにいたので、これは試す価値があると思い快諾。収録の条件を聞いて、さっそく試すことにした。

 VOCALOIDやUTAUとは違い、意味のない文字列を一定の音程で歌う必要はない。Sinsyの音源収録では、ただ歌を歌えばいい。今回は英語音源なので、英語の歌だ。10数曲あればいいというので、特に練習なしで歌える14曲を選んだ。

  • And I Love Her
  • Yesterday
  • All My Loving
  • Get Back
  • The Fool On The Hill
  • Back In The U.S.S.R.
  • Here, There And Everywhere
  • Blackbird
  • Hey Jude
  • Penny Lane
  • Michelle
  • Let It Be
  • Lady Madonna
  • The Long And Winding Road

 すべてビートルズの曲で、ポール・マッカートニーがリードボーカルを取っているのを選んだ。歌いまわしとかがあまり変ってしまうとよくないだろうという、個人的な判断からだ。ポールの曲を歌うときにはできるだけ節回しを似せるように心がけているので、多少なりともポールっぽい歌声合成音源になれば、という目論見もあってのことだ。成功するしないは別にして。

 これらの曲を選ぶ上でもう1つ、ポイントがあった。それはMIDIのカラオケが存在すること。この14曲については、ヤマハが販売しているMIDI演奏データを、こちらと名古屋工業大学双方で購入して使った。これを参考に、ボーカルデータと対照させる楽譜データをSinsyチームで作っていくのだ。

 こちらでは、MIDIデータをQuickTime Proに読み込み、オーディオデータに変換してからiMacのGarageBandに取り込み、ボーカルを録音していった。収録場所は、なんの防音もされていない自宅リビング。2012年3月の、家族がいない時を見計らって、一気にほぼ1日で録音した。サンプリング周波数は44.1kHz。

 オケは売り物なので、そのデータをそのものを出すわけにはいかないが、参考に、同じ曲を自分で作成したオケで「歌ってみた」ものがいくつかあるので、ご参考に。こんな感じである。

 上記の録音でも分かるように、部屋の内外のノイズを拾ってしまっていること、本当は48kHzか96kHzでの収録が望ましいのを44.1kHzで録ったこと、さらにはMIDIデータのBPMが固定ではなかったため、ボーカルデータの後処理が大変で音質を下げてしまった。

 録音から公開まで時間がかかったことにはそういった問題があったと、後で徳田教授から説明を受けた。まだこれは「Sinsyボイス m003e_beta 松尾P」とあるようにベータ版なので、音質改善のチャンスが残されている。歌ってみたが捗ると話題の「だんぼっち」でどの程度いけるのかは試してみないとわからないが、録音環境も理想的なものに少しでも近づけて再度挑戦し、品質を上げたいと考えている。

 そういうわけで、このバージョンで、音質面で問題があるとすれば、それは当方の収録条件が原因。まだ良くしていきたいと思っているので、それまでは現行のベータ版でぜひ歌わせてほしい。

みんな俺の声を使ってください! ってことでSinsyの使い方を解説

 Sinsyを使うためには、MusicXMLというフォーマットの楽譜データを作成する必要がある。筆者は五線譜で入力するFinale NotePadというフリーウェアを使っている(Mac版、Windows版がある)。Cadencii、MuseScoreといったアプリも利用可能だ。

 譜面ができたらMusicXML形式で書き出し、そのファイルをSinsyにサイトで送信する。数秒待つと、.wav形式のオーディオデータで、m003e_betaが歌う英語のボーカルがダウンロードできるようになる。

 楽譜をスタジオ付きシンガーの松尾P君に渡すと、スタジオの中で歌って、「できたよ」と渡してくれる――そんなイメージだ。

 スタジオにいるシンガーは1人ではない。英語の歌ならば、m003e_beta(つまり、筆者の声です!)だけでなく、女声の「f002e 香鈴(シャンリン)」も使える。日本語は、同じ人が歌う「f002j 香鈴」、初号機の「f001j 謡子」。そして、UTAUでもおなじみの波音リツが「f004j 波音リツS」として加わった(デモは去年から出ていたが、使えるようになったのはこのクリスマスから)。Sinsyではこの4人、5種類の歌声を無料で使うことができる。

 「調教いらず」でリアルな歌声を手に入れることができるSinsyだが、譜面で表現できないような細かいニュアンスまで「調教」することは難しい。そこはMelodyneなどのピッチエディタ(DAWに付属、内蔵するものも多い)と併用するなどの方法もある。

 なお、ローカルでSinsyが使えたらいいですね、という話は今回実現した。ソースコードが公開されたからだ。Sinsyのバージョンは初期型で、0.9となる。早くも試した方のブログはこちら

 自分の知らないところで、自分が歌えない、知らない曲が自分の歌声で響いていくというのは、自分自身の理想型でもある。どんどん歌わせていってほしい。m003e_betaに歌わせたら、ニコニコ動画やYouTube、SoundCloudなどに投稿してもらえるとうれしい。

 エクシングへの取材でも書いたが、HMM方式の歌声合成には、歌唱者適応という技術がある。その技術がさらに進めば、数曲しか残っていない場合でもその歌声からボイスを構築し、たくさんの人がその歌声で曲を作ってくれる。自分たちがいなくなっても続いていくものがあるとうれしい。

MMDAgentはAndroid対応に

 Sinsyの兄弟分とも言える、同じく徳田チームによる製品「MMDAgent」(3Dキャラクターと対話できるソフト)もこのほどメジャーアップデートを果たした。今回はAndroid対応が目玉だ。徳田教授に聞いたところ、iOS版は人的リソースの問題から現時点で予定はないそうだ。

 移植や他形態での利用については、基本的に修正BSDライセンスで公開しているため「商用利用も含めてどのように利用してもOK。ただし、COPYRIGHT表示は必須」となる。例外はメイちゃんの3Dモデルで、こちらはクリエイティブ・コモンズのCC BY-NCで公開なので「商用利用を除き、どのように利用してもOK。ただし、COPYRIGHT表示は必須」となる。

 つまり、版権的に使えるMMDモデルがあれば、それを利用して独自の対話型3DエージェントをiPhone、iPad向けに作ることも可能となる。これはMMDAgent関連の開発コミュニティに期待したいところだ。

Copyright © ITmedia, Inc. All Rights Reserved.

昨日の総合アクセスTOP10
  1. /nl/articles/2501/28/news195.jpg 岡田紗佳、一連の騒動を生中継で謝罪 頭を深く下げ「申し訳ございませんでした」
  2. /nl/articles/2501/28/news155.jpg がん闘病の森永卓郎、容態急変後にモルヒネ投与で“結構厳しい状況” スタジオ出られず弱々しい声で「そう長く持たないかもしれない」「本格的に転移が始まったよう」
  3. /nl/articles/2501/29/news045.jpg 新潟のお葬式で香典返しにもらった“謎の白い物体” パッケージにも情報なし「これなんだかわかりますか?」
  4. /nl/articles/2501/26/news053.jpg 「立体的に円柱を描きなさい」→中1の“斜め上の解答”に反響「この発想は天才」「先生の優しさも感じます」 投稿者に話を聞いた
  5. /nl/articles/2501/29/news086.jpg 鮮魚店で売れ残ったタコを水槽に入れたら、数週間後まさかの展開が…… 胸を打つ光景に「目が腫れるくらい泣いてます」
  6. /nl/articles/2501/28/news034.jpg 大人なら5秒で解きたい!「9+0÷2−3」の答えは?【算数クイズ】
  7. /nl/articles/2501/29/news058.jpg 「うちの祖父(81)わけてほしいわこのセンス……」 衝撃的な私服コーデに驚きの声「本物のイケジイ」「目標にします!!」
  8. /nl/articles/2501/29/news023.jpg 買ったばかりの家の風呂場に”ありえない欠陥” 信じられない状況に「そんなことある?」「取り付けた業者……」
  9. /nl/articles/2501/27/news073.jpg 「昔はモテた」と自慢げな父→娘は“絶対ウソやん”と思っていたけど…… 当時の姿に「ハハハ冗談だろ?」【海外】
  10. /nl/articles/2501/29/news122.jpg 正方形のスカーフ1枚→切ってゴムを縫い付けるだけで…… 魅力的な完成品に「デザインがきれい」「簡単に作れました」【海外】
先週の総合アクセスTOP10
  1. 風呂に入ろうとしたら…… 子どもから“超高難易度ミッション”が課されていた父に笑いと同情 「父さんはどのようにしてこのお風呂に入るのか」
  2. DIYで室温が約10℃変わった「トイレの寒さ対策」が310万再生 コスパ最強のアイデアへ「天才!」「これすごくいい」
  3. 岡田紗佳、生配信での発言を謝罪 「とても不快」「暴言だと思う」「残念すぎ」と物議
  4. スーパーで買った半玉キャベツの芯を植え、5カ月育てたら…… 農家も驚く想像以上の結末が1300万再生「凄い」「感動した」
  5. 東京藝大卒業生が油性マジックでサンタを描いたら? 10分で完成したとんでもない力作に「脱帽です」「本当にすごい人」
  6. 定年退職の日、妻に感謝のライン → 返ってきた“言葉”が約200万表示 大反響から7カ月たった“現在の生活”を聞いた
  7. 【ヤフオク】“3万円”で購入した100枚の着物帯 →現役着付師が開封すると…… “まさかの中身”に驚き
  8. 「立体的に円柱を描きなさい」→中1の“斜め上の解答”に反響「この発想は天才」「先生の優しさも感じます」 投稿者に話を聞いた
  9. 「すんごい笑った」 “干支を覚えにくい原因”を視覚化したイラストが勢いありすぎで1700万表示の人気 「確かにリズム全然違う!」
  10. 母親から届いた「もち」の仕送り方法が秀逸 まさかの梱包アイデアに「この発想は無かった」と称賛 投稿者にその後を聞いた
先月の総合アクセスTOP10
  1. ザリガニが約3000匹いた池の水を、全部抜いてみたら…… 思わず腰が抜ける興味深い結果に「本当にすごい」「見ていて爽快」
  2. パパに抱っこされている娘→11年後…… 同じ場所&ポーズで撮影した“現在の姿”が「泣ける」「すてき」と反響
  3. 東京美容外科、“不適切投稿”した院長の「解任」を発表 「組織体制の強化に努めてまいる所存」
  4. ズカズカ家に入ってきたぼっちの子猫→妙になれなれしいので、風呂に入れてみると…… 思わず腰を抜かす事態に「たまらんw」「この子は賢い」
  5. 母親から届いた「もち」の仕送り方法が秀逸 まさかの梱包アイデアに「この発想は無かった」と称賛 投稿者にその後を聞いた
  6. イモトアヤコ、購入した“圧倒的人気車”が思わぬ勘違いを招く スーパーで「後ろから警備員さんが」
  7. 「何があった」 絵師が“大学4年間の成長過程”公開→たどり着いた“まさかの境地”に「ぶっ飛ばしてて草」
  8. フォークに“毛糸”を巻き付けていくと…… 冬にピッタリなアイテムが完成 「とってもかわいい!」と200万再生【海外】
  9. 「何言ったんだ」 大谷翔平が妻から受けた“まさかの仕打ち”に「世界中で真美子さんだけ」「可愛すぎて草」
  10. 鮮魚スーパーで特価品になっていたイセエビを連れ帰り、水槽に入れたら…… 想定外の結果と2日後の光景に「泣けます」「おもしろすぎ」