ニュース

しゃべった内容、リアルタイムで字幕化して映像に合成 ビデオ会議が便利になるシステムに注目集まる

耳が聞こえにくい人とのコミュニケーションが向上しそうです。

advertisement

 ビデオ会議やネット発表会が増える中、話した内容をリアルタイムで字幕化してWebカメラ映像に合成するシステムを開発する人が現れて注目を集めています。

 開発したのは筑波大学大学院修士課程の鈴木一平(@1heisuzuki)さん。カメラとマイクをオンにしてGoogle ChromeからWebサイトにアクセスすると、話したことをリアルタイムで音声認識してWebカメラの映像に字幕として表示します。


話した内容がリアルタイムで字幕に

カメラ表示やグリーンバック表示のありなしなども設定可能(サイトは随時アップデートしているとのこと)

 ブラウザの画面をキャプチャーしたり共有したりしてビデオ会議ツールに表示すると、字幕付きで会議に参加することが可能。音声認識結果のログをダウンロードすることもできます。ソースコードはGitHubで公開されています。

advertisement

 鈴木さんが公開したデモ映像では、話している内容がかなりの速さと精度で字幕に変換されています。編集部でも試したところ、話したことがサクサクと文字に起こされて驚きました。

 鈴木さんはこのサイトの「元ネタ」として、落合陽一さんが投稿した動画を挙げています。落合さんは動画で、ビデオ会議で耳が聞こえにくい人とスムーズにコミュニケーションできるよう、Googleのアプリを使って音声を字幕化して映像に重ねる方法を紹介しています。

元ネタの動画

 同じく落合さんに触発された同志社大学研究員でピクシーダストテクノロジーズのリードエンジニア、長谷芳樹(@nagataniyoshiki)さんが開発した、PCとAndroid端末と無料ツールで音声を字幕化して映像に合成するシステムも注目を集めました。字幕のみならず映像と合成することで、聴覚障害者が字幕と唇の動きを併用して会話できると説明しています。こちらのデモ映像もかなりの精度で字幕がリアルタイムに生成されている様子が分かります。

長谷さんは鈴木さんのサイトに提案も行っています

こちらもさくさくとかなりの精度で字幕を表示

 他にも、iPhoneとMacで同様のシステムを開発する人も現れており、今後さらに多くの選択肢が生まれていきそうです。

協力:鈴木一平(@1heisuzuki)さん、長谷芳樹(@nagataniyoshiki)さん



Copyright © ITmedia, Inc. All Rights Reserved.

記事ランキング

  1. 「幻の個体」と言われ、1匹1万円で購入した観賞魚が半年後…… 笑っちゃうほどの変化に反響→現在どうなったか飼い主に聞いた
  2. 自宅の犬小屋に住み着いた野良猫が、1年後…… まさかまさかの“現在”に「うわあ!よかったねえ!」「お幸せに」と100万表示
  3. たった築8年で“ぶっ壊れた”マイホームのリアル おそろしい戸建て事情に「声出た」「我が家もそうでした」
  4. 「ふざけてる」「作品を知らないのになぜ?」と怒りの声 マクドナルドと「HUNTER×HUNTER」コラボの“PR施策”が物議【台湾】
  5. 大家に「好きにしていいよ」と言われて薄暗い部屋をDIY改装したら…… あまりの変貌に仰天「すっげえええ」 投稿者に話を聞いた
  6. 【今日の計算】「3+3÷3−3」を計算せよ
  7. 荒れ放題の“悪夢の庭”をたった1人で11時間掃除したら…… あっぱれすぎる働きぶりに「あなたはヒーロー」と称賛
  8. 「初めて見た」 ハードオフに1万9800円で売っていた“予想外の商品”が4万表示 「うっわ、懐かしい……」
  9. 生後0日→1歳10カ月の赤ちゃん成長ビフォーアフターが衝撃の700万再生 それから2年たった現在は…… さらに驚く姿に反響
  10. 一度も髪を切ったことがない女性が、髪をほどくと…… 美容師も驚がくのスーパーロングヘアに470万いいね「リアルラプンツェル!」【海外】