[音声認識02] 字幕つきカメラを使って、PCで流す音声に字幕をつける

作成:2020年6月27日  最終更新:2020年7月4日

カメラ映像に字幕をつけられるページが「ビデオ会議で、自分の映像に字幕をつけて参加できる」と話題になりました。

speech to text webcam overlay
https://1heisuzuki.github.io/speech-to-text-webcam-overlay/

実はこのページを応用すると、PCで流れる音声を字幕化できます。特にWindowsの場合は、ハードもソフトも追加する必要がありません。

このページで使っている音声認識は、通常はマイクからの音声を扱います。しかし、Windowsでは、PCから出す音をマイクのように入力する「ステレオミキサー」という機能がついています。これを有効かつ「既定のデバイス」にすれば、PCから出す音声を認識させられます。

なお、この方法はビデオ会議や音声チャットでは使えません。くれぐれもご注意ください(理由は末尾に書きました)。

(1) 「サウンド」コントロールパネルを開く

「サウンド」コントロールパネルの、「録音」タブを開きます。

「サウンド」コントロールパネル。ステレオミキサーが表示されている。


実は、最近のWindows10では、これを開くのが面倒です。そこで、一発でこれを開けるバッチファイルを作りました。これをダウンロードしておけば、ダブルクリックするだけでいきなり「録音」タブが開けます。

いきなり「録音」を開くバッチファイル sound_input.bat


ちなみに、バッチファイルの中身は「control mmsys.cpl,,1」だけです。可能な人は、自分でバッチファイルを作ってもいいかも。

(2) ステレオミキサーを表示する

「サウンド」に、マイクはあってもステレオミキサーがない人もいるかもしれません。その場合、「サウンド」の中央部分で右クリックして、「無効なデバイスの表示」を選びます。

右クリックで「無効なデバイスの表示」が出ている状態


それでも出てこない場合は、サウンドカードのドライバを入れ直してPCを再起動すると出る……かもしれません。

(3) ステレオミキサーを有効にする

「サウンド」にステレオミキサーが出ていても、通常は無効になっています。PCからの音声を認識させたい時だけ、有効にしましょう。

「サウンド」の「ステレオ ミキサー」を右クリックして、「有効」を選びます。

これで「ステレオ ミキサー」が「既定のデバイス」になっていればOKです。なっていなければ、再び右クリックして、「既定のデバイスにする」を選びます。

サウンドミキサーを右クリックした状態。既に有効になっているので「既定のデバイスにする」という項目が表示されている


(4) Chromeで字幕つきカメラのページを開く

Chromeで、右上のメニューボタンから「新しいウインドウ」を選び、新しいウインドウに、下記の字幕つきカメラページのURLを貼り付け、アクセスします。

https://1heisuzuki.github.io/speech-to-text-webcam-overlay/

PCの音声を認識させる場合、1つのPCで2つのウインドウを同時に見ることになるので、字幕は下に出して、カメラは非表示にするといいでしょう。

(5) PCで字幕を出したい音声を再生する

PCで音声を再生すると、自動的に先ほどのウインドウで字幕が表示されるはずです。下のサンプルでは、Youtubeの動画を認識させてみましたが、他のアプリケーションでも大丈夫です。

Youtubeの動画を認識させている例。「やらされ関節を壊して引退した柔道少年足関節の靭帯を断裂したが顧問にレギュラーを外されるは怖くて我慢」と出ている


(参考:サンプルの音源)

「子供は大人のミニチュアではない〜スポーツ医学の現場から〜」SNS医療のカタチONLINE vol.8
https://www.youtube.com/watch?v=obnV86gPPWg

(6) ステレオミキサーを無効にする

字幕化が終わったら、「サウンド」コントロールパネルで、ステレオミキサーを右クリックして、無効にしておきましょう。

★注意点:ビデオ会議には使えません。

この方法、PCから出る音なら使えるものの、ビデオ会議や音声チャットには使えません。

この手のものは、あなたのPCの音声入力を他の参加者に送ります。だから、ステレオミキサーが有効になっていると、他の参加者の声が、あなたのPCから再び送信されてしまい、他の参加者が混乱かつ迷惑します。

ステレオミキサーを使うPCでビデオ会議に参加する場合、会議に参加する前に、「サウンド」コントロールパネルを見て確認するようにしましょう。


◀(前記事)[音声認識01] ビデオ会議で字幕つきカメラを使う
▶(次記事)[音声認識03] OBS Studioと仮想カメラプラグインで、字幕つきカメラを仮想カメラにする

(一覧)[2.技術情報 (tech)]