mekiku.com logo

[音声認識02] 字幕つきカメラを使って、PCで流す音声に字幕をつける

最終更新:2020年7月4日

カメラ映像に字幕をつけられるページが「ビデオ会議で、自分の映像に字幕をつけて参加できる」と話題になりました。

speech to text webcam overlay
https://1heisuzuki.github.io/speech-to-text-webcam-overlay/

実はこのページを応用すると、PCで流れる音声を字幕化できます。特にWindowsの場合は、ハードもソフトも追加する必要がありません。

このページで使っている音声認識は、通常はマイクからの音声を扱います。しかし、Windowsでは、PCから出す音をマイクのように入力する「ステレオミキサー」という機能がついています。これを有効かつ「既定のデバイス」にすれば、PCから出す音声を認識させられます。

なお、この方法はビデオ会議や音声チャットでは使えません。くれぐれもご注意ください(理由は末尾に書きました)。

(1) 「サウンド」コントロールパネルを開く

「サウンド」コントロールパネルの、「録音」タブを開きます。

画像 sound_control_panel.png


実は、最近のWindows10では、これを開くのが面倒です。そこで、一発でこれを開けるバッチファイルを作りました。これをダウンロードしておけば、ダブルクリックするだけでいきなり「録音」タブが開けます。

いきなり「録音」を開くバッチファイル sound_input.bat


ちなみに、バッチファイルの中身は「control mmsys.cpl,,1」だけです。可能な人は、自分でバッチファイルを作ってもいいかも。

(2) ステレオミキサーを表示する

「サウンド」に、マイクはあってもステレオミキサーがない人もいるかもしれません。その場合、「サウンド」の中央部分で右クリックして、「無効なデバイスの表示」を選びます。

画像 sound_disabled_devices.png


それでも出てこない場合は、サウンドカードのドライバを入れ直してPCを再起動すると出る……かもしれません。

(3) ステレオミキサーを有効にする

「サウンド」にステレオミキサーが出ていても、通常は無効になっています。PCからの音声を認識させたい時だけ、有効にしましょう。

「サウンド」の「ステレオ ミキサー」を右クリックして、「有効」を選びます。

これで「ステレオ ミキサー」が「既定のデバイス」になっていればOKです。なっていなければ、再び右クリックして、「既定のデバイスにする」を選びます。

画像 sound_mixer_as_default.png


(4) Chromeで字幕つきカメラのページを開く

Chromeで、右上のメニューボタンから「新しいウインドウ」を選び、新しいウインドウに、下記の字幕つきカメラページのURLを貼り付け、アクセスします。

https://1heisuzuki.github.io/speech-to-text-webcam-overlay/

PCの音声を認識させる場合、1つのPCで2つのウインドウを同時に見ることになるので、字幕は下に出して、カメラは非表示にするといいでしょう。

(5) PCで字幕を出したい音声を再生する

PCで音声を再生すると、自動的に先ほどのウインドウで字幕が表示されるはずです。下のサンプルでは、Youtubeの動画を認識させてみましたが、他のアプリケーションでも大丈夫です。

画像 subtitle_in_a_pc.png


(参考:サンプルの音源)

「子供は大人のミニチュアではない〜スポーツ医学の現場から〜」SNS医療のカタチONLINE vol.8
https://www.youtube.com/watch?v=obnV86gPPWg

(6) ステレオミキサーを無効にする

字幕化が終わったら、「サウンド」コントロールパネルで、ステレオミキサーを右クリックして、無効にしておきましょう。

★注意点:ビデオ会議には使えません。

この方法、PCから出る音なら使えるものの、ビデオ会議や音声チャットには使えません。

この手のものは、あなたのPCの音声入力を他の参加者に送ります。だから、ステレオミキサーが有効になっていると、他の参加者の声が、あなたのPCから再び送信されてしまい、他の参加者が混乱かつ迷惑します。

ステレオミキサーを使うPCでビデオ会議に参加する場合、会議に参加する前に、「サウンド」コントロールパネルを見て確認するようにしましょう。


◀(前記事)[音声認識01] ビデオ会議で字幕つきカメラを使う
▶(次記事)[音声認識03] OBS Studioと仮想カメラプラグインで、字幕つきカメラを仮想カメラにする

(一覧)[2.技術情報 (tech)]