生放送や収録をスタジオと遠隔地で行う際の音質に関する考察 その1

●前置き
4歳の頃からパソコンに触らない日はないような生活をし、小学4年生の夏休みの工作は自作パソコン。
当時ダイアルアップ環境の中、メモ帳でHTMLを書きWebサイトを作ったのが5年生。
そんな生い立ちで今はシステムエンジニアとして生活している私。
実は両親が経営する制作会社で、同じく小学生くらいの頃から放送機材に触れ、アニメのレコードのピッチを変えてオープンテープに落とすみたいな作業が出来る環境に居たため音響機材が大好き。
結果的に今、音響・放送の現場でもお仕事をしていたりします。
キャリアとしては音響業、レコーディング業の方が長くて、一般社団法人 日本音響家協会の認定技術資格や、同じく仕事で使うから公益社団法人 日本照明家協会の認定技術資格も持っているのだけど。

この春から新たに放送のお仕事任せて頂いたので、今回はそれに纏わるお話。
あ、ラジオ放送でのお話です。
テレビ業界も大変みたいだけど今回はラジオのお話。


放送局のスタジオっていうのは、外からの音が入るのを防止したり、中の音が漏れるのを防止したりする必要がある為、基本的に密閉閉鎖された空間です。
でもこのコロナウイルス事態で、そうも言っていられず、地方局・中央局問わずに喋る人はスタジオに1人、他の相手は自宅から遠隔出演なんて状況が特に珍しくもなく行われていたりします。

場合によっては製作陣・技術陣だけ放送局に居て、喋る人(出演者)は自宅から、なんて状況もあるみたい。
とにかくまず今はそんな状況がある、というが前提でのお話。


そんな中、じゃあどうやってスタジオと個人宅を繋ぐか、という問題が出てきます。
スタジオと中継現場とか、本社スタジオとサテライトスタジオ、とかならISDNを使った音声コーデックや、光IPコーデックで双方向接続が一番良いのだけど、相手が個人宅ならそうもいかない。
今は個人宅に固定回線がない人も居るし、まして今更ISDNを個人宅で使用している人は皆無な気がするし。

ではどうするか。
一番簡単なのは電話で、あとはSkype、LINE電話、Zoom、そんなのがまず思いつく方法。

●電話の場合
スタジオの固定回線と喋り手の携帯電話もしくは固定電話と繋ぐパターンが多いのだけど、この方法での問題点は音質。
標準音質の音声通話(3.4kHz帯域)だとスタジオの機材に繋いだ時に明瞭さに欠けるし、本当に最終手段。
お仕事なんだから気にするのも違うのかもだけど、厳密にいえば1分1秒通話料金が掛かるという点もあるし。

●SkypeやLINE電話、Zoomの場合
音質は条件さえそろえば電話よりは遥かに良いと私は思っています。
この条件というのが人によって環境が違うからすべての人の同意を得られないけれども。
PCにアプリを入れ、オーディオインターフェースや外部マイクを適切に接続、設定し、もっと言うならコンプリミッターも繋ぎ、回線の品質が良く、かつその通信サービス(SkypeやZoom)のサーバが混み合っていないというのが条件。

この、適切な機材と適切な環境を送り手と受け手の両方が準備するというのが現実問題として難しかったりして。
または使用者のスキル不足もあったりで、現場で求められる「いつでもどんな時でも安定して高音質」というものの実現が難しかったりするのです。
スタジオは技術さん(技術専門スタッフ)居るけどね。
遠隔地の出演者に同じスキルを求めるのも現実問題難しい部分もあるので。

あと、音質は置いておくとしても遅延の問題。
調子が良い時は遅延はほぼなくても、長時間通話したり、通話(通信)中に回線品質が落ちると遅延や、最悪接続が切れてしまう。
これはもう放送事故な訳です。
こんな状況だから仕方ないとはいいつつも、放送中に切れたらこれはやっぱり放送事故。
安定性・確実性に欠けるのがこのSkypeやLINE電話、Zoom。

まあもちろん今後状況は変わって品質や安定性はいずれ上がるとは思います。
現実に数年前に比べたら今は格段に音質も安定性も遅延の少なさも良い。
ただ、あくまで今は不完全な部分もあると私は思っています。

そうそう、今更だけど今回のお話は「いかに音声を高音質で遅延なくお互いの場所に届けるか」という話です。
映像も必要とかいう場合はこの環境にプラスして、別の端末でSkypeとかZoomとかLINEのビデオ通話でビデオチャットすれば良いと思うし。
「じゃあトークバックは..」という話は「もう1回線別に繋げばいいんじゃないかな」というそういう解決案の方向で進めさせて下さい。


で、長文になってきたけど、ここからが「じゃあどうするのか」というお話。
これから先書くことは「あくまで私が自己責任のもと、自分の番組で必要に迫られたら私ならこうする」というお話。
決して人に勧めているのではなくて、「こういう方法もあります」という。
今、全国で、いえひょっとしたら世界中で放送局のエンジニアがこんな状況でどうやろうと悩んでいて、その中で様々なアイディアが生まれている中、「私が現場技術スタッフならこうやるよ」ってお話。

まず一つ目。
HD VoIPを使用してみる方法。
まずVoIPというのはVoice over Internet Protocolの略で、厳密にはちょっと違うのだけど、誤解を恐れずに書くと、TCP/IPネットワークを介して、デジタル化された音声を送受信したり、呼び出し、切断したりする呼制御技術を含めたものの総称。

そして、HD VoIPはそれを更に高品質・高音質化することに成功した通信技術のことで、お互いがスマートフォンの回線で、同じキャリアで、HD VoIP対応端末で、かつ対応通話エリア内で通話をした際、初めて利用できるもの。

凄く詳しい人に言わせれば厳密には違うと思う、というかもっと広域な定義での言葉なので。
ただまあ、このお話では深く詮索しないで頂いて。(((

例えばドコモの場合。
ドコモはVoLTE技術と呼んでいるけれど、まず人の耳で聞こえる範囲が20Hz~20kHzこれを前提として。
一世代前の3G回線だと、通話時の音質は300Hz~3.4kHz。
これがVoLTE技術を使用した通話だと帯域が50Hz~7kHz(特定条件下で8kHz)まで広がりこれはAMラジオ音質相当に値します。

で。
更にVoLTE(HD+)技術だとこれが50Hz~14.4kHzまで可聴帯域が広がりこれはもうFMラジオの音質に値します。

この技術、先に書いた「お互いがスマートフォンの回線で、同じキャリアで、HD VoIP対応端末で、かつ対応通話エリア内で通話」という条件は必要なものの。
通常の通話料金以外に追加料金が不要というのが最大のメリット。
そして通話料だって今は「カケホーダイプラン」ってあるので、最初のイニシャルコストは掛かっても通常使用でランニングコストは一定なのではないか、というのが私の中での良い面としての見解。

ちょっとドコモの公式音声サンプル動画のリンク張っておきます。
ご興味ある人聴いてみてください。


さてじゃあこれを実際に放送で運用してみたい。
どうするか。

まず大前提として、自分の端末がこのVoLTE(HD+)に対応していること、そして遠隔地の出演者もVoLTE(HD+)に対応した端末を持っていることが条件です。
これはもう非対応端末しか持っていないなら機種変更するしかないけど、幸い今はSimカード形式だから対応端末の中古白ロムを安く買って、(ものによっては3千円台からあるので)、本来の端末とは別に用意します。
そしてそれにSimを差し込めばok。
auはSimのアクティベーションが要るけど、docomoは不要なので。

●参考リンク : docomoのVoLTE(HD+)対応端末
iPhoneはiPhone11シリーズか、この前発売されたばかりのiPhoneSE第二世代。
あとはandroid端末ばかりとなります。

次に自分の(スタジオ側の)スマホをミキサー卓に接続して、相手の声をミキサーに。
そして、スタジオの声を遠隔地に届けないといけない。
これ、スタジオの固定電話回線ではダメなのです。
あくまで「お互いがスマートフォンの回線で、同じキャリアで、HD VoIP対応端末で、かつ対応通話エリア内で通話」という条件での話だから。
スタジオ側もスマホじゃないといけない。
だから自分のスマホを使う。

と、なればそう、なにかしらの方法でスマホの音声をミキサー卓に入力・出力含めて接続する必要があります。
色々と方法はあるんだけど、とりあえず実験だから、と今回私が買ってみたのがコレ。
Zoom LiveTrak L-8 (←メーカー公式の商品紹介は型番をクリック)
これ、1台でミキサー、レコーダー(SDに録音)、オーディオインターフェース、サンプラーになるんだけど。
面白いのがスマホ用のTRRSケーブル接続ポートがついている点。
そう、スマホのイヤホンマイク端子をフェーダーに立ち上げることが出来るのです。
つまりスマホ用のテレラインボックスの代わりとなり、更にミキサー機能があるから普通のダイナミックマイクやコンデンサーマイク、そしてCDとかの音声LINEが繋がるという訳。
今までに(あんまり)なかった、おもしろそう、と、とりあえず2台購入。
(スタジオ側と出演者側に1台ずつ必要だから計2台必要なので)
某先輩Kディレクターに報告したら「可能性を広げる素晴らしいお買い物」と言われたので良いことにする。
で、ここまで書いておいてなんなのだけど。
実は今日の時点ではVoLTE(HD+)対応端末が手元に2台ないのと。
自分の端末を受け手側にするとしても、実験に必要な送信側(相手側)のもう1回線がない状況。
これはもう追加でドコモ回線を契約しました。
(今ってdocomoショップじゃなくてオンラインで追加契約出来るみたい。外出しなくても携帯回線手に入るの便利。)
うん。それらが届いてからの後日実験になります。

なんなんだ私。
そもそも届いてから考察書きなよ私。

少なくともスマホの音を放送用ミキサー卓に落とし、またスタジオの音を相手のスマホに返すというテレラインとしての機能はバッチリでした。
続きの実験と結果報告はまた後日。

今は対応端末2台の白ロムと新規のdocomo回線Simカードが届くのを待っている状況です。


次。
レギュラー出演者じゃなくて、1回限りの電話ゲスト、とか、相手がVoLTE(HD+)エリア外に居るとか、とにかく対応端末や機材を用意するのは難しいといった場合のお話。

例えば「SkyPhone」を使う方法もあるかなーと思います。
Skype(スカイプ)じゃないよ、SkyPhone(スカイフォン)だよ。()

これはスマホ(iOS&android)用のアプリで、PC用は無し。
実際に運用するなら少なくともスタジオ側は上記のような機材が必要だけど、とにかくIP電話アプリの一種で、アプリをインストールすると会員登録とかはなく、専用の電話番号IDが振られます。
それを使ってお互いに通話するソフトなんだけど、LINEやSkypeを含む世の中に数多くあるIP通話(電話回線ではなくてデータ通信帯域をつかっての通話)アプリの中で多分1番と言っていいほど音が良いのです。
インストール後は設定画面から音質を高音質に設定するのをお忘れなく。
もちろん回線品質が普通レベルには良いという前提での話だけどね。

公式サイトはこちら
色々紹介が載っています。

これの運用実現性については今すぐに実験環境が出来たので、docomo LTE回線とau LTE回線のiPhoneXを使って接続。
2人でWi-FiはOFFにして、4G(LTE)通信として実験。
環境はお互いにSHURE BATA58A マイク。
ヘッドフォンはSONY MDR-CD900ST(いわゆるスタジオに置いてあることの多いスタンダードヘッドフォン)で会話。
時々サブ卓(今回はALLEN&HEATH Qu-16Cを)使用して音楽やTALK用BGMを通話回線に乗せてみたけど割と快適に通話出来るし確実に言えることは普通の電話よりは遥かに高音質。
そしてなにより遅延もないという結果に。
もちろんあくまでIP通話なので利用者が増えたらどうなるって問題はあるけど、日曜夜19時時点では問題なくて、これも今後の検証に値するかなって思っています。


私やっぱり機材触ってるときや技術実験してる時たのしいなー。
某プロの喋り手の人から「こんなに明るく喋るオタクを初めて見た」って言われたけど。
私はやっぱりエンジニア脳。
技術や機材が大好きなのです。
大学、情報ネットワーク学科だったけど、もっと勉強しておけばよかったと切に思う。


VoLTE(HD+)対応端末2台の白ロムと新規のdocomo回線Simカードが届いたらまた追記します。