イマーシブ オーディオとは?

「イマーシブ オーディオ」とはなんでしょうか?  「イマーシブ オーディオ」の基本概念から、方法論やアプローチの違い、さらにはフォーマットの違いとそれぞれの特徴を、判りやすく簡単にまとめてみました。

 

まず「イマーシブ オーディオ」を英語表記すると下記のようになります。

 

英語表記:Immersive Audio

 

Immersiveというのは、「没入感」という意味です。

つまり「イマーシブ オーディオ」とは「没入感の高いオーディオ」という意味になります。

一般的には、たくさんのスピーカーを配置したり、ヘッドフォンでの再生でも特殊な処理を行うことにより、360度、全方位から音が聞こえるコンテンツを「イマーシブ オーディオ」と呼んでいます。 「立体音響」「3Dサラウンド」「Spacial Audio」など様々な呼び名がありますが、基本的に全て同義語と考えて間違いありません。

 

「イマーシブ オーディオ」が、「立体音響」「3Dサラウンド」と呼ばれることがあるということは、つまり「イマーシブ オーディオ」とは、「サラウンド」の一手法ということもできます。

いままでの「サラウンド」というと、5.1や7.1といった平面にスピーカーを配置したいわゆる「2Dサラウンド」でしたが、「イマーシブ オーディオ」すなわち「3Dサラウンド」は、上層部にもスピーカーを配置し、空間に半球面や全球面を表現する立体的なサラウンド手法となります。

 


イマーシブオーディオ:主な方法論

 

イマーシブオーディオには、主に、3種類の「方法論」があります。

  1. チャンネル・ベース
  2. オブジェクト・ベース
  3. シーン・ベース

 

以下に、それぞれの方法論を簡単に解説します。

1. チャンネル・ベース

事前に想定される出力チャンネルの数に合わせた形で音声をあらかじめ制作し、それぞれのチャンネルを対応する各スピーカーから再生する方式。過去の2チャンネルステレオ作品や、5.1/7.1といったサラウンドも全てこの方式。サンプルレートなどの制限もなく、ハイレゾリューションでの再生も可能なため、 収録を行なった場所(コンサートホールやライブ会場など)の音場をそのまま再現したい場合に効果的で、 “聴かせるための音”=音楽の再生に向いていると言えます。

 

2. オブジェクト・ベース

音源に「位置情報」を持たせ、各スピーカーからどのような音を出すかというパンニング情報をリアルタイムに計算(レンダリング)して再生する方式。例えば、ヘリコプターの音、車のクラクションと言った、動きを伴う映画の効果音に対して有効となり、それぞれの音を「オブジェクト」として捉え、それぞれのオブジェクトがどのように動き、音量がどのように変化するかというデータ音声情報に含ませ、再生時には、アンプなどの機器側で、スピーカーの位置や数にあわせて最適なレンダリングを行い再生するため、再生時のチャンネル数=スピーカーの数に依存しない制作が可能だが、制作時にはDolby AtomosやAuro MAXと言った特定のフォーマットを使いエンコードを行う必要があり、逆に、再生時には、それぞれのフォーマットに対応した AVアンプなどが必要になる。なお、オブジェクトベースは、純粋な音楽コンテンツの再生よりは、映画の効果音など音が空間を移動するような表現に向いていると言われています。

*Dolby AtomosやAuro MAXは、実際には、チャンネル・ベースとオブジェクト・ベースの両方を使用する「ハイブリッド型」です。

 

3. シーン・ベース

チャンネル・ベースとオブジェクト・ベースは、心理音響的アプローチですが、対してシーン・ベースは物理音響的アプローチとなり、リスナー=マイク位置を取り巻く、その空間全体の物理情報を記録再生する方式です。Wave Field Synthesis(ウェーブ・フィールド・シンセシス)や、Ambisonics(アンビソニックス)といった方式がこれにあたるが、最近では、VRなどの音響に使われることが多いAmbisonicsが大変脚光を浴びています。

 

それぞれの方法論には、それぞれ長所短所、そして特色がありますが、現場やコンテンツに応じて、それぞれの方法論を使い分ける、もしくは、コンビネーションして使うことが成功への近道となります。

 

 


イマーシブオーディオ:主なフォーマット

 

イマーシブ・サラウンド市場には、現状、いくつかの標準フォーマットが存在しています。ここでは、一般的に耳にすることが多い、3種のフォーマットをご紹介いたします。

  • NHK 22.2マルチチャンネル音響
  • Dolby Atmos
  • Auro 3D/Auro MAX
*上記の他に「DTS:X」というオブジェクトベースの規格もありますが、ここでは説明を割愛いたします。
NHKの22.2は、チャンネル・ベースの再生方式となり、スピーカーは、上中下の3層構造になっており、その名の通り22本のスピーカーと、2本のSubWooferで構成されています。
Dolby Atomosは、オーディオには48k/24bitを使用し、それをさらにDolby Atmosフォーマットでレンダリングするため、ハイサンプルレートも使えるその他のフォーマットと比べると、多少音質面での見劣りはありますが、日本ではもっとも有名な商用フォーマットです。先述のように、チャンネル・ベースとオブジェクト・ベースの両方を使用する「ハイブリッド型」で、映画や音楽のコンテンツ没入感を高めるために使用されます。
Auro 3D/Auro MAXは、現状、主にヨーロッパで主流のフォーマットであり、チャンネル・ベースのAuro 3Dに、オブジェクト・ベースを足したAuro MAXというフォーマットが存在しています。Auro 3Dは、現状96kHzのサンプルレートに対応していますので、より高音質なコンテンツ再生に適しています。

Dolby Atmosと、Auro 3Dの音質比較を簡単に行うには、イマーシブ オーディオのリファレンス音源集「BLOOM OF SOUND」が最適です。

「BLOOM OF SOUND」の詳細はこちら

この他に、シーン・ベースのAmbisonicsがあるのですが、Ambisonicsは特定の協会や企業が提唱しているフォーマットではなく、オープンソースの方法論ですので、誰でも無料で利用することが可能です。チャンネル・ベースの良い部分もオブジェクト・ベースの特徴も内包しており、さらに、音場全体を回転させることができるという特殊な機能も持ち合わせていますので、昨今では、VRゲームの音声や、自動車の車内音響として実装や実験が盛んに行われています。

おすすめ記事
InterBEE2019
InterBEE 2019 出展情報
イマーシブ録音の最先ノウハウと実践:Mick 沢口氏
ハイレゾ・アンビソニックス作品の制作秘話:江夏 正晃氏
イマーシブ オーディオとは?
Feel free to contact us!
製品仕様から、システムインテグレート、お見積もりや資料請求など、法人購入に関することは、なんでもお気軽にお問い合わせください。