「イマーシブ オーディオ」とは何でしょうか? イマーシブ オーディオ の基本概念から、方法論やアプローチの違い、さらにはフォーマットの違いとそれぞれの特徴を、判りやすく簡単にまとめてみました。
 

イマーシブ オーディオの概要

まず「イマーシブ オーディオ」を英語表記すると下記のようになります。

英語表記:Immersive Audio

Immersiveというのは、「没入感」という意味です。
つまり「イマーシブ オーディオ」とは「没入感の高いオーディオ」という意味になります。
一般的には、たくさんのスピーカーを配置したり、ヘッドフォンでの再生でも特殊な処理を行うことにより、360度、全方位から音が聞こえるコンテンツを「イマーシブ オーディオ」と呼んでいます。「立体音響」「3Dサラウンド」「Spacial Audio」など様々な呼び名がありますが、基本的に全て同義語と考えて間違いありません。
 
「イマーシブ オーディオ」が、「立体音響」「3Dサラウンド」と呼ばれることがあるということは、つまり「イマーシブ オーディオ」とは、「サラウンド」の一手法ということもできます。
いままでの「サラウンド」というと、5.1や7.1といった平面にスピーカーを配置したいわゆる「2Dサラウンド」でしたが、「イマーシブ オーディオ」すなわち「3Dサラウンド」は、上層部にもスピーカーを配置し、空間に半球面や全球面を表現する立体的なサラウンド手法となります。
 


 

イマーシブ オーディオ:主な方法論

イマーシブ・オーディオには、主に、3種類の「方法論」があります。

  1. チャンネル・ベース
  2. オブジェクト・ベース
  3. シーン・ベース

以下に、それぞれの方法論を簡単に解説します。

1. チャンネル・ベース

事前に想定される出力チャンネルの数に合わせた形で音声をあらかじめ制作し、それぞれのチャンネルを対応する各スピーカーから再生する方式。過去の2チャンネルステレオ作品や、5.1ch/7.1chといったサラウンドも全てこの方式です。
サンプルレートなどの制限もなく、ハイレゾリューションでの再生も可能。収録を行なった場所(コンサートホールやライブ会場など)の音場をそのまま再現したい場合に効果的で、“聴かせるための音”=音楽の再生に向いていると言えます。

2. オブジェクト・ベース

音源に「位置情報」を持たせ、各スピーカーからどのような音を出すかというパンニング情報をリアルタイムに計算(レンダリング)して再生する方式。例えば、ヘリコプターの音、車のクラクションと言った、動きを伴う映画の効果音に対して有効です。それぞれの音を「オブジェクト」として捉え、それぞれのオブジェクトがどのように動き、音量がどのように変化するかというデータを音声情報に含ませます。
再生時には、アンプなどの機器側で、スピーカーの位置や数にあわせて最適なレンダリングを行い再生します。そのため、再生時のチャンネル数=スピーカーの数に依存しない制作が可能。制作時にはDolby AtmosやAuro MAXと言った特定のフォーマットを使いエンコードを行う必要があり、逆に再生時には、それぞれのフォーマットに対応したAVアンプなどが必要になる。なお、オブジェクトベースは、純粋な音楽コンテンツの再生よりは、映画の効果音など音が空間を移動するような表現に向いていると言われています。
*Dolby AtmosやAuro MAXは、実際には、チャンネル・ベースとオブジェクト・ベースの両方を使用する「ハイブリッド型」です。
 

3. シーン・ベース

チャンネル・ベースとオブジェクト・ベースは「心理音響的アプローチ」。対してシーン・ベースは「物理音響的アプローチ」となり、リスナー=マイク位置を取り巻く、その空間全体の物理情報を記録再生する方式です。
Wave Field Synthesis(ウェーブ・フィールド・シンセシス)や、Ambisonics(アンビソニックス)といった方式がこれにあたり、最近では、VRなどの音響に使われることが多いAmbisonicsが大変脚光を浴びています。
 
それぞれの方法論には、長所短所、そして特色がありますが、現場やコンテンツに応じてそれぞれの方法論を使い分ける、もしくはコンビネーションして使うことが成功への近道となります。
 


 

イマーシブ オーディオ:主なフォーマット

イマーシブ・サラウンド市場には、現状、いくつかの標準フォーマットが存在しています。ここでは、一般的に耳にすることが多い、3種のフォーマットをご紹介いたします。

  • NHK 22.2 マルチチャンネル音響
  • Dolby Atmos
  • Auro 3D / Auro MAX

*上記の他に「DTS:X」というオブジェクトベースの規格もありますが、ここでは説明を割愛いたします。
 

NHK 22.2 マルチチャンネル音響

チャンネル・ベースの再生方式。スピーカーは上中下の3層構造になっており、その名の通り22本のスピーカーと、2本のSubWooferで構成されています。
 

Dolby Atmos

オーディオには48k/24bitを使用し、それをさらにDolby Atmosフォーマットでレンダリングします。ハイサンプルレートも使えるその他のフォーマットと比べると、多少音質面での見劣りはありますが、日本ではもっとも有名な商用フォーマットです。先述のように、チャンネル・ベースとオブジェクト・ベースの両方を使用する「ハイブリッド型」で、映画や音楽のコンテンツ没入感を高めるために使用されます。
 

Auro 3D / Auro MAX

現状、主にヨーロッパで主流のフォーマットです。チャンネル・ベースの「Auro 3D」と、それにオブジェクト・ベースを足した「Auro MAX」というフォーマットが存在しています。Auro 3Dは、現状96kHzのサンプルレートに対応しているので、より高音質なコンテンツ再生に適しています。
 
Dolby AtmosとAuro 3Dの音質比較を簡単に行うには、イマーシブ・オーディオのリファレンス音源集「BLOOM OF SOUND」シリーズが最適です。

 

Ambisonics

上記の他、シーン・ベースの「Ambisonics」があります。Ambisonicsは特定の協会や企業が提唱しているフォーマットではなく、オープンソースの方法論ですので、誰でも無料で利用することが可能です。チャンネル・ベースの良い部分もオブジェクト・ベースの特徴も内包しており、さらに、音場全体を回転させることができるという特殊な機能も持ち合わせているので、昨今ではVRゲームの音声や、自動車の車内音響として実装や実験が盛んに行なわれています。

Ambisonicsとは?