イマーシブ オーディオとは?

「イマーシブ オーディオ」とはなんでしょうか?  「イマーシブ オーディオ」の基本概念から、方法論やアプローチの違い、さらにはフォーマットの違いとそれぞれの特徴を、判りやすく簡単にまとめてみました。

 

まず「イマーシブ オーディオ」を英語表記すると下記のようになります。

 

英語表記:Immersive Audio

 

Immersiveというのは、「没入感」という意味です。

つまり「イマーシブ オーディオ」とは「没入感の高いオーディオ」という意味になります。

一般的には、たくさんのスピーカーを配置したり、ヘッドフォンでの再生でも特殊な処理を行うことにより、360度、全方位から音が聞こえるコンテンツを「イマーシブ オーディオ」と呼んでいます。 「立体音響」「3Dサラウンド」「Spacial Audio」など様々な呼び名がありますが、基本的に全て同義語と考えて間違いありません。

 

「イマーシブ オーディオ」が、「立体音響」「3Dサラウンド」と呼ばれることがあるということは、つまり「イマーシブ オーディオ」とは、「サラウンド」の一手法ということもできます。

いままでの「サラウンド」というと、5.1や7.1といった平面にスピーカーを配置したいわゆる「2Dサラウンド」でしたが、「イマーシブ オーディオ」すなわち「3Dサラウンド」は、上層部にもスピーカーを配置し、空間に半球面や全球面を表現する立体的なサラウンド手法となります。

 


イマーシブオーディオ:主な方法論

 

イマーシブオーディオには、主に、3種類の「方法論」があります。

  1. チャンネル・ベース
  2. オブジェクト・ベース
  3. シーン・ベース

 

以下に、それぞれの方法論を簡単に解説します。

1. チャンネル・ベース

事前に想定される出力チャンネルの数に合わせた形で音声をあらかじめ制作し、それぞれのチャンネルを対応する各スピーカーから再生する方式。過去の2チャンネルステレオ作品や、5.1/7.1といったサラウンドも全てこの方式。サンプルレートなどの制限もなく、ハイレゾリューションでの再生も可能なため、 収録を行なった場所(コンサートホールやライブ会場など)の音場をそのまま再現したい場合に効果的で、 “聴かせるための音”=音楽の再生に向いていると言えます。

 

2. オブジェクト・ベース

音源に「位置情報」を持たせ、各スピーカーからどのような音を出すかというパンニング情報をリアルタイムに計算(レンダリング)して再生する方式。例えば、ヘリコプターの音、車のクラクションと言った、動きを伴う映画の効果音に対して有効となり、それぞれの音を「オブジェクト」として捉え、それぞれのオブジェクトがどのように動き、音量がどのように変化するかというデータ音声情報に含ませ、再生時には、アンプなどの機器側で、スピーカーの位置や数にあわせて最適なレンダリングを行い再生するため、再生時のチャンネル数=スピーカーの数に依存しない制作が可能だが、制作時にはDolby AtomosやAuro MAXと言った特定のフォーマットを使いエンコードを行う必要があり、逆に、再生時には、それぞれのフォーマットに対応した AVアンプなどが必要になる。なお、オブジェクトベースは、純粋な音楽コンテンツの再生よりは、映画の効果音など音が空間を移動するような表現に向いていると言われています。

*Dolby AtomosやAuro MAXは、実際には、チャンネル・ベースとオブジェクト・ベースの両方を使用する「ハイブリッド型」です。

 

3. シーン・ベース

チャンネル・ベースとオブジェクト・ベースは、心理音響的アプローチですが、対してシーン・ベースは物理音響的アプローチとなり、リスナー=マイク位置を取り巻く、その空間全体の物理情報を記録再生する方式です。Wave Field Synthesis(ウェーブ・フィールド・シンセシス)や、Ambisonics(アンビソニックス)といった方式がこれにあたるが、最近では、VRなどの音響に使われることが多いAmbisonicsが大変脚光を浴びています。

 

それぞれの方法論には、それぞれ長所短所、そして特色がありますが、現場やコンテンツに応じて、それぞれの方法論を使い分ける、もしくは、コンビネーションして使うことが成功への近道となります。

 

 


イマーシブオーディオ:主なフォーマット

 

イマーシブ・サラウンド市場には、現状、いくつかの標準フォーマットが存在しています。ここでは、一般的に耳にすることが多い、3種のフォーマットをご紹介いたします。

  • NHK 22.2マルチチャンネル音響
  • Dolby Atmos
  • Auro 3D/Auro MAX
*上記の他に「DTS:X」というオブジェクトベースの規格もありますが、ここでは説明を割愛いたします。
NHKの22.2は、チャンネル・ベースの再生方式となり、スピーカーは、上中下の3層構造になっており、その名の通り22本のスピーカーと、2本のSubWooferで構成されています。
Dolby Atomosは、オーディオには48k/24bitを使用し、それをさらにDolby Atmosフォーマットでレンダリングするため、ハイサンプルレートも使えるその他のフォーマットと比べると、多少音質面での見劣りはありますが、日本ではもっとも有名な商用フォーマットです。先述のように、チャンネル・ベースとオブジェクト・ベースの両方を使用する「ハイブリッド型」で、映画や音楽のコンテンツ没入感を高めるために使用されます。
Auro 3D/Auro MAXは、現状、主にヨーロッパで主流のフォーマットであり、チャンネル・ベースのAuro 3Dに、オブジェクト・ベースを足したAuro MAXというフォーマットが存在しています。Auro 3Dは、現状96kHzのサンプルレートに対応していますので、より高音質なコンテンツ再生に適しています。

Dolby Atmosと、Auro 3Dの音質比較を簡単に行うには、イマーシブ オーディオのリファレンス音源集「BLOOM OF SOUND」が最適です。

「BLOOM OF SOUND」の詳細はこちら

この他に、シーン・ベースのAmbisonicsがあるのですが、Ambisonicsは特定の協会や企業が提唱しているフォーマットではなく、オープンソースの方法論ですので、誰でも無料で利用することが可能です。チャンネル・ベースの良い部分もオブジェクト・ベースの特徴も内包しており、さらに、音場全体を回転させることができるという特殊な機能も持ち合わせていますので、昨今では、VRゲームの音声や、自動車の車内音響として実装や実験が盛んに行われています。

Ambisonicsとは?

今話題のアンビソニックスの、概要と、製作方法を簡単に説明します。

アンビソニックスを知りたい方、制作を始めたい方必見。

 

VR(仮想現実)、AR(拡張現実)、MR(複合現実)、360度ビデオなど新しい体感型コンテンツの普及にともない、 音楽やサウンドにも同様の表現力が求められており、今まさに様々な試みが行われています。

サラウンドに高さの表現を追加しサウンドに包み込まれる立体的な音響を再現するイマーシブ・オーディオ、立体音響をヘッドフォンで聞くことのできるバイノーラルなど、様々な再生方法やそれらを実現するテクノロジーが開発され、私たちの身の回りでも採用が進んでいます。

その中でもYouTubeやFacebookに採用された「Ambisonics」(アンビソニックス)が現在大きな注目を集めています。

アンビソニックスを簡単に説明すると、次の3点に集約することができます。

  • アンビソニックスとは、イマーシブ3Dオーディオのフォーマットの一種
  • アンビソニックスでは、360°球体の音場で、録音と再生が可能
  • アンビソニックスは、シーンベースのフォーマット

アンビソニックスとは、イマーシブ3Dオーディオのフォーマットの一種

「イマーシブ」(Immersive)とは、日本語では「没入」とか「没入型の」と翻訳されます。つまりイマーシブ3Dオーディオでは、一般的なステレオやサラウンドでは得られない高い「没入感」に浸ることができます。

またアンビソニック以外の著名なイマーシブ3Dオーディオのフォーマットとして、ハリウッド映画で広く採用されている「Dolby Atmos」「DTS:X」、ヨーロッパで開発され音楽コンテンツのリリースが多い「Auro-3D」などがあります。

アンビソニックスでは、360°球体の音場で、録音と再生が可能

一般的なステレオ再生の場合、リスナーの前面から再生される平面的な音場ですが、5.1chや7.1chのサラウンドになると、リスナーを360°取り巻くようになります。さらに「Dolby Atomos」や「Auro-3D」といった3Dサラウンドの場合は、高さを加えたドーム型の半球面に音場が広がります。そしてAmbisonicsでは、360°全球面となり、リスナーをすべて包み込む球体が完成します。

アンビソニックスは、シーンベースのフォーマット

「シーンベース」(scene-based)とは何かを理解するためには、イマーシブ3Dオーディオ以外のフォーマットについて少し説明する必要があります。

イマーシブ3Dオーディオには、大きく分けて以下の3種類の方式があります。

  • チャンネルベース
  • オブジェクトベース
  • シーンベース(Ambisonics)

チャンネルベース

チャンネルベースとは、再生システム内のそれぞれのチャンネルに1:1で対応する再生方式です。

2台のスピーカーをつかって表現を行うステレオフォニックもチャンネルベースです。録音の段階から2台のスピーカーで再生することを想定し制作が行われています。
ステレオだけではなく、5.1chや7.1chといったサラウンドも基本的にはチャンネルベースで制作され、もちろんイマーシブサラウンドでもチャンネルベースの考え方を使うことができます。

主要なイマーシブ3Dオーディオのフォーマットである、NHKの22.2chマルチチャンネル音響や、ヨーロッパを中心に人気のあるAuro-3Dなどは、このチャンネルベース方式を使ったフォーマットとなります。

オブジェクトベース

オブジェクトベースとは、音源(音声信号)の他に音響メタデータを付随させリアルタイムに各スピーカーからの出力する音を計算して再生する方式です。

例えば頭上を通過するヘリコプターの音のような動きを伴う効果音に対して有効で、それぞれの音を「オブジェクト」として捉え、オブジェクトがどのように動き、その結果音量がどのように変化するかをスピーカーレイアウトにあわせてデコードを行い再生します。

Dolby Atmosでは、オブジェクトベースとチャンネルベースの両方を使ったフォーマットです。

シーンベース

シーンベースは、リスナーを取り巻く空間全体の物理情報を360°の全天球空間に記録再生する方式です。

シーンベースに属するAmbisonicsでは、マイクを使ってその空間の音場(アンビエンス)のすべてを360°の球体の中に取り込むこともできますし、個別に収録した音を自由に球体の中に配置し、オブジェクトベースのように自由に動かすこともできます。

またAmbisonicsの最大の特徴は、それぞれの音の動きや位置を球体の中に有したまま、その球体を自由に回転させることができます。この特徴によりVRコンテンツや360°動画などの音響として使われることが多い方式となっています。

Ambisonicsはスピーカーレイアウトに依存せず、チャンネルベースを含まないため、どのようなスピーカーレイアウトであっても1つのAmbisonicsフォーマットのファイルで対応することができます。

High Order Ambisonics

FacebookやYouTubeなどに採用されたことでAmbisonicsの音源を聴く環境が増えつつありますが、多くのAmbisonics音源はFirst Order Ambisonics、日本語では「1次アンビソニックス」と呼ばれるものです。

1次アンビソニックスでは全方位から聞こえる0次アンビソニックス(下図のW-channel)に水平方向、垂直方向、そして奥行きが加わります。

この状態でも上下・左右・前後という3次元の位置情報があるため、360度球体音場の再現は可能です。

ただしAmbisonicsの最大の特徴でもある音の動きや、球体音場の回転などを伴う場合ではそれぞれのチャンネル*の隙間が生じてしまい、音像の位置再現性が落ちてしまいます。
* ここでのチャンネルは、スピーカーの数ではなく空間を埋める方向とお考えください。

この問題を解決するのがHigh Order Ambisonics(通称:HOA)、日本語では「高次アンビソニックス」と呼ばれます。

IEM Plug-inを使用してAmbisonicsを制作するチュートリアルをご確認いただけます。

IEM Plug-in Suiteとは?

About US

このサイトは、株式会社エムアイセブンジャパンの法人営業窓口 ( MUSIC EcoSystems | BIZ )の ウェブページです。 教育機関、官公庁および一般企業様向けの営業窓口、ならびに「音(オーディオ/サウンド)」に関する様々な情報の掲載、ワークショップやイベントの定期開催などを行なっております。
powerd by

おすすめ記事

Contact

製品仕様から、システムインテグレート、お見積もりや資料請求など、法人購入に関することは、なんでもお気軽にお問い合わせください。
おすすめ記事
TopBanner_InterBEE
InterBEE 2019 出展レポート
イマーシブ録音の最先ノウハウと実践:Mick 沢口氏
ハイレゾ・アンビソニックス作品の制作秘話:江夏 正晃氏
イマーシブ オーディオとは?
Feel free to contact us!
製品仕様から、システムインテグレート、お見積もりや資料請求など、法人購入に関することは、なんでもお気軽にお問い合わせください。