転載元:
https://ja.wikipedia.org/wiki/MPEG-4_ALS
転載元2:
https://www.nue.tu-berlin.de/menue/forschung/forschungsgebiete/datenkompression_und_uebertragung/mpeg_4_audio_lossless_coding_als/parameter/en/
転載元2:
https://www.nue.tu-berlin.de/menue/forschung/forschungsgebiete/datenkompression_und_uebertragung/mpeg_4_audio_lossless_coding_als/parameter/en/
MPEG-4 ALS
開発者 | ISO |
---|---|
種別 | オーディオコーデック、音声ファイルフォーマット |
包含先 | MP4 |
国際標準 | ISO/IEC 14496-3 |
MPEG-4 ALS (MPEG-4 Audio Lossless Coding) はMPEG-4オーディオ (MPEG-4 Part 3) の一部として規格化されたロスレス圧縮方式で、スタジオ編集などでも使える高音質のマルチチャネルオーディオ信号を扱うことができる。
MPEG-4 ALSは、インターネットでの音楽配信、携帯ミュージックプレーヤ、音楽アーカイブシステムやスタジオ編集などさまざまな用途への応用が考えられており、FFmpegなどさまざまなソフトウェアでサポートされている[1]。
目次
概要[編集]
MPEG-4 ALSはMPEG-4オーディオで定義されたロスレスオーディオ符号化ツール (lossless audio coding tools) の1つで、MP3やAAC、Vorbisなどの非可逆圧縮方式と異なり、オリジナルのオーディオ信号をそのまま復元することができる。MPEG-4 ALSの規格はMPEG-4オーディオ (MPEG-4 Part 3) の一部としてISO/IEC 14496-3 Subpart 11で定義されている[2][3]。
MPEG-4 ALSは、スタジオ編集にも使用できる量子化ビット数32ビット長のPCM信号を扱うことができ、CDより高いサンプリング周波数にも対応できる。また、5.1チャネル・7.2チャネル・22.2チャネルサラウンドを含むマルチチャネルのオーディオ入力を扱うことができる。
MPEG-4 ALSの特徴は以下の通りで[5]、柔軟性が高い。
- 量子化ビット数32ビットまでのPCMに対応、IEEE 754 32ビット浮動小数点形式も使用可
- 任意のサンプリング周波数(192 kHzで試験済、384 kHz以上の高サンプリング周波数にも対応可能)
- マルチチャネル/マルチトラック対応、扱えるチャネル数は最大65536チャネル
- 再生時のランダムアクセスが可能
- MP4ファイルフォーマットを使い映像データとの組み合わせが可能
- 対応可能な入力フォーマットはRaw、WAV、AIFF、BWF、Sony Wave64、BWF with RF64など
MPEG-4オーディオでの位置づけ[編集]
MPEG-4オーディオは多くのツールの組み合わせからなり、MPEG-4 ALSはオーディオ符号化ツール (audio coding tools) の1つであるロスレスオーディオ符号化ツール (lossless audio coding tools) に分類される[3]。
同じカテゴリのツールとして、スーパーオーディオCDでのロスレス圧縮方式として使われているMPEG-4 DST(direct stream transfer) や、MPEG-4 AACなどの汎用オーディオ符号化ツール (general audio coding tools) と組み合わせて使うMPEG-4 SLS (scalable lossless coding) がある[3]。それぞれは符号化方式が異なる。
アルゴリズム[編集]
線形予測や長期予測により情報の圧縮を行う考え方は、CELPなど音声符号化での基本的な考え方と変わらない。多くのロスレス圧縮では、何らかの形で予測可能な成分は少数の予測係数として表現し、予測できなかった残差部分をエントロピー符号化を使って効率よく符号化することで、元の信号が持つ情報を維持しながらデータの圧縮を行う。MPEG-4 ALSも同様の考え方にもとづく。
フレーム/ブロック分割[編集]
フレーム分割では入力信号を基本的な処理単位であるフレームに分割する。1フレームのサンプル数はサンプリング周波数により異なり、48 kHzでは2048サンプル、96 kHzでは4096サンプルで、おおよそ43 msの長さになる。オプションとして、変化の激しい信号を効率よく符号化するため、入力信号の内容に応じて1フレームを複数のブロックに分けることもできる。
線形予測[編集]
続く短期予測では線形予測フィルターを用い、線形予測の残差信号を求める。フレーム内の各サンプル間には相関があるため過去のサンプル値からある程度予測ができる。線形予測はそのような信号を効率的に表現するための手法で、予測可能な成分を少数の線形予測係数で表現する。予測しきれなかった残差成分のみを別に符号化することで、情報の圧縮を行う。
MPEG-4 ALSでの線形予測の次数は0(予測しない)から1023までで、入力信号の性質に応じて適応的に変化する[6]。
長期予測[編集]
多くの音楽には、楽器などの基本周波数(ピッチ周波数)によって決まる繰り返し成分やハーモニック成分が含まれている。長期予測 (Long-Term Prediction) を追加し、短期予測の残差成分に残るこのような繰り返し成分を係数化することで残差成分の振幅を減少させ、情報の圧縮を行うことができる。
長期予測の係数としては元の信号に対する複数の遅延時間と重み係数の組み合わせが使われる。残差について、過去のサンプル値から現在のサンプル値を最もよく近似できる遅延時間と重み係数の組み合わせが計算され、係数をゴロム・ライス符号で符号化する。
マルチチャネル符号化[編集]
MPEG-4 ALSはマルチチャネルの信号を扱うことができ、チャネル間の相関を利用してさらに圧縮率の向上を行うことができる。
まず最初にチャネル間で最も相関の高い組合せ(親子関係)を探索する。続いて親チャネルの残差信号に対して、長期予測と同様の方法で複数の遅延時間と重み係数の組み合わせによる予測係数を求め、ゴロム・ライス符号で符号化する。
エントロピー符号化[編集]
入力信号からさまざまな予測成分を取り除いた残差成分に対しエントロピー符号化を行う。
符号化方式として、比較的演算量が少ないライス符号と、より複雑だが圧縮効率が高いBGMC(Block Gilbert-Moore Code、ブロック ギルバート・ムーア符号)と呼ばれる方法のいずれかを選ぶことができる。
これらの符号は小さい振幅値に短いコードを割り当てるため、それまでのさまざまな予測により振幅が小さくなった残差信号を効率的に圧縮できる[6]。
復号[編集]
復号はこれらの処理を逆に行う。エントロピー符号化結果から残差信号を復元し、マルチチャネル符号化の各係数、長期予測の係数、線形予測係数により計算した予測成分を使って新しい残差成分を順次計算していくことで、1フレーム分の最終的なサンプル値を計算する。
符号化時の予測計算の方法と復号時の予測計算方法が同じであれば、符号化時の入力信号とまったく同じ信号を復号することができる。
その他の処理[編集]
MPEG-4 ALSはプロのミキシングなどに用いられるIEEE 754 32ビット浮動小数点形式の入力信号が扱える。浮動小数点形式で表現された信号は見た目のサンプル値が無相関になり圧縮がうまく行えず[6]、また丸め誤差の扱いの違いにより入力信号と同じ信号を復号できない可能性があり、整数入力の場合と異なる手法が用いられる。
入力信号を整数部分と余りの誤差部分に分割し、整数部分については従来と同じ方法で符号化を行い、余りの部分は辞書式圧縮の一種のLempel-Ziv法を修正したマスクLempel-Ziv符号化と呼ばれる方法で圧縮する。
ソフトウェア[編集]
MPEG-4 ALSのリファレンス実装はベルリン工科大学のMPEG-4 ALSのウェブページ[1]で入手できる。また、ISO/IEC 14496-5:2001/Amd.10:2007でも定義されている[7][8]。
MPEG-4 ALSをサポートしている代表的ソフトウェアとして、以下のものがある[1]。
- FFmpeg
- VLCメディアプレーヤー
- MPlayer
- XMedia Recode
- Winamp (Plugin)
歴史[編集]
2002年6月から始まったMoving Picture Experts Groupによるロスレスオーディオ符号化方式の提案要求に対し[9][10]、2002年12月にベルリン工科大学(ドイツ)、NTT(日本)、リアルネットワークス社(アメリカ)、インフォコム研究所(シンガポール)、フラウンホーファーIIS(ドイツ)、マイクロソフト(アメリカ)、サムスン電子(韓国)の7社から基本要求を満たすコーデックの提案があり、圧縮効率、必要な演算量、柔軟性についての評価が行われた。提案には可逆圧縮のみを行う方式(その後のMPEG-4 ALS)と、非可逆/可逆圧縮のハイブリッド方式(その後のMPEG-4 SLS)とが含まれていた。
Moving Picture Experts Groupは両方の方式をサポートすることを決定し、2003年6月に可逆圧縮のみを行う方式として圧縮効率が優れていたベルリン工科大学の提案をリファレンスモデルとして採用した[4]。これをベースとし、ベルリン工科大学、NTT、リアルネットワークス社、インフォコム研究所が協力して[6]圧縮性能や柔軟性の向上と演算量の低減を行い、現在のMPEG-4 ALSの最終案を2005年12月にまとめ、最初の規格ISO/IEC 14496-3:2005/Amd 2:2006が2006年3月に出版された[11]。
脚注[編集]
- ^ a b c Communication Systems Group (2010年6月22日). “MPEG-4 Audio Lossless Coding (ALS)”. Technische Universität Berlin. 2010年8月26日閲覧。
- ^ ISO/IEC (2009年). “ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio”. ISO. 2010年8月15日閲覧。
- ^ a b c ISO/IEC (2009) (PDF), ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio, ISO 2010年8月15日閲覧。
- ^ a b c T. Liebchen, T. Moriya, N. Harada, Y. Kamamoto, Y. Reznik. (2005年8月). “The MPEG-4 Audio Lossless Coding (ALS) Standard - Technology and Applications (PDF)”. Technical Universifty of Berlin. 2010年8月26日閲覧。
- ^ a b 原田 登, 守谷 健弘, 鎌本 優 (2008年2月). “MPEG-4 ALSの性能・応用と関連する標準化活動 (PDF)”. NTT. 2010年8月26日閲覧。
- ^ a b c d e 鎌本 優, 守谷 健弘, 原田 登, Csaba Kos (2008年2月). “ロスレス・オーディオ符号化MPEG-4 ALSの高性能化 (PDF)”. NTT. 2010年8月26日閲覧。
- ^ ISO/IEC (2007) (ZIP), ISO/IEC 14496-5:2001/Amd.10:2007 - Information technology -- Coding of audio-visual objects -- Part 5: Reference software -- Amendment 10: SSC, DST, ALS and SLS reference software, ISO 2010年8月15日閲覧。
- ^ ISO/IEC (2007), ISO/IEC 14496-5:2001/Amd.10:2007 - SSC, DST, ALS and SLS reference software, ISO2010年8月15日閲覧。
- ^ ISO/IEC JTC1/SC29/WG11 (MPEG), Call for Proposals on MPEG-4 Lossless Audio Coding, N5040, Klagenfurt, Austria, July 2002.
- ^ ISO/IEC JTC1/SC29/WG11 (MPEG), Final Call for Proposals on MPEG-4 Lossless Audio Coding, N5208, Shanghai, China, October 2002.
- ^ ISO (2006年). “Audio Lossless Coding (ALS), new audio profiles and BSAC extensions - ISO/IEC 14496-3:2005/Amd 2:2006”. ISO. 2010年8月15日閲覧。
参考文献[編集]
- Andreas Spanias, Ted Painter, Venkatraman Atti (ed). Audio signal processing and coding. Wiley-Interscience, John Wiley & Sons, Inc., 2006. ISBN 978-0471791478.
- ISO/IEC. Information technology — Coding of audio-visual objects — Part 3:Audio. ISO/IEC 14496-3:2009, Fourth edition, 2009.
関連項目[編集]
- 線形予測符号
- 可逆圧縮(ロスレス圧縮)
- Direct Stream Digital
- MPEG-4 SLS
- MPEG-4
外部リンク[編集]
- MPEG-4 Audio Lossless Coding (ALS) - ベルリン工科大学のMPEG-4 ALSウェブページ
- The MPEG Home Page - 公式MPEGウェブページ
勉強の為に転載しました。
https://www.denon.jp/jp/blog/3857/index.html
コメント:
Auro-3Dは、全チャンネルがロスレスのハイレゾ対応なので、Dolby Atmosよりも、DTS:Xよりも音質が優れております。
NHK様、日本放送協会様、4K放送の音声フォーマットには是非Auro-3Dの5.1CHで全チャンネルロスレスのハイレゾで、MPEG4-ALSにして頂ければ幸いで御座います。
HOME THEATER
Dolby AtmosやDTS:Xに続き新しいイマーシブ(没入できる)サウンドとして話題を集めているAuro-3D、Dolby Atmos、DTS:Xを編集部が聴き比べてみました。オスロの室内合唱団「アンサンブル96」の音源を中心にレビューします。
SHARE
Dolby AtmosやDTS:Xに続き新しいイマーシブ(没入できる)サウンドとして話題を集めているAuro-3Dが日本で初めてAVR-X6400H、AVR-X4400Hに搭載されました。
そこでデノンオフィシャルブログ編集部ではAuro-3D 、Dolby Atmos、DTS:Xを聴き比べてみました。
そこでデノンオフィシャルブログ編集部ではAuro-3D 、Dolby Atmos、DTS:Xを聴き比べてみました。
「AVR-X6400H / AVR-X4400Hを買うとかならずもらえるキャンペーン」でプレゼントされるオスロの室内合唱団「アンサンブル96」の新アルバム「わたしの愛も(So is my love)」を中心にレビューします。
希望小売価格:300,000 円(税抜)
希望小売価格:170,000円(税抜)
「AVR-X6400H / AVR-X4400Hを買うとかならずもらえるキャンペーン」概要
キャンペーン対象期間中にAVサラウンドレシーバー「AVR-X6400H」または「AVR-X4400H」をお買い上げの方にもれなくノルウェー・2LレーベルのAuro-3D収録、高音質 Blu-ray Audioディスク / SACD Hybridディスク(2枚組)「アンサンブル96 / わたしの愛も(So is my love)」をプレゼント。
さらに抽選で50名様にAmazon Prime MusicやAWA、Spotifyなどのストリーミングサービスに対応したワイヤレススピーカー「HEOS 1」をプレゼントします。2018年1月20日まで!
詳細はこちら
詳細はこちら
というわけで、本社のAV試聴室で、日本で初めてAVR-X6400H、AVR-X4400Hで国内初対応したAuro-3Dの試聴をすることにしました。
この試聴室はご覧のように天井にシーリングスピーカーが設置されており、様々な形式の立体音響の試聴が可能になっています。
この試聴室はご覧のように天井にシーリングスピーカーが設置されており、様々な形式の立体音響の試聴が可能になっています。
まず最初にAuro-3Dについて簡単にご説明しておきましょう。
ホームシアターなどで使われているサラウンドは、年々進化を続けており、ここ数年はDolby AtmosやDTS:Xなどに代表される、上方向から音が出るようにスピーカーを設置し、より立体的で臨場感あふれる音場が楽しめるサラウンドフォーマットが主流になりつつあります。これらは今までよりも音に没入できるため「イマーシブ(没入できる)サウンド」などと言われています。Auro-3Dは、Dolby Atmos、DTS:Xに続き登場した第3のイマーシブサウンドとして話題を集めています。
サラウンドの仕組み、Dolby Atmos、DTS:Xなどについてはデノンオフィシャルブログのエントリー『超初心者のための「サラウンドって何?」』をぜひご覧ください。
では先行したDolby Atmos、DTS:XとAuro-3Dはどこが違うのでしょうか。
技術的に言うとその大きな違いは2つ。
技術的に言うとその大きな違いは2つ。
まず1つ目は、Dolby AtmosやDTS:Xはオブジェクトオーディオ(音の鳴り方を位置ベースで指定する仕組み)であるのに対し、Auro-3Dは従来のサラウンドと同じくチャンネルベースの音声技術であるということ。
そして2つ目は、チャンネルごとにロスレス再生に対応している(ハイレゾでサラウンドが楽しめる)こと。
そして2つ目は、チャンネルごとにロスレス再生に対応している(ハイレゾでサラウンドが楽しめる)こと。
その結果、「より自然で臨場感豊かな3Dサウンド」が楽しめる。これがAuro-3Dの最大の特長と言えるでしょう。
ではAuro-3Dがどのくらいすごいのか。それを今回は他のフォーマットと比較しつつ確かめてみようと思います。音に集中して違いを確かめたかったので、スクリーンはあえて使用せずに試聴しました。
試聴にはAVR-X6400Hを使用。
そして音源は「AVR-X6400H / AVR-X4400Hを買うとかならずもらえるキャンペーン」でプレゼント対象となっている音源、Auro-3Dの魅力が堪能できるオスロの室内合唱団「アンサンブル96」の新アルバム「わたしの愛も(So is my love)」を聴いてみます。
アンサンブル 96は「グラミー賞」の最優秀合唱部門と最優秀サラウンド・サウンドの2部門にノミネートされたオスロの室内合唱団。
本作はオスロの教会で録音されたもののようです。アルバムの詳細はこちらをご覧ください。
本作はオスロの教会で録音されたもののようです。アルバムの詳細はこちらをご覧ください。
ちなみにこのアルバムは、現在最も高解像度の24bit/352.8kHzでレコーディングされており、再生フォーマットは5.0 DTS、9.0 Dolby Atmos、9.0 Auro-3D、そして2.0 LPCMが収録されています。
ですからフォーマットによる音の違いを試聴するには絶好のソフトと言えるでしょう。
ですからフォーマットによる音の違いを試聴するには絶好のソフトと言えるでしょう。
↑ジャケット裏面の下のほうに録音フォーマットと再生フォーマットが記載されています。
というわけで聴いてみました。
まずハイレゾのステレオで。実に美しく柔らかい歌声です。
録音の素晴らしさがよくわかります。賛美歌ということもあって、とても神々しい響きです。
録音の素晴らしさがよくわかります。賛美歌ということもあって、とても神々しい響きです。
それではこれを立体音響のAuro-3Dで聴いてみましょう。
北欧の教会での録音ということもあり、非常に天井が高い音場でコーラスがきめ細やかに美しく響きます。
澄んだ空気感すらリアルに感じられます。
イマーシブサウンドの本命というだけあって、目を瞑ると、まったく北欧の教会にいるとしか思えません。
北欧の教会での録音ということもあり、非常に天井が高い音場でコーラスがきめ細やかに美しく響きます。
澄んだ空気感すらリアルに感じられます。
イマーシブサウンドの本命というだけあって、目を瞑ると、まったく北欧の教会にいるとしか思えません。
さらにフォーマットを変えてDolby Atmosで聴いてみると、同じく立体音響で素晴らしい音場ですが、ややエッジが効いた印象を持ちました。
写真でいえばインスタグラム的という感じでしょうか。やや映画っぽいドラマチックな色づけを感じました。
音の特徴は各社のデコードの違いもあるのかもしれません。
写真でいえばインスタグラム的という感じでしょうか。やや映画っぽいドラマチックな色づけを感じました。
音の特徴は各社のデコードの違いもあるのかもしれません。
つまり、Auro-3Dは各チャンネルがハイレゾで、しかもオブジェクトオーディオのようにレンダリングされているのではなく、チャンネルとしてしっかりとマスタリングされていることが、こうした音の違いの原因かもしれません。
またDTS:Xでも聴いてみました。
こちらも音の印象がやや変わりましたが、Dolby Atmosと同じ傾向の音です。
ただしDTS:Xは5チャンネルで上方向の音がありませんでしたので、天井の高さ、天井から美しいコーラスの残響が降ってくるような音場は感じることができませんでした。
フォーマットの違い以前に、上方向の音の有無による臨場感、音場感の違いが鮮明になった気がしました。
こちらも音の印象がやや変わりましたが、Dolby Atmosと同じ傾向の音です。
ただしDTS:Xは5チャンネルで上方向の音がありませんでしたので、天井の高さ、天井から美しいコーラスの残響が降ってくるような音場は感じることができませんでした。
フォーマットの違い以前に、上方向の音の有無による臨場感、音場感の違いが鮮明になった気がしました。
Dolby Atmos、DTS:X、そしてAuro-3Dを何度か繰り返して比較してみましたが、独自規格によるロスレスの96kHzのハイレゾサウンドのおかげでしょうか、やはり音場の自然さに関してはAuro-3Dが最も優れていたように思いました。
次に通常のCDをAuro-3Dで聴いてみました。
というのもまだAuro-3Dに対応したソフトが少ないという事情もありますが、Auro-3Dは独自のAuro-Matic®アルゴリズムによって、モノラルやステレオ、そして5.1など通常のコンテンツを自然な3Dサウンドに変換する機能も持いるということでしたので、それを試してみようと思います。
というのもまだAuro-3Dに対応したソフトが少ないという事情もありますが、Auro-3Dは独自のAuro-Matic®アルゴリズムによって、モノラルやステレオ、そして5.1など通常のコンテンツを自然な3Dサウンドに変換する機能も持いるということでしたので、それを試してみようと思います。
それで手にしてみたのが、マドンナの「Ray of Light」です。
まず通常のステレオで聴いてみました。『レイ・オブ・ライト』(Ray of Light)は、1998年にリリースされたアルバム。ポップでありながらテクノやアンビエントのテイストが入っており電子音がたくさん入っていますし、録音も素晴らしい仕上がりです。ではこれがAuro-3Dでどう立体音響化されるのでしょうか。
Auro-3Dで再生してみると、予想をはるかに超えて電子音が急に立体的に拡がりました。まさに音に囲まれる感覚。アルゴリズムが自動的に判断するのでしょうが、歌は正面に定位したまま電子音が前から後ろにめまぐるしく動いて、まるで3D用にミックスされた音源のように感じます。
こちらもDolby Atmos、DTS:Xと比較しました。アルゴリズムの違いで立体感のニュアンスは結構違いましたが、このあたりの好き嫌いは好みになるのではないでしょうか。
ただDolby AtmosもDTS:Xもステレオで聴いた音と比べると、音にメリハリがついて迫力は増しました。原音忠実度という観点から、ステレオ再生との音質の違いが一番少ないのはAuro-3Dだったように思います。
ただDolby AtmosもDTS:Xもステレオで聴いた音と比べると、音にメリハリがついて迫力は増しました。原音忠実度という観点から、ステレオ再生との音質の違いが一番少ないのはAuro-3Dだったように思います。
これは音楽のジャンルにもよるところでしょうから、時間があればクラシックやジャズ、環境音楽などでも比較試聴してみたいところ。
Dolby Atmos、DTS:X、Auro-3Dを比較試聴するだけで、かなり楽しい時間が過ごせそうです。
Dolby Atmos、DTS:X、Auro-3Dを比較試聴するだけで、かなり楽しい時間が過ごせそうです。
Dolby Atmos、DTS:Xに続いて出てきたAuro-3Dですが、最後に満を持して出てきただけあって、かなり聴き応えのある「イマーシブサウンド」が堪能できました。
Auro-3Dの自然な立体サウンド、映画ファンならず、オーディオファンにも見逃せないところだと思います。
Auro-3Dの自然な立体サウンド、映画ファンならず、オーディオファンにも見逃せないところだと思います。
まだ上陸して間もないAuro-3Dが視聴できるお店は、以下のページでご紹介しています。
ぜひお近くのお店で臨場感あふれるAuro-3Dのイマーシブサウンドをお試しください。
ぜひお近くのお店で臨場感あふれるAuro-3Dのイマーシブサウンドをお試しください。
現在デノンAVサラウンドレシーバーを購入すると参加できるキャンペーンは2つ同時開催中!両方応募が可能です!このチャンスをお見逃しなく!
12/16(土)、17(日)は「映画を聴こうプロジェクト」合同イベントが開催されます。
オーディオ5ブランドが勢ぞろい。デノンでは、AVR-X1400H、6400Hでデモを行います。ご来場をお待ちしております。
詳細はこちら
オーディオ5ブランドが勢ぞろい。デノンでは、AVR-X1400H、6400Hでデモを行います。ご来場をお待ちしております。
詳細はこちら
(編集部I)
ハイパフォーマー
https://www.high-performer.jp/Daijob.com
https://www.daijob.com/
https://www.daijob.com/en/
skype自動翻訳
検索結果はこちら
コメント:Skypeで音声認識しながら自動翻訳するのでしたら、
ヘッドセットや卓上マイクを使用された方が音声認識の精度は向上致します。
英語でプログラミングレッスン
検索結果はこちら
0 件のコメント:
コメントを投稿