2021年7月2日 星期五

了解無損、高解析和空間音訊

Apple 最近宣布了 Apple Music 串流媒體服務的無損音訊選項。此外,該公司還將提供無損高解析音訊以及使用杜比全景聲 (Dolby Atmos) 編碼的環繞聲音訊。

Apple 現在是無損俱樂部的最新成員,加入了 Tidal、Amazon、Deezer 和 Quobuz 等服務,這些服務已經提供此選項已有一段時間了。甚至實際上尚未開始向其訂閱者推出無損音訊的 Spotify 也在幾個月前宣布了自己的 Spotify HiFi 服務,要來對抗Apple。


Apple 現在正在其平台上部署無損音訊,它應該會自動成為提供此功能的最大的音樂串流媒體服務。數百萬人將突然獲得無損音訊,而無需付出任何額外的努力,甚至無需支付任何額外費用。

所以現在的問題是,什麼是無損音訊,為什麼有人要關心?什麼是高解析音訊或杜比全景聲?現在是我們清除圍繞這些技術的一些空氣並消除與它們相關的一些神話的時候了。但是,在我們這樣做之前……

基礎知識

我們聽到的音訊是類比的,因為這是我們運作的領域。過去,用於向我們分發此音訊的媒體也是類比的。錄音帶和黑膠唱片是類比媒體的兩個例子,磁帶曾被大量使用過,直到最近才轉而由發燒友正在風靡使用的黑膠唱片。

然而,在媒體上以類比方式錄製音訊對錄製信息的質量造成了嚴重限制。此外,它開始在日益數位化的世界中變得不相容。這就是數位音訊的用武之地。

4位元 PCM 編碼

類比音訊信號可以表示為簡單的連續正弦波。為了將這種類比信號表示到離散數位域中,使用了一種稱為脈衝編碼調製或 PCM 的技術。今天,我們消費的絕大多數數位音訊都使用這種方法。

脈衝編碼調製(Pulse-code modulation),或較新的線性脈衝編碼調製 (LPCM),通過對上述類比正弦波在時間和幅度上取離散樣本來工作。這種類比數位轉換的質量取決於採集樣本的頻率(採樣率)和可用於表示每個樣本的可能數位值的數量(位元深度)。從理論上講,這些值越高,數位信號就越能代表原始類比音訊。

因為樣本是在連續信號的離散點上獲取的,所以需要一個稱為量化的過程來填補空白,該過程使用四捨五入和截斷等技術。但是,此過程會增加噪聲,並且轉換後的信號中的噪聲量與其位元深度成反比。因此,增加數位信號的位元深度起到降低本底噪聲的作用,從而增加動態範圍。

當然,我們今天聽到的大多數數位音訊並不充滿背景噪音。這是因為一種稱為抖動(Dithering)的巧妙技術。抖動用我們選擇的噪聲模式替換量化過程結果的自然噪聲模式。這使我們能夠獲得我們想要的噪聲以及我們想要它在頻譜中的位置。通過抖動,我們可以用更微妙、更一致的噪聲替換量化噪聲,該噪聲更小,並將其轉移到我們耳朵不太敏感的頻率響應部分。

量化噪聲(Quantization noise)

說到頻率響應,我們的耳朵對 20Hz 到 20,000Hz 範圍內的音波很敏感。這是一個相當大的數量,這意味著大多數人的範圍都低於這個範圍,尤其是在頻譜的較高區域。此外,隨著年齡的增長,這個範圍自然會降低,您開始聽到的高頻範圍越來越少。但是為了我們的討論,讓我們只使用一般的 20-20,000Hz 範圍。

為了確保錄音中的音訊​​覆蓋至少 20,000Hz 的頻率,採樣率必須至少是其兩倍,這是由Nyquist-Shannon採樣定理決定的。這樣做是為了避免在將數位信號轉換回類比信號進行播放時出現混疊。這意味著要達到 20,000Hz 或 20kHz,您需要至少 40kHz 的採樣率。

當今數位音訊的標準是音訊 CD,它在未壓縮的 LPCM 音訊中以 44.1kHz 的採樣率使用16位元信息。儘管已有40多年的歷史,但它仍然被認為是數位音訊的黃金標準,也是我們用來比較其他標準的標準,例如有損壓縮音訊和高解析音樂。

然而,與 CD 音訊一樣好,時至今日,由於文件較大,串流式傳輸或下載並不是特別方便。這個問題在網路和線上音樂的早期尤為嚴重,因為當時的網路速度要慢得多。這導致了壓縮音訊的發明,最終佔領了音訊世界。

壓縮是計算中用於減小文件大小的常用技術。當您創建 ZIP 文件時,您可以有效地壓縮它以佔用更少的磁碟空間。然而,ZIP 是無損壓縮的一個例子,它可以實現更小的尺寸,但不會太大。要看到真正的好處,您需要有損。

現在,如果您的壓縮應用程式在創建 ZIP 文件時開始丟棄隨機數據,您可能不會對此感到滿意。但是,音訊的工作方式不同。即使是標準的CD音訊也有很多人耳通常無法感知的信息,這取決於聽力的人和他們可能使用的設備。這使得通過只丟棄那些不那麼重要的位元來輕鬆壓縮它。

早期的壓縮技術並不是那麼好。我們都記得舊的 MP3 文件,即使在不太完美的設備上收聽時,也有非常明顯的壓縮失真。你甚至不需要知道什麼是壓縮失真,你可以聽到它,因為它是多麼明顯。

隨著時間的推移,情況有所改善。我們有更好、更高效的編解碼器,可以在更小的空間內儲存更多的數據。更重要的是,我們獲得了更好的編碼器,因此可以更有效地打包數據。今天,有損壓縮音訊無處不在。每個音樂串流媒體服務都有它,每個視訊串流媒體服務都有它,甚至有聲讀物和Podcast等其他格式也使用它。您錄製的每個智慧手機視訊都有壓縮音訊。大多數人甚至沒有意識到他們的音樂是壓縮的,即使他們過去碰巧聽過原版,這已經足夠了。它只是有效。

這讓我們進入下一個主題……

什麼是無損音訊,我為什麼要關心?

我將立即澄清這一點:無損並不意味著未壓縮。人們經常互換使用這些術語,它們絕對不是同一回事。

如前所述,您可以以丟棄某些數據的方式壓縮內容以實現顯著更小的文件大小,或者您可以以保留所有數據的方式壓縮內容以相對較小地減少文件大小。後者是無損壓縮。

無損音訊是使用保留原始文件中所有數據的音訊壓縮技術。結果是與原始未壓縮文件相比,文件更容易通過網路串流式傳輸或下載,儘管與有損壓縮相比,它仍然可能相當大。

Tidal 是最早提供無損串流媒體的服務之一

這樣做的好處應該很明顯。儘管多年來有損壓縮技術已經改進到即使使用現代設備大多數人也無法區分無損和有損音訊的地步,但它仍然不是原始文件。這意味著對於那些聽力非常好、設備良好並且能夠辨別有損和無損音訊之間區別的人,或者只是為了存檔目的而希望原始文件保持不變的人,您現在可以選擇收聽無損版本。

發明有損編解碼器的主要原因是使它們更容易在 Internet 上分發。但是隨著全球大多數地方的頻寬不斷增加、計算設備速度更快以及儲存空間普遍增加,在此過程中可以更輕鬆地使用原始音訊而不會丟失任何數據。串流媒體也讓儲存問題變得無關緊要,因為音樂不再需要存儲在本地,可以隨選串流式傳輸。

即使你不一定有很好的聽力,知道如何在良好的音訊中尋找什麼,或者有很好的設備來幫助你進行搜索,但恰好有非常快的網路,沒有數據上限,為什麼會你聽壓縮音訊嗎?如果您可以像使用有損音訊一樣使用無損音訊,為什麼要選擇有損音訊?

Amazon最近通過 Music HD 進入了無損音訊遊戲

這幾乎就是無損音訊背後的基本原理。實際上,它不一定是更好的音訊,而只是原始音訊,因為它會在多年前出現在音訊 CD 上。是的,在某種程度上,我們又回到了音訊 CD,看到無損音訊以這種方式被大肆宣傳很奇怪,從技術上講,它通常只是 CD 音訊,除非沒有 CD。有時事情會如此運作的,這很有趣。

儘管如此,無損音訊不一定是 CD 音訊。當它在規格上與 CD 音訊相似時,您會看到公司稱其為"CD質量"音訊。當然,通常它只是意味著 16位元、44.1kHz 的音訊,但當在無損環境中使用時,意味著它只是您在實際音訊CD上找到的音訊。

但是對於某些人來說,CD質量已經不夠好了。這就是我們來到數位音訊最終魔王的地方。

高解析音訊 (High-resolution audio)

與上一章節一樣,我將以澄清開始這一章節。高解析不代表無損,無損不代表高解析。高解析可以是有損或無損格式。無損音訊可以是低解析或高解析。兩者是截然不同的。

Apple 將在與 CD 質量無損文件相同的無損 ALAC 編解碼器中提供其高解析曲目。Amazon沒有指定其編解碼器,但也為其高解析和 CD 質量的文件提供無損音訊。另一方面,Tidal 在無損 FLAC 中提供其 CD 質量的曲目,但在 FLAC 容器內的有損 MQA 編解碼器中提供高解析曲目。

那麼什麼是高解析音訊呢?為此,我們必須回到我們的老朋友——位元深度和採樣率。高解析只是有更多這些;更多位元,以及更多樣本。

Amazon Music HD 規格

高解析通常具有至少 24 位元的動態範圍和 88.2kHz 的採樣率,但在某些情況下可以高達 192kHz 甚至 384kHz。

高解析音訊有時也稱為高清晰度音訊(HD audio)。然後還有 Hi-Res Audio,這是一個Sony品牌,其他人可以授權以表明他們的設備支援高解析音訊,但這不是必需的,您可以擁有沒有此品牌的高解析音訊硬體。

從 Super Audio CD 時代開始,高解析音訊已經存在一段時間了。問題是,大多數人——包括發燒友和工程師——似乎無法就高解析是有用的東西還是只是誇大達成一致意見。音訊 CD 使用的 16 位元、44.1kHz 的標準紅皮書規範不僅涵蓋了人類平均聽力的全部內容,而且以一種實際上很難改進的方式實現了這一點。

我們來看看高解析音訊帶來的第一個優勢,即更高的位元深度。當您減少類比數位轉換的位元深度時,您會在量化過程中添加更多噪聲,而此時必須將其轉換回類比。通過增加位元深度,您自然會減少噪聲,從而增加動態範圍。

然而,即使使用未抖動的 16位元,您也可以獲得 96dB 的動態範圍,這非常接近人類聽覺的極限 (120dB),而 24位元 (144dB) 提供的額外餘量遠遠超出它甚至超過了大多數設備的限制。換句話說,你聽不到。

其次,即使在 16位元信號中,抖動等巧妙的技術也可以幫助減少和塑造噪聲,這樣除了精密設備之外,任何東西都聽不到它。通過減少和重塑可聽範圍內的噪聲,可以輕鬆地使抖動的 16位元信號的動態範圍超過 120dB。這意味著就所有實際目的而言,16位元對於人耳來說是完全足夠的。

高解析的另一個優勢是更高的採樣率。192kHz 採樣率意味著音訊可以具有高達 96kHz 的頻率響應上限。正如我已經提到的,人類只能聽到高達 20kHz 的聲音,這也只有那些在他們生命的黃金時期擁有完美聽力的人才能聽到。大多數人的頻率響應甚至比這還要低。

要使音訊具有超出人類可聽範圍的頻率,就像讓電視顯示可見範圍之外的光一樣。您可以聽到 96kHz 的聲音,幾乎與您看到的X光射線一樣多。也就是說,完全沒有。

必須以如此高的頻率再現音訊也會給設備和發聲單體帶來壓力,從而引入額外的失真。這種失真絕對是在可聽範圍內,這意味著您正在為了你無法聽到的聲音來扭曲您可以聽到的聲音。

有些人認為,超出人類聽覺範圍的頻率會對我們能聽到的頻率產生影響,因此擁有這些額外頻率可以改善可聽到位元的聲音。然而,對此並沒有真正的共識。

Tidal 使用 MQA,這是一種有損編解碼器,採用獨特的折疊算法來打包更多數據

問題是,更高的位元深度和更高的採樣率都有優勢,但這主要是在製作音樂時。就像處理 RAW 圖像一樣,處理具有更高位元深度的音軌可以更輕鬆地處理和調整級別。主要優點是較低的本底噪聲,在對多個軌道進行分層時可以累加,因此如果所有軌道都是 24位元或更高,那麼平均本底噪聲仍然可以非常低。採樣率和它提供的更高頻率響應也是如此。但是一旦您完成了曲目的創作,您就可以將其導出為 16位元、44.1kHz,並且仍然可以獲得完美的輸出。

很難明確地說高解析是否對人類僅僅聽音樂有切實的好處。大多數聲稱聽到不同之處的人也可能只是在聽不同版本的曲目;許多以高解析音訊發布的音樂都經過重新製作,這可以使聲音大不相同。這裡的不同之處在於母帶製作,這在當時通常是乏善可陳的,以及為什麼花了好幾天重新製作後重新發行了很多音樂。即使在標準 CD 音訊中,這聽起來也更好,因此請確保您在進行任何比較時在兩種格式中使用相同的母版。

高解析音訊在早期也得到了不好的評價,因為那些跟上潮流的公司——無論是音樂發行服務還是銷售硬體的公司——都為高解析支援支付了高額費用。早些時候,大多數數位類比轉換器 (DAC) 最多僅支援 16位元、48kHz。即使在今天,這也是您可以在世界上大多數智慧手機和個人電腦上找到的內容。這就是為什麼 Apple 還建議在 Apple Music 上播放高解析文件時使用外部 DAC。

話雖如此,但在過去的幾年裡,情況有了很大的改善。如今,您甚至可以獲得能夠解碼 24位元、192kHz 信號的廉價智慧手機。用於桌上型機的高品質 DAC 現在比以往任何時候都便宜,您可以以 109 美元左右的價格購買像 Schiit Fulla (是的,這就是它的名字)以及出色的內置放大器。現在唯一的限制是能夠找到足夠的高解析音訊內容,因為它仍然相當有限。

空間音訊

Apple 在 Apple Music 上發布無損音訊的同時還增加了空間音訊(Spatial Audio)。具體來說,Apple 聲稱現在在 Apple Music 上支援帶有杜比全景聲 (Dolby Atmos) 的空間音訊。那麼這是什麼意思?

首先,讓我們討論一下杜比全景聲 (Dolby Atmos)。眾所周知,杜比擁有多個環繞聲編解碼器,並且是影院音訊領域的知名品牌之一。但是,傳統的環繞聲格式具有離散聲道支援,例如 5.1 或 7.1。這意味著在以這些格式製作音訊時,必需根據導演希望聲音出現的位置將音訊放置在聲道中。

杜比全景聲引入了基於物件的聲音而不是基於聲道的聲音。這意味著在母帶製作時,音訊工程師只需要將聲音放置在聽眾周圍的 3D 空間中,然後系統就會確定使用哪個揚聲器來重現該聲音。這也意味著 Atmos 理論上擁有無限數量的聲道,因為人們總是可以添加更多揚聲器來增加聲音的沉浸感,這是使用基於固定聲道的格式無法做到的。

Atmos 然後更進一步,為聲音添加了高度元素,這意味著您現在可以在您上方安裝揚聲器,並且可以將聲音編碼為從您頭頂上方發聲。這使得聲音更加身臨其境,因為它現在可以來自各個方向,類似於現實生活。

用於音樂的杜比全景聲 (Dolby Atmos) 的工作原理類似。它可以讓作曲家安排音樂,這樣當在帶有縱向聲道的環繞聲揚聲器設置上聆聽時,它的聲音就好像它來自你周圍一樣,從而將你包圍在聲音領域中,讓你感覺就像你自己在那裡一樣。您可以想像如何將其用於諸如現場表演錄音之類的事情。

然後,Apple 使用此杜比全景聲 (Dolby Atmos) 音軌並通過其稱為空間音訊的技術為其提供信息。與 Apple 設備配對時,空間音訊可通過 AirPods Pro 和 AirPods Max 用於視訊內容。在 iPhone 或 iPad 上播放杜比全景聲 (Dolby Atmos) 內容時,AirPods Pro/Max 將使用音軌中的數據來類比您周圍的 3D 聲音球體。此外,它還將使用這些 AirPods 型號上的加速計和陀螺儀,並跟踪您的頭部運動,以便音訊隨著您的頭部行動,就像在現實世界中一樣。

對於 Apple Music,Spatial Audio 的作用是讓聲音出現在你周圍,但沒有頭部跟踪位元。由於它不進行頭部跟踪,因此現在也可以在基本 AirPods 機型上運行。事實上,它適用於所有帶有 W1/H1 晶片的 AirPods 和 Beats 型號以及所有帶有立體聲揚聲器的 iPhone、iPad 和 Mac 型號的內置揚聲器。

現在的問題是,這聽起來是否有好處。我還沒有通過 Apple Music 體驗 Apple 的 Spatial Audio,但作為 Tidal 的長期訂閱者,環繞聲音樂有點糟糕。

這不是格式本身的問題,而是錄音的問題。您偶爾會遇到專為炫耀環繞聲音訊而設計的曲目,聽起來可能很酷。但是,你想聽的音樂,也就是錄音室發行的流行曲目的環繞聲混音,聽起來就不是很好。錄音室專輯尤其如此,它們最初設計為在普通立體聲揚聲器上播放,在聆聽環繞聲混音時聽起來很奇怪和混亂。就個人而言,我更願意聽標準的立體聲版本。

我可以看到這對於音樂會的現場錄音效果如何,但我沒有遇到過很多這樣的情況。最後,我對這項技術仍然有些樂觀,但如果你是一個沒有硬體來聽它的人,那麼別擔心,你不會錯過太多。

藍牙音訊呢?

到目前為止,我主要談論的是有線領域的音訊,但現在很多人在藍牙設備上聽音樂,無論是 AirPods 之類的藍牙耳塞式耳機、Sony WH-1000XM4 之類的藍牙耳機、藍牙揚聲器,還是 - 通過藍牙的汽車音訊。

然而,藍牙增加了額外的複雜性以及額外的妥協層。通過藍牙發送的所有音訊——我的意思是所有音訊——都被壓縮。今天可用的每一個藍牙編解碼器,無論是從 SBC 到 AAC、aptX、aptX HD、LDAC、LHDC 和三星可擴展編解碼器的基礎,都是有損編解碼器。另外要消除另一個流行的誤解,如果您的音樂是 AAC 格式,而您的藍牙耳機和設備使用 AAC 進行傳輸,則音樂仍會被壓縮和重新編碼,而不僅僅是按原樣發送。

AirPods Pro 使用有損 AAC 編解碼器進行音訊傳輸

這就是目前藍牙音訊的工作方式。它根本沒有現有編解碼器無損傳輸的頻寬,更不用說未壓縮的傳輸了。有可能出現如此高效的編解碼器,它可以在不丟棄任何內容的情況下打包所有原始數據,並且仍然設法通過藍牙的極小頻寬發送它,但這還沒有發生。

根據用於藍牙傳輸的編解碼器,您可以獲得相當不錯的結果,尤其是當您的藍牙編解碼器的比特率遠遠超過您的音訊文件的比特率時。但是,如果您正在收聽無損音訊,那麼您只會保留與藍牙編解碼器所能提供的信息一樣多的信息。儘管如此,在無損音訊的情況下,由於藍牙編解碼器正在處理完整的文件,因此結果可能比以有損方式重新壓縮同一文件兩次要好一些。你是否能注意到差異完全是另一回事。

結論

此頁面上有很多單詞,如果您有好奇心,它們可能會派上用場。但歸根結底,音樂不僅僅是產生它的點點滴滴的總和。聽音樂或任何音訊的目的是享受它。

對於一些像我這樣的人來說,分解音樂的技術方面並研究它的細節是聆聽體驗的一部分。我不記得上次聽一首音樂是什麼時候,並且沒有對錄音質量、編曲以及我使用的揚聲器或耳機如何再現所有這些內容進行潛意識記錄。我確保所有設備都正常工作,所有位元深度和採樣率都正確並與音源音訊匹配,並且音訊從源頭有一條乾淨的路徑,沒有任何可能影響最終交付的元素。

如果你像我一樣——或者像很多人一樣是一個更大的書呆子——那麼無損音訊和高解析音訊之類的東西適合你。有時,我們是否能分辨出差異對我們來說並不重要,但一切都是正確的,並且按我們喜歡的方式工作。人們仍然在購買並熱衷於有線耳機,使用外部 DAC 和放大器,儘管我們一直被告知這些天內置在我們個人電腦中的那些已經"足夠好",並且禁用了所有 EQ 和 DSP 效果。

如果你不是那樣,首先恭喜你,因為你是正常人。其次,你可以忽略這裡的一切,繼續像往常一樣聆聽和享受音樂。如果您想將其提升到一個新的水準,諸如無損和高解析之類的東西將始終存在。如果沒有,那也完全沒問題。重要的是你是否過得愉快。

文章來源:GSMARENA  作者:Prasad

原始文章標題:Understanding lossless, high-resolution, and spatial audio