piątek, 23 maja 2014

Jak opisać głośność? Wartości peak, RMS, DR i LUFS

W tym poście nie obędzie się bez kawałka teorii. Mniej zainteresowanych szczegółami cyfrowej dziedziny audio oraz wtajemniczonych odsyłam od razu do punktu Wartość DR.


Wartość peak

Już w ostatnim materiale wideo można było zauważyć, że wartość peak nijak ma się do głośności muzyki. Wielkość ta, nazywana wartością szczytową, opisuje maksymalną wartość sygnału. Zwiększanie 'szczytów' ma jednak swoją granicę - w dziedzinie cyfrowej jest to 0 dB FS (Full Scale)*. Próba przekroczenia tej granicy kończy się przesterowaniem sygnału, zwanym inaczej clippingiem**. Sygnały mające taką samą wartość peak mogą mieć różne głośności i odwrotnie - utwory mające różne wartości szczytowe mogą być tak samo głośne. Wynika z tego, że wartość peak nie nadaje się do opisu głośności.

Clipping objawiający się charakterystycznym 'płaskim szczytem' fali

Wartość RMS

Potocznie na RMS mówi się 'wartość średnia' i mimo że nie jest to fizycznie poprawne, dobrze intuicyjnie oddaje sens tej wielkości***. Po obejrzeniu poprzednich materiałów video można zauważyć, że RMS dużo lepiej koreluje z głośnością. Ma jednak jedną wadę - z definicji nie uwzględnia tego, jak człowiek percypuje dźwięki (np. krzywe równej głośności z poprzedniego wpisu).

Wartość DR

Tym 'wskaźnikiem' posługiwałem się także przy poprzednich materiałach demonstracyjnych (link). Wartość DR (Dynamic Range) jest to różnica pomiędzy wartością peak, a wartością RMS liczoną z 20% najgłośniejszej części utworu. Dlaczego tak chętnie posługuję się tą wartością? Ponieważ jest świetnym wskaźnikiem jak bardzo dany utwór został skompresowany i 'zlimitowany' w procesie masteringu. Im większa wartość DR tym większa różnica między wartością peak a RMS, tym 'cichszy' oraz bardziej dynamiczny materiał.
Program liczący wartości DR można za darmo pobrać tutaj (należy przescrollować w dół; program dostępny także jako wtyczka do odtwarzacza foobar2000).

Wynik skanowania utworu Telegraph Road zespołu Dire Straits przez wtyczkę Dynamic Range Meter w programie foobar2000


Kolejną ogromną zaletą tego wskaźnika jest dostępna przez internet baza danych (tworzona przez zwykłych słuchaczy) z wartościami DR dla konkretnych albumów - link. W ten sposób można wstępnie sprawdzić jakość płyty zanim się ją kupi. Warto też zwrócić uwagę na niektóre wydania "REMASTERED", które z reguły mają dużo niższe wartości DR niż oryginały.

Wartości DR dla płyty Master of Puppets, oryginał DR12, wersja remastered DR8-9


Jaka wartość DR zapewnia dobrze brzmiący album? Oczywiście nie jest to takie proste. Brzmienie to nie tylko dynamika, czy różnica wartości peak i RMS, to znacznie więcej. Zwłaszcza, że wartość DR obliczana jest dla 20% najgłośniejszego fragmentu utworu (80% może być dużo bardziej dynamiczne). Jednak z dużą dozą prawdopodobieństwa można powiedzieć, że płyta DR6 będzie miała już charakterystyczne dla nowych płyt ostre i płaskie brzmienie; DR5 będzie już mocno zniekształcona i przesterowana, natomiast DR4 i mniej - lepiej nie kupować.
Podsumowując Dynamic Range jest świetną miarą skompresowania materiału, lecz nie daje informacji o głośności - ten sam materiał audio ściszony o 5 dB będzie miał dokładnie taką samą wartość DR (o 5 dB zmniejszy się zarówno wartość peak jak i RMS, a więc ich różnica się nie zmieni).

LUFS

Najnowszym i najlepiej oddającym głośność wskaźnikiem jest LUFS (Loudness Unit Full Scale) wprowadzony już w Stanach Zjednoczonych do wyrównania głośności materiałów pojawiających się w telewizji (ludzie skarżyli się na większą głośność reklam od programów i filmów). Bierze on pod uwagę psychoakustyczne czynniki wpływających na ocenę głośności. Po analizie danego materiału dźwiękowego program dopisuje do niego informację o tym o ile dB należy ten materiał ściszyć aby miał głośność równą -23 LUFS (dla telewizji w Stanach Zjednoczonych).

Czy w obliczu wprowadzenia takich norm w USA wojna głośności nadal ma jakikolwiek sens? Jak w prosty sposób wyrównać głośność odtwarzanej muzyki na swoim komputerze? O tym już w następnym wpisie.

* Skala dB FS jest ujemna, od minus nieskończoności aż do 0. Zakodować dodatnie wartości można tylko przy użyciu formatu 32-bit floating point używanego obecnie przez większość programów do obróbki dźwięku. Jednakże jakość płytowa 16 bit nie pozwala przekroczyć 0 dB FS.

** Clipping prowadzi do powstania znacznych zniekształceń w sygnale, więcej o clippingu już wkrótce.

*** RMS to inaczej wartość skuteczna; jest to amplituda sygnału stałego w czasie, który ma taką samą moc jak sygnał zmienny. Wzór na wartość skuteczną sygnału x w czasie T:

Brak komentarzy:

Prześlij komentarz