Usłysz różnicę: 2014

poniedziałek, 1 grudnia 2014

Miks a mastering

W poniższym poście opiszę dwa procesy, którym poddawany jest materiał dźwiękowy od rejestracji aż po wypalenie na płycie CD. Czym jest miks, a czym mastering? Jakie są różnice między tymi procesami? Czy lepiej zlecić je tej samej osobie? Na te wszystkie pytania postaram się odpowiedzieć poniżej.

Miks

Zespół zarejestrował materiał. Każdy z instrumentów zapisany jest w osobnym pliku. Zatem, aby z tych pojedynczych ścieżek otrzymać utwór, należy je do siebie dodać zachowując odpowiednie proporcje (głośności). Właśnie to, w dużym uproszczeniu, nazywamy miksem.

Przykładowy miks, na różnych ścieżkach znajdują się poszczególne instrumenty m. in. elementy perkusji, bas, gitary, wokale.

Miks to nie tylko ustalenie proporcji. W tym miejscu kreuje się także przestrzeń za pomocą panoramy (lewo-prawo) oraz dodaje wszelkie efekty - od bardzo zauważalnych (jak np. efekt starego radia czy płyty winylowej) do dyskretnych (delikatny pogłos, zmiana dynamiki lub subtelna korekcja). To wszystko sprawia, że miks jest bardzo skomplikowanym procesem, nad którym można spędzić dużo czasu:

Po skończonym miksie utwór brzmi już bardzo dobrze, instrumenty są odpowiednio zbalansowane, efekty nałożone... w takim razie co jeszcze można zrobić z takim materiałem? I ważniejsze pytanie - w jakim celu?

Mastering

Można powiedzieć, że miks z pojedynczych instrumentów (ścieżek) tworzy utwór, natomiast mastering z poszczególnych utworów konstruuje album.

Zdarza się, że nie wszystkie piosenki nagrywane są w tym samym studiu. Czasami za miks odpowiadają różne osoby. W takich przypadkach bardzo ważne jest odpowiednie zbalansowanie materiału, który może mocno różnić się brzmieniowo, tak, aby album tworzył spójną całość. W tym celu każdy utwór poddaje się osobnej obróbce. To tutaj zyskuje on swoją ostateczną głośność (z tego powodu wiele osób uważa mastering za proces odpowiedzialny za zepsucie brzmienia dzisiejszej muzyki, zapominając o pozostałych jego funkcjach). Dobierane są także przerwy między poszczególnymi utworami. Cechą charakterystyczną dla masteringu jest praca nad jednym plikiem stereo* - wykonanym wcześniej miksem.

Miks i mastering - razem czy osobno?

Kolejnym zadaniem masteringu jest kontrola miksu. Chodzi tutaj o to, aby utworu posłuchała osoba 'z zewnątrz', nie naznaczona godzinami siedzenia przy miksie - tak długa praca może sprawić, że pewne szczegóły umykają osobie wykonującej miks. Potrzebne jest tak zwane 'świeże ucho'. Oprócz tego odsłuch w studiu masteringowym (na innym sprzęcie i w innym pomieszczeniu) może wychwycić błędy w miksie powstałe przez np. akustykę pomieszczenia lub gorsze głośniki.

Z tego powodu najlepiej gdy te dwa procesy wykonywane są przez dwie niezależne osoby. Z wielu przyczyn nie zawsze tak się dzieje. W takich przypadkach element kontroli materiału zostaje zaniedbany.

Mastering ... jednego utworu?

Pisałem o tym, że mastering to proces tworzenia albumu. Czy można w takim razie zrobić mastering jednej piosenki? Oczywiście że tak! Dzisiejsze realia sprawiają, że utwór nie 'zmasterowany' jest za cichy. Bez obróbki miksu jako całości otrzymany materiał zawsze będzie dużo cichszy niż utwory, których słuchamy na co dzień. Oprócz samego podniesienia głośności pozostałe elementy obróbki materiału wykorzystywane w masteringu mogą dać pozytywny efekt brzmieniowy (a przecież chodzi o to, aby ostateczny materiał brzmiał jak najlepiej). Zapraszam do obejrzenia poniższego filmiku:

* - najczęściej tak to wygląda, choć czasem wykonuje się tzw. mastering na grupach, gdzie na poszczególnych ścieżkach zgrane są grupy instrumentów, na przykład perkusja z basem, instrumenty rytmiczne, wokale, chórki. Taki system pracy stosuje się gdy jest pewien problem w miksie i łatwiej właśnie w ten sposób sobie z nim poradzić. W takich przypadkach mastering zbliża się bardziej do miksu.

wtorek, 16 września 2014

Zwiększanie głośności w praktyce cz. II - poznajmy kompresor

W poprzednim wpisie przedstawiłem dwa najprostsze narzędzia zwiększające głośność - clipper i limiter. Głównym celem tego posta będzie przybliżenie działania kompresora, który może być także clipperem lub limiterem. Jak to możliwe?

Kompresor

Kompresor to jedno z najbardziej uniwersalnych narzędzi wykorzystywanych podczas pracy z materiałem dźwiękowym. Zmieniając ustawienia jego parametrów* można zwiększyć lub zmniejszyć atak instrumentu, wpływać na ich wybrzmiewanie oraz wyrównywać głośność poszczególnych dźwięków.

Kompresor Dyn3, podstawowe wyposażenie programu ProTools

Jak działa kompresor?

Gdy sygnał (dźwięk) przekroczy pewien próg (threshold) kompresor zmniejsza jego amplitudę, inaczej mówiąc, ścisza go. Im głośniejszy jest sygnał tym mocniej zostaje stłumiony. Z tego opisu wynika, że zadaniem kompresora jest zmniejszenie różnicy między najgłośniejszym a najcichszym fragmentem sygnału, czyli zawężenie dynamiki. Nie jest to jednak jedyna jego funkcja**.

Skutkiem ubocznym stosowania kompresora jest tak zwane pompowanie, czyli sytuacja w której słychać zmiany głośności utworu, słychać 'działanie kompresora'. Można odnieść wrażenie, że muzyka się 'dusi'. Pompowanie najczęściej pojawia się, gdy kompresor pracuje zbyt mocno (duże wartości tłumienia) lub jego parametry są źle dobrane. Posłuchajmy przykładu:

Efekt pompowania wykorzystywany jest w muzyce elektronicznej - ściszanie się podkładu na uderzenia 'stopy' to bardzo powszechny zabieg (tutaj przykład). Podkreśla to rytm utworu oraz sprawia wrażenie bardzo mocnego uderzenia, 'zasysającego' wszystkie inne dźwięki. Między innymi z tych powodów kompresor stosuje się także w pozostałych gatunkach muzyki, lecz znacznie delikatniej - tak, aby jego działanie nie było bezpośrednio słyszalne, lecz raczej 'wyczuwalne'.

Kompresor wielopasmowy

Jeszcze bardziej skomplikowanym narzędziem jest kompresor pasmowy, który składa się z kilku niezależnych kompresorów działających na różnych pasmach częstotliwości dźwięku. Jego zaletą jest to, że pomimo mocnego działania (dużego tłumienia) zjawisko pompowania jest mniej słyszalne. Jak łatwo się domyślić kompresor wielopasmowy jest chętnie wykorzystywany w 'gorącym masteringu' do zwiększania głośności, choć nie jest to jego jedyne zastosowanie.

Podsumowując...

Jak widać każde z narzędzi wykorzystywanych do zwiększania głośności ma swoje wady. Ich umiejętne połączenie pozwala uzyskać głośny materiał i jednocześnie nie zniszczyć doszczętnie jakości dźwięku. Jednak chcąc osiągnąć wysoką głośność trzeba zapłacić jakąś cenę - albo będzie to pompowanie, albo 'bzyczenie', albo jeszcze coś innego. I czasem płacić trzeba - Ted Jensen zarzeka się, iż nie chciał zniszczyć płyty Death Magnetic. To zespół nalegał, aby była ekstremalnie głośna.
W dzisiejszych realiach niewielu muzyków ma tyle odwagi by wydać 'cichą płytę'. Większość woli nie ryzykować i trzymać głośnościowe standardy. Niestety... bo cierpi na tym muzyka oraz jej słuchacze.

* Główne parametry kompresora to: próg zadziałania (threshold), nachylenie kompresji (ratio), czas ataku (attack) i czas powrotu (release). Wielkość tłumienia określa nachylenie kompresji - im większe, tym mocniej sygnał przekraczający próg jest tłumiony. Czas ataku to czas mierzony od momentu przekroczenia przez sygnał progu zadziałania do osiągnięcia docelowego tłumienia kompresora. Im dłuższy tym łagodniejsze działanie. Czas powrotu jest mierzony od momentu, gdy amplituda sygnału wejściowego spadnie poniżej wartości progu, do osiągnięcia zerowego tłumienia przez kompresor.

** Jeśli kompresor będzie miał zerowy czas ataku oraz zerowy czas powrotu, a nachylenie jego kompresji wyniesie nieskończoność do jednego otrzymujemy opisany poprzednio clipper. Natomiast jeśli kompresor będzie miał bardzo krótki czas ataku (zbliżony do 0) i czas powrotu równy kilku milisekundom, a nachylenie jego kompresji będzie bardzo duże, otrzymamy limiter - delikatniejszy w brzmieniu, mniej radykalnie działający na sygnał. Jak widać obydwa narzędzia przedstawione w poprzednim wpisie były szczególnymi typami kompresora.
Kolejnym zastosowaniem kompresora może być zmniejszenie ataku jakiegoś instrumentu (np. basu granego kostką lub gitary akustycznej). Stosuje się wtedy krótkie czasy ataku i dość duże nachylenie kompresji. Za pomocą kompresora można także zwiększyć atak np. elementów perkusji przez wydłużenie czasu ataku do kilkudziesięciu milisekund.
Dłuższe czasy zarówno ataku jak i powrotu stosowane są także przy pracy z całym materiałem, na przykład w masteringu.

czwartek, 3 lipca 2014

Zwiększanie głośności w praktyce cz. I

W tym wpisie przedstawię narzędzia wykorzystywane w ostatnim etapie masteringu w celu zwiększenia średniego poziomu muzyki. Oczywiście moim celem nie jest zachęcanie do nadużywania tych metod - kłóciłoby się to z ideą mojego bloga. Chcę pokazać jakie są skutki stosowania tych narzędzi oraz jak wpływają one na brzmienie.

Normalizacja

Pierwszym sposobem na zwiększenie głośności materiału jest normalizacja. Jest to proces, który w żaden sposób nie wpływa na brzmienie poza tym, że zwiększa głośność. Jak to się dzieje? Program skanuje cały plik szukając największej wartości chwilowej sygnału (peak), a później o tą wartość podnosi głośność materiału.
Przykład: utwór ma maksymalną wartość peak -2.5 dB FS, zatem program zwiększa głośność całego materiału o 2.5 dB FS. Dzięki temu nowy plik z utworem ma maksymalną wartość peak 0 dB FS, czyli największą jaką może mieć plik audio (więcej o wartości peak tutaj).

Widać, że natrafiamy na granicę, której za pomocą normalizacji nie da się przeskoczyć - 0 dB FS. Dalszy proces zwiększania głośności (średniego poziomu sygnału) wiąże się z ograniczaniem dynamiki, czyli różnicy pomiędzy najgłośniejszym a najcichszym dźwiękiem, aby pokonać granicę 0 dB FS.

Limiting (ograniczanie)

Limiter jest narzędziem wykorzystywanym w studiu przede wszystkim do zwiększania głośności. Jak za jego pomocą można przekroczyć 0 dB FS?
Największe wartości sygnału występują zazwyczaj dla uderzeń perkusji - tom tomów, werbla czy stopy. Limiter scisza te uderzenia, dzięki czemu później (jak w normalizacji) może zwiększyć głośność całości. Proces ten, w odróżnieniu od normalizacji, wpływa na brzmienie materiału. O ile dla małych wartości tłumienia (kilka dB) jest praktycznie niezauważalny, to gdy działa zbyt mocno wpływa na osłabienie ataku zwłaszcza elementów perkusji. Wartość o jaką limiter ścisza najgłośniejsze fragmenty sygnału to gain reduction (GR).

Poniższy filmik przedstawia wykorzystanie limitera, jego wpływ na brzmienie w zależności od ustawień.

Clipping

Jest to jeden z najordynarniejszych sposobów na ograniczenie wartości sygnału. Zasada działania jest prosta: jeśli sygnał ma większą wartość niż próg zadziałania, nadaj mu wartość równą temu progowi. Skutkami clippingu są tak zwane flat tops (płaskie szczyty). Taki sposób zwiększania głośności ma bardzo dużą wadę - zniekształcenia. Przybliżanie kształtu sygnału do przebiegu prostokątnego (wskutek wypłaszczania jego maksimów) wiąże się ze zwiększeniem ilości wysokich
częstotliwości, co bardzo wyraźnie słychać.

Darmowy clipper GClip

Poniżej filmik przedstawiający brzmienie clippingu.

Clipping ma jednak także swoje zalety. W porównaniu z limitingiem zachowuje dużo więcej 'uderzenia', 'mocy'. Poniżej przedstawiam film wykonany przez Iana Shepherda, który dokonuje porównania limitera z clipperem o różnych ustawieniach.

Jak widać nie ma jednego doskonałego narzędzia stosowanego w celu zwiększenia poziomu średniego sygnału. Limiting osłabia brzmienie, czyni je bardziej delikatnym. Natomiast clipping zachowując agresywność dodaje dużą ilość zniekształceń. Oczywiście aby uzyskać najlepsze rezultaty trzeba skorzystać z kilku narzędzi, ale o tym w następnym wpisie.

środa, 4 czerwca 2014

Replay gain i "gorący mastering"

Wielokrotnie wspominałem o tym, jak ważna przy odsłuchu muzyki jest głośność. Powstaje zatem pytanie praktyczne: jak w łatwy sposób wyrównać głośności odsłuchiwanej muzyki na swoim komputerze?
Najprościej zaopatrzyć się w darmowy odtwarzać foobar2000 lub winamp i skorzystać z funkcji Replay gain. Skanuje ona wybrane utwory i wyrównuje ich głośności. Nie ingeruje to w sam dźwięk, zapisuje tylko informację (jako metadata) o tym o ile dB odtwarzacz ma ściszyć utwór podczas odtwarzania. W razie potrzeby informację tę można później w łatwy sposób usunąć. Obliczanie głośności uwzględnia wspominane już na tym blogu krzywe jednakowej głośności. Dostępne są dwie opcje skanowania utworów: album oraz track.

Track - wersja track skierowana jest do osób słuchających wybiórczo pojedynczych utworów różnych wykonawców lub z różnych płyt. Dzięki niej wszystkie utwory odtwarzane jeden po drugim będą miały w przybliżeniu taką samą głośność.

Album - osobiście polecam tą wersję, gdyż skanuje ona głośność całego albumu i nadaje taką samą wartość wzmocnienia wszystkim utworom. Jest to szalenie ważne dla osób, którzy częściej słuchają całych płyt, ponieważ zachowane są takie same proporcje pomiędzy poszczególnymi utworami jak oryginalnie, a różne albumy mają zbliżoną głośność. Poniżej przykład.

Powiedzmy, że mamy na płycie obok siebie dwa utwory - ciężki rockowy numer a zaraz po nim spokojną balladę. Najprawdopodobniej ballada jest cichsza i delikatniejsza od poprzedzającego ją utworu. W przypadku skanowania z opcją track głośności tych dwóch utworów zostaną wyrównane. Oznacza to, że ballada będzie przez Replay gain bardziej wzmocniona niż poprzedni utwór, przez co jej delikatność (która była intencją wykonawcy) całkowicie przepadnie.
Używając opcji album obu utworom przypisana zostanie taka sama wartość wzmocnienia (wynikająca ze wzmocnienia całego albumu), dzięki czemu oryginalny balans pomiędzy ostrym utworem a balladą zostanie zachowany.

Innymi słowy - wersja track zdecydowanie niszczy 'jedność' płyty, ale świetnie nada się do odtwarzania muzyki na imprezie! Osobiście najczęściej słucham muzyki albumami, dlatego polecam opcję ablum.

Dlaczego gorący mastering nie ma sensu?

W ostatnim poście pisałem o standardzie wprowadzonym do amerykańskiej telewizji. Narzucony próg -23 LUFS oznacza w przybliżeniu wartość DR23. Replay gain jest nieco mniej surowy - wyrównuje głośność do poziomu około -19 dB RMS, standard Spotify to około -15 dB RMS. Także iTunes stosuje algorytmy wyrównujące głośność. Co z tego wynika? W przypadku emisji w amerykańskiej telewizji materiał DR6 (przeciętny album wydany po 1997 roku) będzie ściszony o 17 dB! W pozostałych przypadkach wielkości te są odpowiednio mniejsze.

Dwa utwory wyrównane do -23 LUFS, z lewej Amy Winehouse Stronger than me z płyty Frank (2003), z prawej Toto 'Till the end z płyty Farenheit (1986)

Jak widać na powyższym obrazku im głośniejszy będzie materiał tym więcej będzie niewykorzystanego zakresu - headroom'u:
Stronger than me DR7, niewykorzystany zakres 14,9 dB,
'Till the end DR16, niewykorzystany zakres 7,4 dB.
Efekty pokazałem już w pierwszym wpisie, jednak przypomnę jeden filmik:

Jaki jest zatem sens 'gorącego masteringu', skoro coraz powszechniej stosuje się wyrównywanie głośności, a w mediach staje się to obowiązkiem? Przecież kwestią czasu jest przeniknięcie amerykańskiego telewizyjnego standardu do Europy, a także zastosowanie go w rozgłośniach radiowych. Wydaje się, że nie ma to sensu, choć nadal powstają produkcje skażone myśleniem "głośniejszy=lepszy".

W następnym poście napiszę o tym jakim procesom poddaje się muzykę, aby otrzymać głośne rezultaty.

piątek, 23 maja 2014

Jak opisać głośność? Wartości peak, RMS, DR i LUFS

W tym poście nie obędzie się bez kawałka teorii. Mniej zainteresowanych szczegółami cyfrowej dziedziny audio oraz wtajemniczonych odsyłam od razu do punktu Wartość DR.

Wartość peak

Już w ostatnim materiale wideo można było zauważyć, że wartość peak nijak ma się do głośności muzyki. Wielkość ta, nazywana wartością szczytową, opisuje maksymalną wartość sygnału. Zwiększanie 'szczytów' ma jednak swoją granicę - w dziedzinie cyfrowej jest to 0 dB FS (Full Scale)*. Próba przekroczenia tej granicy kończy się przesterowaniem sygnału, zwanym inaczej clippingiem**. Sygnały mające taką samą wartość peak mogą mieć różne głośności i odwrotnie - utwory mające różne wartości szczytowe mogą być tak samo głośne. Wynika z tego, że wartość peak nie nadaje się do opisu głośności.

Clipping objawiający się charakterystycznym 'płaskim szczytem' fali

Wartość RMS

Potocznie na RMS mówi się 'wartość średnia' i mimo że nie jest to fizycznie poprawne, dobrze intuicyjnie oddaje sens tej wielkości***. Po obejrzeniu poprzednich materiałów video można zauważyć, że RMS dużo lepiej koreluje z głośnością. Ma jednak jedną wadę - z definicji nie uwzględnia tego, jak człowiek percypuje dźwięki (np. krzywe równej głośności z poprzedniego wpisu).

Wartość DR

Tym 'wskaźnikiem' posługiwałem się także przy poprzednich materiałach demonstracyjnych (link). Wartość DR (Dynamic Range) jest to różnica pomiędzy wartością peak, a wartością RMS liczoną z 20% najgłośniejszej części utworu. Dlaczego tak chętnie posługuję się tą wartością? Ponieważ jest świetnym wskaźnikiem jak bardzo dany utwór został skompresowany i 'zlimitowany' w procesie masteringu. Im większa wartość DR tym większa różnica między wartością peak a RMS, tym 'cichszy' oraz bardziej dynamiczny materiał.
Program liczący wartości DR można za darmo pobrać tutaj (należy przescrollować w dół; program dostępny także jako wtyczka do odtwarzacza foobar2000).

Wynik skanowania utworu Telegraph Road zespołu Dire Straits przez wtyczkę Dynamic Range Meter w programie foobar2000

Kolejną ogromną zaletą tego wskaźnika jest dostępna przez internet baza danych (tworzona przez zwykłych słuchaczy) z wartościami DR dla konkretnych albumów - link. W ten sposób można wstępnie sprawdzić jakość płyty zanim się ją kupi. Warto też zwrócić uwagę na niektóre wydania "REMASTERED", które z reguły mają dużo niższe wartości DR niż oryginały.

Wartości DR dla płyty Master of Puppets, oryginał DR12, wersja remastered DR8-9

Jaka wartość DR zapewnia dobrze brzmiący album? Oczywiście nie jest to takie proste. Brzmienie to nie tylko dynamika, czy różnica wartości peak i RMS, to znacznie więcej. Zwłaszcza, że wartość DR obliczana jest dla 20% najgłośniejszego fragmentu utworu (80% może być dużo bardziej dynamiczne). Jednak z dużą dozą prawdopodobieństwa można powiedzieć, że płyta DR6 będzie miała już charakterystyczne dla nowych płyt ostre i płaskie brzmienie; DR5 będzie już mocno zniekształcona i przesterowana, natomiast DR4 i mniej - lepiej nie kupować.
Podsumowując Dynamic Range jest świetną miarą skompresowania materiału, lecz nie daje informacji o głośności - ten sam materiał audio ściszony o 5 dB będzie miał dokładnie taką samą wartość DR (o 5 dB zmniejszy się zarówno wartość peak jak i RMS, a więc ich różnica się nie zmieni).

LUFS

Najnowszym i najlepiej oddającym głośność wskaźnikiem jest LUFS (Loudness Unit Full Scale) wprowadzony już w Stanach Zjednoczonych do wyrównania głośności materiałów pojawiających się w telewizji (ludzie skarżyli się na większą głośność reklam od programów i filmów). Bierze on pod uwagę psychoakustyczne czynniki wpływających na ocenę głośności. Po analizie danego materiału dźwiękowego program dopisuje do niego informację o tym o ile dB należy ten materiał ściszyć aby miał głośność równą -23 LUFS (dla telewizji w Stanach Zjednoczonych).

Czy w obliczu wprowadzenia takich norm w USA wojna głośności nadal ma jakikolwiek sens? Jak w prosty sposób wyrównać głośność odtwarzanej muzyki na swoim komputerze? O tym już w następnym wpisie.

* Skala dB FS jest ujemna, od minus nieskończoności aż do 0. Zakodować dodatnie wartości można tylko przy użyciu formatu 32-bit floating point używanego obecnie przez większość programów do obróbki dźwięku. Jednakże jakość płytowa 16 bit nie pozwala przekroczyć 0 dB FS.

** Clipping prowadzi do powstania znacznych zniekształceń w sygnale, więcej o clippingu już wkrótce.

*** RMS to inaczej wartość skuteczna; jest to amplituda sygnału stałego w czasie, który ma taką samą moc jak sygnał zmienny. Wzór na wartość skuteczną sygnału x w czasie T:

sobota, 10 maja 2014

Fizyczne podstawy wojny głośności

Gdy zaczynałem zajmować się nagraniami oraz miksem materiału, w kółko spotykałem się z jednym problemem. Po wielu godzinach spędzonych przed komputerem brzmienie wreszcie zaczynało mi się podobać. Do czasu aż porównałem swój wyprodukowany utwór z komercyjnym wydawnictwem. Wtedy moje dzieło wydawało się marne, zupełnie pozbawione mocy, podczas gdy ten drugi utwór był nasycony, potężny i ciężki. Poza tym wydawał się też być głośniejszy, często nawet dużo głośniejszy. Nie zdawałem sobie sprawy, że te dwie kwestie mogą się łączyć.

Głośność to wrażenie słuchowe, które pozwala nam uszeregować dźwięki od najcichszych do najgłośniejszych. Jednostką głośności jest son. Jednak zdecydowanie częściej aby opisać głośność wykorzystuje się decybele SPL (Sound Pressure Level), które zupełnie się do tego nie nadają!* Już wyjaśniam dlaczego.

W 1933 roku Fletcher i Munson opublikowali eksperymentalne krzywe równej głośności. Wynika z nich, że dla takiego samego poziomu ciśnienia akustycznego (w dB SPL) dźwięki o różnej częstotliwości nie są tak samo głośne.

Źródło: Moore, Brian C., Hearing

Jak zinterpretować ten wykres? Liniami połączone są wartości ciśnienia akustycznego dla różnych częstotliwości tonu dające takie same wrażenie głośności. Wielkość przedstawioną na wykresie nazywa się poziomem głośności. Jednostką jest fon, a wartość jest opisana liczbą znajdującą się nad każdą z krzywych.

Na początek weźmy najniższą krzywą oznaczoną MAF. Jest to tak zwana krzywa progowa. Przedstawia ona poziom ciśnienia akustycznego przy którym ludzki słuch zaczyna słyszeć dźwięk. Jak widać zależy to od częstotliwości. Na przykład dla tonu o częstotliwości 1000 Hz wystarczy aby dźwięk miał 0 dB, a już można go usłyszeć**, podczas gdy ton o częstotliwości 100 Hz usłyszymy dopiero przy poziomie około 20 dB SPL. Inaczej patrząc na ten wykres można zauważyć, że dla poziomu 50 dB SPL ton o częstotliwości 50 Hz zaczyna być słyszalny, a ton o tym samym poziomie 50 dB SPL i częstotliwości 2 kHz jest już dość głośny.

Z powyższego wykresu wynika jeszcze jedna bardzo ważna konsekwencja. Krzywe równej głośności (izofony) są gęściej upakowane dla niskich częstotliwości niż dla środka pasma. Podobnie ma się rzecz z wysokimi częstotliwościami***. Widać, że dla 20 Hz zmiana poziomu o 10 dB powoduje 'przeskoczenie' o 3 izofony w górę. Dla tonu 1 kHz jest to zmiana o jedną krzywą w górę. Zakładając, że każda kolejna izofona daje podwojenie głośności, dla wspomnianej zmiany 10 dB głośność tonu 1 kHz podwaja się, a tonu 20 Hz wzrasta ośmiokrotnie! Właśnie ten fakt odpowiada za wspominany już "bonus głośnościowy" i jest przyczyną wojny głośności.

Z powyższej właściwości słuchu wynikają dwie konsekwencje:

1) Gdy odsłuchamy tego samego utworu dla dwóch różnych poziomów zawsze ten głośniejszy wyda nam się lepszy - będzie zawierał więcej dołu oraz góry pasma. Wyda nam się zatem cięższy i mocniejszy (niskie częstotliwości) a zarazem czytelniejszy i bardziej 'otwarty' (wysokie częstotliwości).

2) Każdego porównania brzmieniowego musimy dokonywać dla równych głośności. W przeciwnym razie sam fakt odsłuchu na różnych głośnościach wpływa na odczuwaną przez nas różnicę w brzmieniu. Aby przekonać się o tym na własnej skórze zapraszam do obejrzenia materiału wideo:

W następnym poście przedstawię jak w prosty sposób wyrównać głośności odsłuchiwanej muzyki z komputera, różne próby opisania głośności (wartości RMS, DR, LUFS) oraz napiszę więcej o negatywnych skutkach zwiększania głośności materiału.

* Z tego powodu wprowadzono wielkość zwaną poziomem dźwięku L_pA (jednostka dB A), która zawiera w sobie tzw. korektę A. Dzięki temu poziom dźwięku dużo lepiej opisuje głośność i jest powszechnie wykorzystywany w normach dotyczących hałasu na całym świecie (choć nie jest idealny).

** Poziom ciśnienia akustycznego wyraża się wzorem:

zatem dla braku dźwięku (p(t) = 0) Lp jest równe minus nieskończoności, a nie 0 dB SPL! Poziom 0 dB SPL odpowiada ciśnieniu akustycznemu równemu p₀ (2 * 10^-5 Pa).

*** "Aktualniejsze" krzywe równej głośności

niedziela, 4 maja 2014

Dlaczego jazz ma większego 'kopa' niż metal na Spotify / iTunes?

Witam serdecznie na blogu "Usłysz różnicę"! Zapraszam do częstego odwiedzania tej strony, na której pojawiać się będą ciekawe informacje dotyczące muzyki zarówno od strony estetycznej jak i fizycznej. Ale teraz do rzeczy.

Jakiś czas temu przeskakując pomiędzy utworami na serwisie Spotify zauważyłem dziwną, wręcz nielogiczną sytuację. Po kilku utworach jazzowych zdecydowałem posłuchać czegoś ostrzejszego. Wielkie było moje rozczarowanie gdy okazało się, że 'metalowy' utwór, którego chciałem posłuchać, okazał się totalnie płaski i pozbawiony życia w porównaniu do brzmienia poprzednich słuchanych przeze mnie piosenek! Poniżej zamieszczam przykład ilustrujący tę sytuację. Proszę wsłuchać się w perkusję, zwłaszcza w 'stopę' i werbel:

Uwaga: dla najlepszego brzmienia dźwięku na Youtube proszę wybrać jakość HD 1080p.

Przyczyna tego dziwnego efektu jest dość prosta, choć wyjaśnienie jej już tak banalne nie jest i zajmie zapewne kilka postów.

Okazuje się, że za utratą 'kopa', uderzenia czy 'mocy' nagrań stoi tak zwana wojna głośności. W dużym skrócie polega ona na tym, że głośność płyt stopniowo ulegała zwiększeniu, ponieważ 'głośniejsze brzmi lepiej'*. Zapewne wiele osób zauważyło, że wkładając do odtwarzacza płytę z lat 80-90 gałkę głośności musimy podkręcić.
Co złego w tym, że płyty są głośniejsze? Dopóki nie tracimy na jakości dźwięku - nic, lecz ta granica już dawno została przekroczona. Zapraszam do obejrzenia krótkiego materiału prezentującego rozwój wojny głośności oraz jej najpopularniejszą ofiarę. Filmik przedstawia krótkie fragmenty utworów zespołu Metallica z wybranych płyt.

(czym jest DR wyjaśnię wkrótce)

Łatwo zauważyć, że głośniejsze utwory brzmią potężniej, mocniej, lepiej (choć w kwestii płyty Death Magnetic niektórzy mogą się nie zgodzić z tym stwierdzeniem i mają dużo racji). Krótko mówiąc, muzyka wydaje się lepsza z samego faktu, że jest głośniejsza. Nazwę to zjawisko "bonusem głośnościowym".

Spotify oraz iTunes wykorzystują algorytmy służące do obliczenia głośności poszczególnych albumów muzycznych**. Dzięki temu odsłuchujemy utwory na takiej samej głośności, a "bonus głośnościowy" zostaje wyeliminowany. Okazuje się, że w takiej sytuacji jesteśmy w stanie usłyszeć negatywny wpływ procesorów mających na celu zwiększenie głośności materiału muzycznego! Objawia się to najczęściej 'spłaszczeniem' brzmienia, utratą 'uderzenia' oraz zmniejszeniem ilości basu w materiale.

Odpowiedź na pytanie postawione w tym poście brzmi zatem następująco: wojna głośności w większym stopniu wpłynęła na brzmienie płyt zespołów rockowych i metalowych niż na jazz. Dlaczego? Skąd ta pogoń za głośnością? Czy głośniejsze faktycznie brzmi lepiej? Jakie zabiegi stosuje się w celu zwiększenia głośności? O tym już niebawem.

* - wyjaśnienie w kolejnych postach,
** - o tym dlaczego albumów a nie pojedynczych utworów oraz czy to naprawdę jest takie trudne w kolejnych postach.