Opcje Kontrastu

Opcje Kontrastu

Opcje Tekstowe

Cyfrowa transformacja: Jak serwisy streamingowe i dźwięk przestrzenny kształtują doświadczenie multimedialne użytkowników

18 gru 2024

Ewolucja od nośników fizycznych do platform streamingowych zrewolucjonizowała sposób, w jaki doświadczamy muzykę. Co więcej, nowoczesne technologie, takie jak dźwięk przestrzenny oraz sztuczna inteligencja, oferują immersyjne doświadczenia dźwiękowe oraz indywidualnie dobrane treści, z bibliotek o niewyobrażalnych rozmiarach.

1. Wstęp

W dzisiejszym świecie cyfrowej rozrywki, dźwięk odgrywa kluczową rolę w tworzeniu immersyjnych doświadczeń dla użytkowników. Ewolucja technologii dźwiękowych, w tym dźwięku przestrzennego, znacząco wpłynęła na sposób, w jaki doświadczamy muzykę, filmy i gry wideo. Immersja, czyli zanurzenie w świecie dźwiękowym, jest kluczowym aspektem doświadczeń multimedialnych. Dzięki dźwiękowi przestrzennemu, użytkownicy mogą lepiej odczuwać otaczającą ich rzeczywistość, co szczególnie ważne w przypadku filmów akcji, gier wideo czy koncertów muzycznych.

Jakość dźwięku jest nieodłącznie związana z technologią i formatami kompresji, które umożliwiają strumieniowanie treści w wysokiej rozdzielczości. Wraz z rozwojem serwisów streamingowych oraz integracją z technologią dźwięku przestrzennego, użytkownicy mają dostęp do ogromnych bibliotek treści multimedialnych w najwyższej jakości. Ewolucja technologii dźwiękowych i ich integracja z platformami streamingowymi otwiera nowe możliwości dla twórców i odbiorców treści dźwiękowych, kształtując przyszłość rynku rozrywkowego i multimediów.

Czy wiesz, że… ?

Za pomocą aparatu fotograficznego w nowoczesnym telefonie komórkowym, możliwe jest zeskanowanie własnych małżowin usznych celem uzyskania jeszcze lepszych efektów binauralnych.

2. Ewolucja serwisów streamingowych

2.1 Rozwój serwisów streamingowych

Sposób, w jaki dzisiaj słuchamy muzyki, jest wynikiem ewolucji, która dokonała się w ciągu życia obecnych pokoleń. Nasi pradziadkowie mieli dostęp głównie do muzyki wykonywanej na żywo lub tej, którą sami sobie zaśpiewali.


Transformacja od fizycznych nośników do strumieniowania była procesem wieloetapowym, który znacząco zmienił sposób konsumpcji mediów. W latach 70. i 80. dominowały nośniki fizyczne, takie jak płyty winylowe, kasety magnetofonowe oraz kasety VHS dla danych w formacie analogowym, a później płyty CD i płyty DVD dla treści w formacie cyfrowym.

Historia serwisów streamingowych sięga lat 90. XX wieku, gdy pojawiły się pierwsze próby przesyłania plików audio i wideo przez internet. Początkowo technologia ta była ograniczona głównie przez niską przepustowość łączy internetowych co powodowało niską jakość obrazu i dźwięku. Wzrost popularności streamingu nastąpił w pierwszej dekadzie XXI wieku, wraz z rozwojem szerokopasmowego internetu oraz pojawieniem się bardziej zaawansowanych formatów kompresji, takich jak MP3 dla dźwięku i MPEG dla wideo.


Rys. Oficjalny klient Napstera. Widoczne są okna wyszukiwania i menedżera transferów. Kilka plików MP3 jest pobieranych przez połączenie dial-up. (źródło: Njahnke, CC BY-SA 4.0 <https://creativecommons.org/licenses/by-sa/4.0>, via Wikimedia Commons)

Pionierem na rynku serwisów streamingowych była platforma Napster, które umożliwiała dzielenie się plikami muzycznymi, choć działała ona na granicy legalności. W późniejszych latach pojawiły się bardziej sformalizowane i licencjonowane usługi, takie jak Spotify, które wprowadziły model subskrypcyjny, oferując użytkownikom legalny dostęp do ogromnej biblioteki muzycznej bez konieczności jej pobierania. Podobnie w branży wideo, platformy takie jak YouTube, a później Netflix, przekształciły się na usługę streamingową, oferując bardzo szeroki wybór treści filmowych i telewizyjnych na żądanie [1].

Dzięki serwisom streamingowym użytkownicy zyskali możliwość dostępu do ogromnych bibliotek muzyki, filmów, seriali i innych treści multimedialnych z niemal każdego miejsca na świecie, o każdej porze. Model subskrypcyjny, w którym za miesięczną opłatą użytkownik otrzymuje nieograniczony dostęp do całej oferty serwisu, zrewolucjonizował rynek mediów. Dzięki algorytmom rekomendacji, użytkownicy mogą odkrywać nowe treści dopasowane do ich preferencji, co jeszcze bardziej zwiększa dostępność i różnorodność konsumowanych mediów.

Jednakże, wzrost popularności streamingu wywołał także wyzwania, takie jak dyskusje na temat sprawiedliwości wynagrodzenia artystów oraz kwestii własności intelektualnej, co wciąż stanowi ważny temat w kontekście dalszego rozwoju tego rynku.

2.2. Przegląd popularnych serwisów streamingowych muzyki i wideo

Spotify to jedna z największych platform streamingowych na świecie, oferująca ogromną bibliotekę muzyczną oraz podcastów. Platforma charakteryzuje się zaawansowanymi algorytmami rekomendacji, które dostosowują listy odtwarzania do preferencji użytkownika.

SoundCloud wyróżnia się jako platforma umożliwiająca artystom niezależnym publikowanie i udostępnianie swojej muzyki. Jest popularna wśród twórców nowych gatunków muzycznych oraz remiksów.

Apple Music integruje się ściśle z ekosystemem Apple, oferując użytkownikom wygodne rozwiązania do strumieniowania muzyki. Platforma wyróżnia się wysoką jakością dźwięku oraz treściami w formacie dźwięku przestrzennego.

YouTube Music łączy w sobie zalety tradycyjnej platformy streamingowej z ogromną bazą teledysków i remiksów dostępnych na YouTube. 


(źródło: Alami3452, CC BY-SA 4.0 <https://creativecommons.org/licenses/by-sa/4.0>, via Wikimedia Commons)

Netflix jest jedną z najpopularniejszych platform streamingowych na świecie, znaną z bogatej biblioteki filmów, seriali oraz produkcji oryginalnych. 

Disney+ to platforma streamingowa atrakcyjna dla rodzin i fanów popkultury ze względu na bogaty katalog treści zarówno dorosłych jak i dla dzieci. 

YouTube jest popularne głównie wśród użytkowników intensywnie korzystających z treści tworzonych przez społeczność.

Wszystkie te platformy oferują wysoką jakość strumieniowania, a różnią się w szczegółach technologicznych, takich jak zastosowane kodeki, wsparcie dla technologii dźwięku przestrzennego oraz integracja z ekosystemami treści i urządzeń. Te różnice mogą wpłynąć na jakość odbioru treści w zależności od urządzenia i preferencji użytkownika.


3. Systemy dźwięku przestrzennego


3.1. Dźwięk wielokanałowy oraz binauralny

Dźwięk przestrzenny to zaawansowana technologia audio, której celem jest stworzenie iluzji trójwymiarowej przestrzeni dźwiękowej otaczającej słuchacza. W odróżnieniu od tradycyjnego dźwięku stereo, który wydaje się dochodzić z jednego kierunku, dźwięk przestrzenny wykorzystuje wiele kanałów rozmieszczonych wokół słuchacza. Pozwala to na precyzyjne pozycjonowanie źródeł dźwięku w różnych miejscach, co umożliwia wrażenie ruchu i głębi [2]. Dźwięk binauralny to specyficzna forma dźwięku przestrzennego, która symuluje naturalny sposób odbierania dźwięków przez ludzkie uszy. Wykorzystuje on sygnał dwukanałowy, ale z zastosowaniem odpowiednich technik i algorytmów, które odtwarzają subtelne różnice w czasie przybycia oraz poziomie dźwięku do każdego z uszu, gdy sygnały docierają z różnych kierunków [3]. Do nagrywania dźwięku binauralnego często używa się specjalnych mikrofonów umieszczonych w modelu głowy (manekinie), co pozwala na dokładne odwzorowanie naturalnego odbioru dźwięku przez człowieka.

Słuchając nagrań binauralnych przez słuchawki, odbiorca ma wrażenie, że dźwięki dochodzą ze wszystkich kierunków wokół niego, podobnie jak w rzeczywistości. Ta technika zapewnia bardziej immersyjne i realistyczne doświadczenie dźwiękowe, które znajduje zastosowanie w różnych dziedzinach, takich jak muzyka, filmy, gry wideo czy symulacje akustyczne.

Dźwięk przestrzenny umożliwia pełniejsze, bardziej naturalne, immersyjne doświadczenia dźwiękowe. Istnieje kilka popularnych sposobów zapisu i kodowania dźwięku przestrzennego. Najbardziej tradycyjny i intuicyjny to system kanałowy (ang. Channel-Based Audio), który polega na przypisaniu dźwięku do określonych kanałów, odpowiadających konkretnym głośnikom w przestrzeni odsłuchowej. Do popularnych formatów kanałowego dźwięku przestrzennego należą m. in. systemy 5.1, 7.1. Z kolei systemy obiektowe (Object-Based Audio), ambisoniczne, a także Wave Field Synthesis (WFS), umożliwiają bardziej elastyczne i wszechstronne pozycjonowanie dźwięku, pozwalając na dynamiczne odwzorowanie dźwięków w przestrzeni trójwymiarowej, niezależnie od liczby i rozmieszczenia głośników [4].


Rys.Reżyserka studia nagraniowego z systemem odsłuchowym 5.1

3.2. Popularne technologie dźwięku przestrzennego

Dolby Atmos

W 2012 roku wprowadzono format Dolby Atmos, który wykorzystuje obiekty dźwiękowe, dodając dodatkowy wymiar wysokości do komercyjnych systemów dźwięku przestrzennego. Technologia ta opiera się na dwóch elementach: ścieżkach podstawowych (bed tracks) i obiektach. Ścieżki podstawowe to kanały dźwiękowe dekodowane do standardowych konfiguracji, natomiast obiekty to indywidualnie mapowane elementy dźwiękowe, które niezależnie od systemu odtwarzania są pozycjonowane w przestrzeni [5].

Youtube (demo Dolby Atmos): 


Auro 3D

Auro 3D to kolejna istotna technologia, która wzbogaca pole dźwiękowe o dodatkową warstwę wysokości, tworząc trójwymiarowe doświadczenie. Pierwotnie bazowało na technologii kanałowej, z naciskiem na pionowe warstwowanie dźwięku. Wersja Auro-Cx wprowadziła wsparcie zarówno dla obiektowego jak i ambisonicznego dźwięku oraz skalowalne konfiguracje, co znacznie rozszerza możliwości tej technologii [6].

Wave-field Synthesis (WFS)

Wave-field Synthesis (WFS) to technika, która wykorzystuje ogromne ilości głośników do odtworzenia dźwięków w przestrzeni, oferując wysoki bardzo poziom realizmu. Mimo imponującej immersji, technologia ta jest skomplikowana i kosztowna w implementacji oraz może być podatna na błędy numeryczne, wpływające na jakość dźwięku [7].

Ambisonia

Ambisonia to zaawansowana technologia umożliwiająca dookólne kodowanie i dekodowanie dźwięku. W przeciwieństwie do systemów opartych na kanałach, Ambisonia syntezuje i analizuje pole dźwiękowe niezależnie od konfiguracji głośników, co umożliwia precyzyjne odwzorowanie lokalizacji źródła dźwięku [8].

Pomimo, iż aparat matematyczny na którym oparta jest technologia ambisoniczna nie należy do najprostszych, wykresy funkcji reprezentujących podstawę do opisu pola akustycznego są całkiem ładne.

Rys.Przykładowe harmoniki sferyczne wraz z ich matematycznym wzorem stanowiącym bazę technologii ambisonicznej


Rys. Wielokanałowy system odsłuchowy w Huddersfield University, UK. 


3.3. Rola dźwięku przestrzennego w poprawie doświadczeń użytkowników

Dźwięk przestrzenny odgrywa kluczową rolę w kontekście mediów immersyjnych [9], które pozwalają „zanurzyć się” w alternatywnej rzeczywistości. Dzięki precyzyjnemu pozycjonowaniu dźwięków w przestrzeni, użytkownicy mogą lepiej „odczuwać”  oglądane filmy, realistyczne gry wideo czy muzykę w najwyższej jakości, co zwiększa realizm i angażuje zmysły na głębszym poziomie poznawczym. Na przykład, w filmach akcji, dźwięk przestrzenny może oddać realistyczne efekty, takie jak przelatujące obok samoloty czy kroki dochodzące zza pleców, co intensyfikuje emocje i buduje napięcie. W grach wideo, dokładne pozycjonowanie dźwięków może dostarczać kluczowych informacji, takich jak lokalizacja przeciwnika, co wpływa na lepsze zrozumienie sytuacji w grze i zwiększa satysfakcję z rozgrywki. W muzyce, słuchać może poczuć się jak w średniowiecznej katedrze gotyckiej słuchając chorałów gregoriańskich lub na stadionie Wembey podczas koncertu Eda Sheeran’a

https://music.apple.com/pl/album/apple-music-live-ed-sheeran/1686729932

4. Integracja serwisów streamingowych z technologią dźwięku przestrzennego

Z uwagi na konkurencję na rynku dostawców treści multimedialnych, a zwłaszcza muzyki i wideo, operatorzy starają się oferować coraz nowsze rozwiązania, większą przepływność sygnału odpowiadającą za jakość i inne innowacyjne technologie atrakcyjne dla użytkowników. Integracja serwisów streamingowych z dźwiękiem przestrzennym jest w tym przypadku dość naturalnym kierunkiem rozwoju. Ciągle istnieje wiele technicznych i ergonomicznych barier, jak na przykład wymóg transmisji ogromnej ilości danych lub konieczność instalacji wielu głośników, ale rozwój sieci światłowodowych oraz współczesne rozwiązania typu „soundbar” coraz bardziej przybliżają dźwięk przestrzenny dla użytkownika domowego.

Serwisy takie jak Apple Music, Tidal i Amazon Music HD już oferują odsłuch w większej liczbie kanałów niż tradycyjne stereo (2.0). Apple Music wykorzystuje technologię Dolby Atmos, która pozwala na odsłuch za pomocą kompatybilnych słuchawek lub zestawów kina domowego, a także wielokanałowej karty muzycznej. Tidal oraz Amazon Music HD oferuje zarówno dźwięk w formacie Dolby Atmos, jak i Sony 360 Reality Audio. Dzięki temu, dźwięk przestrzenny w bardzo wysokiej jakości, staje się standardem na masową skalę. W przyszłości, w warunkach domowych, szersze zastosowanie znajdą prawdopodobnie technologie aktywnego usuwania przesłuchów (ang. Crosstalk cancellation) umożliwiające generowanie sygnału binauralnego za pomocą głośników w dowolnym punkcie przestrzeni. Być może, w optymalizacji tej technologii zastosowanie znajdą głośniki ultradźwiękowe o bardzo wąskiej charakterystyce kierunkowej, a na ścianach jako obrazy zawisną głośniki panelowe generujące sygnał ambientowy i symulację dowolnej przestrzeni akustycznej.

5. Podsumowanie

Ewolucja odtwarzania muzyki przez urządzenia elektroakustyczne w ciągu ostatnich dekad zrewolucjonizowała sposób, w jaki korzystamy z dźwięku i rozrywki. Ta transformacja dokonała się w błyskawicznym tempie, obejmując przejście od nośników fizycznych do cyfrowych platform streamingowych. Początkowo dominowały tradycyjne nośniki, takie jak płyty winylowe, kasety magnetofonowe, a później płyty CD i DVD. Te formaty oferowały ograniczoną jakość dźwięku i wymagały fizycznego dostępu do kolekcji muzycznej.  W latach 90. pojawiły się pierwsze serwisy streamingowe, jednak niska przepustowość ówczesnego internetu ograniczała jakość i dostępność treści. Przełom nastąpił wraz z rozwojem szerokopasmowych połączeń internetowych i zaawansowanych formatów kompresji dźwięku. Te technologie umożliwiły strumieniowanie muzyki w wysokiej jakości, co doprowadziło do popularyzacji platform stremingowych. Model subskrypcyjny, który wprowadziły te serwisy, zrewolucjonizował rynek, oferując nieograniczony dostęp do ogromnych bibliotek treści za stałą opłatą miesięczną.

Współczesne platformy streamingowe, wykorzystują nowoczesne technologie obiektowego dźwięku przestrzennego. To rozwiązanie umożliwiają immersyjne doświadczenia dźwiękowe w warunkach domowych lub na słuchawkach, tworząc wrażenie, że dźwięki dochodzą ze wszystkich kierunków, w tym z góry. Ta technologia znajduje zastosowanie nie tylko w muzyce, ale także w filmach i grach, intensyfikując emocje i angażując słuchacza na głębszym poziomie. Te zmiany w sposobie odbioru dźwięku kształtują przyszłość rynku rozrywkowego i multimediów, otwierając nowe możliwości dla twórców i odbiorców treści dźwiękowych.

6. Bibliografia

[1] Malecki Pawel,  Czopek Dorota, and  Sochaczewska Katarzyna, ‘Music Streaming Platforms—Quality and Technical Comparison’, Journal of the Audio Engineering Society, no. 488, Oct. 2018.

[2] J. Blauert, Spatial hearing: the psychophysics of human sound localization. MIT press, 1997. doi: 10.7551/mitpress/6391.001.0001.

[3] G. Reardon et al., ‘Evaluation of Binaural Renderers: A Methodology’, in Audio Engineering Society Convention 143, Audio Engineering Society, 2017.

[4] P. Małecki, J. Stefanska, and M. Szydłowska, ‘Assessing Spatial Audio: A Listener-Centric Case Study on Object-Based and Ambisonic Audio Processing’, Archives of Acoustics, Jul. 2024, doi: 10.24425/aoa.2024.148798.

[5] Apple, ‘About Spatial Audio with Dolby Atmos in Apple Music’. 2023. [Online]. Available: https://support.apple.com/en-us/HT212182

[6] AURO-3D, ‘AURO-CX Advanced Next Generation Audio Codec White Paper’. 2023. [Online]. Available: https://www.auro-3d.com/wp-content/uploads/2023/08/Auro-Cx-White-Paper-rev1-20230714.pdf

[7] H. Wittek, ‘Perceptual differences between wavefield synthesis and stereophony’, PhD Thesis, Department of Music and Sound Recording, School of Arts, University of Surrey, 2013.

[8] F. Zotter and M. Frank, Ambisonics, 1st ed. in 19. Springer, 2019. [Online]. Available: https://doi.org/10.1007/978-3-030-17207-7

[9] P. Malecki and S. Piotrowski, ANTON - Universe in 3D: Ambisonics in Electronic Music Production. 2018. [Online]. Available: http://www.aes.org/events/144/immersiveaudio/?ID=5949

O autorze…

Dr hab. inż. Paweł Małecki

Dr hab. inż. Paweł Małecki jest Profesorem Nadzwyczajnym na AGH w Krakowie, specjalistą w dziedzinie akustyki i inżynierii dźwięku. Ukończył z wyróżnieniem studia na kierunkach Automatyka i Robotyka oraz Mechanika i Budowa Maszyn. W 2013 roku obronił doktorat z zakresu akustyki architektonicznej i percepcji muzyki. Jego badania obejmują auralizację i techniki ambisoniczne. Jako inżynier dźwięku zrealizował dziesiątki albumów zdobywając m. in. FRYDERYKA 2024. 

https://kotlownia.agh.edu.pl

Pełna lista publikacji: http://bpp.agh.edu.pl/autor/malecki-pawel-06441

O autorze…

Dr hab. inż. Paweł Małecki

Dr hab. inż. Paweł Małecki jest Profesorem Nadzwyczajnym na AGH w Krakowie, specjalistą w dziedzinie akustyki i inżynierii dźwięku. Ukończył z wyróżnieniem studia na kierunkach Automatyka i Robotyka oraz Mechanika i Budowa Maszyn. W 2013 roku obronił doktorat z zakresu akustyki architektonicznej i percepcji muzyki. Jego badania obejmują auralizację i techniki ambisoniczne. Jako inżynier dźwięku zrealizował dziesiątki albumów zdobywając m. in. FRYDERYKA 2024. 

https://kotlownia.agh.edu.pl

Pełna lista publikacji: http://bpp.agh.edu.pl/autor/malecki-pawel-06441