Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

3D-Audio bei Netflix: Surround Sound über jedes Stereo-Gerät dank Sennheiser AMBEO

Vor knapp einem Jahr eröffnete der Streaming-Anbieter Netflix erstmals die Möglichkeit, über AirPods Pro und AirPods Max den Ton in 3D-Audio (auch Spatial Audio genannt) zu genießen. Siehe hier. Dieses Feature benötigte bislang aber stets spezielle Apple-Hardware. Voraussetzung zur Wiedergabe in diesem Fall ist:

ein kompatibles Apple-Gerät
  • iPhone 7 und neuer mit iOS 15.1 oder höher
  • iPad Air (3. Generation und neuer) mit iPadOS 15.1 oder höher
  • iPad mini (5. Generation und neuer) mit iPadOS 15.1 oder höher
  • iPad Pro (3. Generation und neuer) mit iPadOS 15.1 oder höher
  • Apple TV 4K und höher mit tvOS 15 oder höher

Kompatible Apple-Kopfhörer
  • Airpods (3. Generation)
  • Airpods Pro
  • Airpods Max
  • Beats Fit Pro

Mit diesen Geräten unterstützt Netflix Spatial Audio, um 5.1-Surround-Sound und Dolby Atmos-Audio zu einem "immersiven" Surround-Sound-Erlebnis zu erweitern.

3D-Audio künftig für alle (Stereo-) Wiedergabegeräte und in allen Streaming-Abos verfügbar

Der Schlüssel dazu ist die vom deutschen Audiospezialisten Sennheiser entwickelte AMBEO-Technologie. Dabei handelt es sich um einen Codec, der Zweikanal-Audio in ein räumliches Ergebnis umrechnet. Sennheiser selbst schreibt dazu:

"Der AMBEO 2-Channel Spatial Audio Renderer übersetzt Original-Mischungen in 2-Kanal-Audio mit einem räumlichen Erlebnis, das weit über Stereo hinausgeht. Während der Entwicklung arbeitete Sennheiser mit Netflix und anderen Industriepartnern an der Feinabstimmung des Systems, das nun von Sennheiser lizenziert werden kann. Netflix ist die erste Streaming-Plattform, die dieses deutlich verbesserte Erlebnis für ausgewählte Titel bietet."


Die AMBEO-Technologie von Sennheiser ist mit allen Geräten und allen Netflix Streaming-Abos kompatibel und erfordert keine Surround-Sound-Lautsprecher oder Heimkino-Ausrüstung. Dabei gilt es folgendes zu beachten, wie Netflix in seinen Erklärungen ausführt:

  • Wenn keine Surround-Sound-Lautsprecher vorhanden sind, wird 3D-Audio bei der Wiedergabe eines kompatiblen Titels mit Stereo-Audio automatisch aktiviert.
  • Falls Surround-Sound-Lautsprecher vorhanden sind, empfiehlt es sich, Serien und Filme in 5.1-Surround-Sound oder Dolby Atmos wiederzugeben.

Achten Sie dabei auf die Toneinstellungen ihres Fernsehers. Ist die Tonausgabe auf 5.1 eingestellt, wird 3D-Audio (also die AMBEO-Umrechnung) automatisch deaktiviert. Um 3D-Audio mittels AMBEO nutzen zu können, muss der Ausgang auf Stereo-Wiedergabe eingestellt sein.

Und wie soll das funktionieren?
Sennheiser erläutert es so: "Die Rendering-Software läuft in den Cloud-basierten Encoding-Pipelines des Streaming-Dienstes und erzeugt AMBEO 2-Kanal-Raumklang aus vorhandenen ADM- oder IAB-Dateien, beides offene Formate nach Industriestandard. Es ist kein weiterer separater Mix erforderlich. Ein Preview-Tool ermöglicht es dem Re-Recording-Mixer, während der Postproduktion Stereo mit AMBEO zu vergleichen und die Rendering-Einstellungen nach Stems/Gruppen anzupassen. Der Renderer bietet eine patentierte granulare Steuerung der Räumlichkeit, die vom vollen AMBEO-Effekt bis zum Standard-Stereo-Mixdown reicht, wobei bestimmte Kanäle von der Änderung ausgeschlossen werden können. So können beispielsweise Dialoge zu 100 % erhalten bleiben oder leicht verändert werden, um sie an benachbarte immersive Szenen anzupassen. Die Gesamtlautstärke bleibt ebenfalls erhalten, und eine Musikmischung kann für den linken und rechten Kanal beibehalten werden, während die immersive AMBEO-Wiedergabe für alle anderen Kanäle hinzugefügt wird. Natürlich sind alle Signale zeitlich korrekt ausgerichtet, um dem Originalinhalt zu entsprechen."

Vom Standard-Stereo-Mixdown (links) zum vollen AMBEO-Effekt (rechts): Re-Recording-Mixer können die Räumlichkeit vollständig kontrollieren und fein abstimmen.
Das Vorschautool der AMBEO 2-Kanal Spatial Audio Rendering Software. Das Objektbetrachtungsfenster unten rechts zeigt feste Lautsprecherpositionen an den Rändern und individuelle Renderings als blaue Punkte. Helle Punkte sind erhöhte Schallquellen.

Um die Wirkung besser zu visualisieren, hat Sennheiser das folgende Video bereitgestellt:


Geht das mit allen Netflix-Streaminginhalten?
Nein. Das Angebot muss, wie oben beschrieben, erst für AMBEO bzw. 3D-Audio vorbereitet werden. Netflix will nach und nach seine Inhalte entsprechend anpassen. Welche bereits den 3D-Sound liefern, können Nutzer einfach herausfinden, indem sie im Suchfeld "Spatial Audio" eingeben. Zum Zeitpunkt der Veröffentlichung spuckte diese Suche folgende Ergebnisse aus:


Erfreulicherweise sind bereits einige Top-Titel wie "Stranger Things" und "Witcher", aber auch ein paar der größeren Netflix-Filme wie "Red Notice" und "The Adam Project" (beide mit Ryan Reynolds) mit dabei.

Wie erkenne ich Titel mit 3D-Audio und kann ich es ausschalten?
In diesem Punkt hat Netflix seine Hausaufgaben scheinbar nicht gemacht. Titel werden normalerweise mit einem Symbol wie "5.1" oder "[Dolby]ATMOS" gekennzeichnet. Das aber auch nur, wenn der Fernseher auf 5.1-Ausgabe eingestellt ist. Für AMBEO bzw. 3D-Audio bzw. Spatial Audio mit Stereolautsprechern muss der TV wie oben beschrieben auf Stereoausgabe eingestellt sein. Dann wird jedoch gar kein Symbol an den jeweiligen Titeln angezeigt.

Nach derzeitigem Kenntnisstand ist es auch nicht möglich, Inhalte mit AMBEO/3D-Audio auf normales Stereo umzuschalten. Hier fehlen mir aber noch Erfahrungswerte für eine definitive Aussage. Ob und wie gut das Ganze über ein Stereo-System klingt, konnte ich aus zeitlichen Gründen leider auch noch nicht ausprobieren. Das werde ich dann im Laufe der nächsten Tage nachholen. Für heute Abend steht erst mal eine Folge "Stranger Things" an…

Kommentare

Deppomat10.07.22 13:27
Wieso heißt es denn "Re-Recording-Mixer"? Re-Recorded wird das Material doch gerade nicht. Sondern neu gemischt. Oder?

Ansonsten, on topic: Ich werd den Reiz nie verstehen. Surround sowieso schon nicht, aber erst recht nicht irgendwie draufmatriziert. Stereo und ich bin happy. Da bleibt alles punchy und eindeutig. Aber jeder wie er mag 🤷
0
marm10.07.22 13:40
Ich bin immer etwas skeptisch, wenn eine Funktionsbeschreibung viel Blingbling benötigt (bin aber kein Musikexperte). Da wird also Musik gerendert und ist dann immersiver. Am Ende kommt doch weiterhin Musik aus zwei Boxen? Musik aus zwei Boxen - dachte ich - sei Stereo. Dann hätte man doch die Musik von Anfang immersiver abmischen können, oder nicht?

Spatial Audio nutzt hingegen die Bewegungssensoren. Damit Ambeo denselben Effekt erzielt, müsste der Kopf des Hörers doch mit einem Bewegungssensor ausgestattet werden?
0
Tirabo10.07.22 18:39
@deppomat

Ambeo ist KEIN neuer Mix.

Re-Recording ist ein Schritt in der Postproduktion:

Die Vielen einzelnen Ton-, Atmo- Sprach- und Musikaufnahmen werden im Re-Recording-Prozess letztendlich zusammengeführt und zu einer neuen (Master-) Audiospur zusammengemischt, die dann im endgültigen Film angewendet werden kann.
Hier können natürlich auch komplett neue Aufnahmen entstehen, um das definierte Ziel zu erreichen.
+1
Tirabo10.07.22 18:55
marm
Ich bin immer etwas skeptisch, wenn eine Funktionsbeschreibung viel Blingbling benötigt (bin aber kein Musikexperte). Da wird also Musik gerendert und ist dann immersiver. Am Ende kommt doch weiterhin Musik aus zwei Boxen? Musik aus zwei Boxen - dachte ich - sei Stereo. Dann hätte man doch die Musik von Anfang immersiver abmischen können, oder nicht?

Spatial Audio nutzt hingegen die Bewegungssensoren. Damit Ambeo denselben Effekt erzielt, müsste der Kopf des Hörers doch mit einem Bewegungssensor ausgestattet werden?

An dieser Art hat man sich schon sehr früh versucht, wie zum Beispiel bei der Quadrophonie.

Dass allgemeine Problem ist, dass Ohrsignale und Lautsprechersignale nicht kompatibel miteinander sind und immer Klangverfälschungen zur Folge haben. Diese waren früher so erheblich, dass sich Systeme, die den Versuch unternahmen, LS-Signale kompatibel zu machen, aufgrund des schlechten und hohlen Klangs scheiterten.
Mit zunehmnderer Popularität des (Heim-)Kinoformats sind solche Systeme heute wieder sehr attraktiv geworden. Man beachte die Entwickung durch Dolby 5.1, 7.1 und Atmos usw.
Heutzutage arbeitet man hier unter anderen mit ADM-Audiodateien (sogenannte objektbasierte Audiodateien), bei denen verschiedene Parameter als Metadaten in die Audiodatei geschrieben werden können und diese immer gleich gelesen werden können.

So lassen sich je nach Hörumgebung bestimmte Metadaten einfügen, die zur Wiedergabe wichtig sind.
Sennheiser versucht hier mit Ambeo den extrem schwierigen und komplexen Spagat, binaural-basiertes Audio auf eine (Multi-) Lautsprecherwiederagbe zu konvertieren,

Also Ohrsignale lautsprecherkompatibel zu machen, was aber immer nur mit Kompromissen funktioniert.
+2
Legoman
Legoman10.07.22 20:32
Gab es solche 3D-Audio-Sachen nicht schon vor ewig Jahren als Soundkarte im Computer und als Fake-Sourround-Sound im Fernseher? Weiß grad nicht mehr, wie das damals hieß.
Ich fand das immer furchtbar nervig. Unnützer Hall und völlig verfälschter Sound. Und immer geht der Bass flöten.

Die Erklärung von Sennheiser klingt für mich nach Marketing-Hokuspokus. Zusammengefasst "der Computer knödelt am Sound rum, damit es irgendwie total krass in deinen Kopfhörern scheppert".
+2
Kaji10.07.22 20:46
Legoman
Gab es solche 3D-Audio-Sachen nicht schon vor ewig Jahren als Soundkarte im Computer und als Fake-Sourround-Sound im Fernseher? Weiß grad nicht mehr, wie das damals hieß.
Ich fand das immer furchtbar nervig. Unnützer Hall und völlig verfälschter Sound. Und immer geht der Bass flöten.

Die Erklärung von Sennheiser klingt für mich nach Marketing-Hokuspokus. Zusammengefasst "der Computer knödelt am Sound rum, damit es irgendwie total krass in deinen Kopfhörern scheppert".
Auch in diesem Bereich gab es Fortschritte, du kannst dir das Video von Sennheiser zur Probe ja mal anhören. Simulierter Surround Sound aus 2 Lautsprechern oder einer Soundbar ist weiterhin nicht optimal (und auch sehr anspruchsvoll wegen der unterschiedlichen Raumcharakteristika), bei Kopfhörern werden aber schon sehr gute Ergebnisse erzielt.
+1
Tirabo10.07.22 22:03
Kaji

bei Kopfhörern werden aber schon sehr gute Ergebnisse erzielt.

Nun, Kopfhörer sind nun mal das einzig passende Quellmedium für binaurale Signale. Nur mit diesen bekommen unsere Ohren auch Lokalisationen in Horizontal-, Median- und Frontalebene hin.
+1
Huba10.07.22 22:25
Tirabo
Kaji

bei Kopfhörern werden aber schon sehr gute Ergebnisse erzielt.

Nun, Kopfhörer sind nun mal das einzig passende Quellmedium für binaurale Signale. Nur mit diesen bekommen unsere Ohren auch Lokalisationen in Horizontal-, median- und Frontalebene hin.

Stimmt nicht so ganz. Die Schweizer Firma Geneva hat schon 2006 ein Lautsprechersystem entwickelt, das aus einer einzigen Box einen räumlichen Klang zaubert -- unabhängig vom Quellmaterial.
Von der großen XL-Version habe ich mal eine Vorführung beim Händler erlebt: Die Demo-CD spielte absolut räumlich ab, ein Hubschrauber flog quer durch den Raum, Schritte auf Kies um einen herum, die Wagentür schlug hinten links in der Ecke zu... absolut beeindruckend -- keine Ahnung, wie die das gemacht haben.
Die kleine M-Version steht neben unserem Fernseher und gibt über den Kopfhörer-Ausgang den Ton aus -- absolut in Ordnung, sehr räumlich. Keine High-End-Lösung, klar -- dafür haben wir unser Wohnzimmer aber auch nicht mit Surroundboxen und Subwoofern "geschmückt".
Kleiner Wermutstropfen: Die Serie wird nicht mehr angeboten, gibt es nur noch als Restposten oder gebraucht. Geneva macht aber aktuell mit noch anderen Lautsprechern Töne
0
Tirabo10.07.22 22:44
Huba
Tirabo
Kaji

bei Kopfhörern werden aber schon sehr gute Ergebnisse erzielt.

Nun, Kopfhörer sind nun mal das einzig passende Quellmedium für binaurale Signale. Nur mit diesen bekommen unsere Ohren auch Lokalisationen in Horizontal-, median- und Frontalebene hin.

Stimmt nicht so ganz.

Was stimmt nicht so ganz???
-1
Huba11.07.22 00:33
Tirabo
Was stimmt nicht so ganz???

Habe ich doch geschrieben: Dass man nur mit Kopfhörern räumliche Lokalisationen hinbekommt.
0
Tirabo11.07.22 01:08
Huba
Tirabo
Was stimmt nicht so ganz???

Habe ich doch geschrieben: Dass man nur mit Kopfhörern räumliche Lokalisationen hinbekommt.

Herrje, was Du erzählst ist Unsinn. Lese Dich doch erst einmal komplett in das Problem herein, bevor du ins Blaue behauptest und mit anekdotischen Erzählungen kommst.

Eine dreidimensionale Abbildung von Schallereignissen ohne die Verwendung von Kopfhörern ist so einfach nicht möglich.

Was man Dir da vorführte, waren sicher einzelne objektbasierte Audiosignale, die über Pegeldifferenzen und Laufzeitdifferenzen auch über Lautsprecher wiedergegeben werden können.
Um aber binaurale Signale (das sind Signale, die über Kunstkopf oder Jecklin-Trennscheibe aufgenommen wurden) über Lautsprecher wiedergeben zu können, müssten auch kopfbezogene Signalanteile über die Lautsprecher erfolgen.

Dafür benötigt man aber die Außenohrübertragungsfunktion oder HRTF (Head Related Transfer Function). Der Grund, weshalb der Hörer nämlich die Richtung der Schallquelle erkennt ist, dass der Schall auf dem Weg zu den beiden Ohren eine Filterung je nach der Einfallrichtung erfährt. Diese Filterung kommt von den Reflexionen und Beugungen am Oberkörper, dem Kopf und den Ohrmuscheln, was durch die HRTFs beschrieben wird. Das Gehör "erkennt" diese Filterung und kann daraus die Richtung der Schallquelle lokalisieren. In allen Fällen sind die gemessenen Schalldruckamplituden in Abhängigkeit von der Frequenz und der Schall-Laufzeit an beiden Ohren verschieden - und überhaupt bei den Menschen ähnlich aber verschieden, wie Fingerabdrücke.

Das bedeutet, der LS müsste zunächst wissen, in welcher Richtung sich überhaupt dein Kopf befindet, damit diese Signale richtig zu den Ohren gleitet werden. Zweitens ist ein wesentlicher Faktor unseres Kopfes, dass die Trennung des Kopfes zu Signalltrennungen führt, die ein normaler im Raum aufgestellter Lautsprecher physikalisch gar nicht ausführen kann. Es gab immer wieder Ansätze mit diagonal angeordneten Systemen, die aber alle nicht vernünftig funktionierten.

Erst 2006 haben Helmut Wittek, Günther Theile und Daniel Menzel am Institut für Rundfunktechnik (IRT) in München einen Laustprecher(Array-)Prototyp vorgestellt, der mithilfe von 22 im Kreis angeordneten Breitbandlautsprechern und einem Tieftöner in der Mitte mit einem Kopfabstand von 40 cm nach oben über dem Kopf in der Lage ist, einen virtuellen und statischen binauralen Kopfhörer herzustellen, ohne dafür einen Kopfhörer tragen zu müssen.
Nur mithilfe von zusätzlichem Kopftracking und Wellenfeldsynthese ist es damit zum ersten mal möglich eine stabile kopfbezogene virtuelle Aufnahme ohne Kopfhörer zu hören.

Falls es Dich interessiert, hier gibt es das Papier der drei:

Und hier ein Wikipedia-Eintrag zu diesem Thema:


Du merkst, das Thema ist enorm komplex und eine Lösung des Problems der generellen Inkompatibilität zwischen Lautsprechersignalen und Kopfhörersignalen lässt sich auf einfache Weise ohne viel Kompromisse nicht finden.


PS:
Die da auf der von Dir verlinkten Seite wissen wissen noch nicht mal, dass „Mozarts Mondscheinsonate“ von Beethoven komponiert wurde.
Der Name „Mondschein“ wurde der Komposition (Op. 27 Nr. 2) auch erst nach Beethovens Tod von Rellstab übergestülpt.
0
Deppomat11.07.22 02:34
Tirabo
Ambeo ist KEIN neuer Mix.

Re-Recording ist ein Schritt in der Postproduktion:
Ah, grad nachgelesen. „Re“ also nicht im Sinne von „alte Aufnahme durch neue ersetzen“, sondern „bereits aufgenommenes Material für für neues Zielformat erneut überspielen“. Wieder was gelernt.
+1
Legoman
Legoman11.07.22 09:09
Tirabo
Zweitens ist ein wesentlicher Faktor unseres Kopfes, dass die Trennung des Kopfes zu Signalltrennungen führt, die ein normaler im Raum aufgestellter Lautsprecher physikalisch gar nicht ausführen kann.
Ich mag mich irren - aber die Trennung des Kopfes führt üblicherweise zu noch viel schlimmeren Ergebnissen.
+5
Jadekaiser
Jadekaiser11.07.22 09:13
Großartig … made my day!
Hätte eben fast meinen Kaffee gegen den Monitor geprustet.

[/quote]
Ich mag mich irren - aber die Trennung des Kopfes führt üblicherweise zu noch viel schlimmeren Ergebnissen.
[/quote]
+1
Tirabo11.07.22 09:41
Legoman
Tirabo
Zweitens ist ein wesentlicher Faktor unseres Kopfes, dass die Trennung des Kopfes zu Signalltrennungen führt, die ein normaler im Raum aufgestellter Lautsprecher physikalisch gar nicht ausführen kann.
Ich mag mich irren - aber die Trennung des Kopfes führt üblicherweise zu noch viel schlimmeren Ergebnissen.

Ja, Sorry, war ein wenig spät und da lief gestern Nacht so ein komischer Horrorfilm auf Tele5. Da habe ich wohl was durcheinandergebracht
+2
vrtonung18.07.22 15:19
Deppomat
Wieso heißt es denn "Re-Recording-Mixer"? Re-Recorded wird das Material doch gerade nicht. Sondern neu gemischt. Oder?

Ansonsten, on topic: Ich werd den Reiz nie verstehen. Surround sowieso schon nicht, aber erst recht nicht irgendwie draufmatriziert. Stereo und ich bin happy. Da bleibt alles punchy und eindeutig. Aber jeder wie er mag 🤷

Re-Recording Mixer ist die deutsche Beschreibung für den Mischtonmeister. Ist etwas irritierend, es wird im eigentlich Sinn nichts gerecordet (also etwa der Ton am Set), sondern in der Mixsession wurde früher eben direkt auf Tape alles aufgezeichnet. Passiert in der ProTools session ähnlich, man recordet seinen Mix direkt, damit spart man sich den Export.

Das Material wird hier nicht neu gemischt. Mein Telefonat mit Netflix hat ergeben, dass aber jene Person, die den Film gemischt hat in das Prozessing von Ambeo eingebunden wird. Sprich die Person - die den Sound wohl so gut kennt wie niemand - muss das Ambeo-Processing noch einmal abnehmen, sonst geht der Film nicht online.
So kann man sicher stellen, dass es nicht nur Magische Chi-Chi ist, sondern auch Professionelle Audio Engineere diese punchieness etc beibehalten.
0
vrtonung18.07.22 15:22
marm
Ich bin immer etwas skeptisch, wenn eine Funktionsbeschreibung viel Blingbling benötigt (bin aber kein Musikexperte). Da wird also Musik gerendert und ist dann immersiver. Am Ende kommt doch weiterhin Musik aus zwei Boxen? Musik aus zwei Boxen - dachte ich - sei Stereo. Dann hätte man doch die Musik von Anfang immersiver abmischen können, oder nicht?

Spatial Audio nutzt hingegen die Bewegungssensoren. Damit Ambeo denselben Effekt erzielt, müsste der Kopf des Hörers doch mit einem Bewegungssensor ausgestattet werden?

Musik über Boxen kann trotzdem 3D audio sein. Nennt sich dann "transaural" und arbeitet mit sogenannter Cross-Talk-Cancellation (CTC). Man muss aber eigentlich sehr genau wissen, wo der / Zuhörer*in sitzt. Ambeo arbeitet aber mit einem ähnlichen Prinzip

Nein, man braucht nicht zwingend Head-Tracking, dadurch wird aber die Lokalisation besser. Wer Airpods hat, kann sie ja mit Head-Tracking über Netflix nutzen.
Aber 3D Audio funktioniert binaural auch über handelsübliche Kopfhörer ganz gut. Nicht ganz optimal, aber so können eben "alle" Netflix KundInnen erreicht werden
0
vrtonung18.07.22 15:26
Ich konnte einen Tonmeister von Netflix interviewen und weiß nun wie genau das Processing funktioniert, hier habe ich es für alle Interessenten beschrieben: https://www.vrtonung.de/netflix-ambeo-spatial-audio-dolby-atmos-filme-streaming/
0
Castiel
Castiel05.08.22 15:57
Wie kann ich denn nun meinen LG TV auf Stereo stellen ? Da kann ich nur PCM wählen. Aber PCM ist doch nicht gleich Stereo ?
0
Tirabo05.08.22 21:54
Castiel
Wie kann ich denn nun meinen LG TV auf Stereo stellen ? Da kann ich nur PCM wählen. Aber PCM ist doch nicht gleich Stereo ?

PCM, also Pulse Code Manipulation ist nichts anderes als ein Verfahren der Digitalisierung des analogen Audiosignals.

Ob es nun in Stereo oder Mono geschieht, hat damit also nichts zu tun.

Vielleicht steht ja dein Fernseher bereits auf Stereo? Möglicherweise reichen die eingebauten Lautsprecher im TV einfach nicht aus, um im Raum bei der Aufstellung ein vernünftiges Stereopanorama darzustellen.
0

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.