Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

iMessage-Patent: Textnachrichten mit der Stimme des Absenders vorlesen lassen

Textnachrichten sind seit Jahrzehnten aus dem Alltag nicht mehr wegzudenken. Was einst mit kurzen SMS begann, hat sich mittlerweile zu vielseitigen Diensten entwickelt, welche über zahlreiche Funktionen verfügen, beispielsweise Gruppen-Chats. Es gibt allerdings Situationen, in welchen man eingegangene Botschaften nicht sofort lesen kann, etwa beim Autofahren. Apple stellt daher unter anderem auf dem iPhone die Möglichkeit zur Verfügung, sich die Texte vorlesen zu lassen, und zwar mit der Stimme von Siri. Diese klingt zwar ziemlich natürlich und für die meisten Nutzer auch angenehm, hat jedoch naturgemäß keinen Bezug zum Absender einer Nachricht.


Apples Idee: Stimme des Absenders liest Nachricht vor
Schöner wäre es, wenn beim Vorlesen die Stimme der Person zu hören wäre, von welcher die Nachricht stammt. Das ist derzeit noch Zukunftsmusik, könnte irgendwann aber zur Realität werden. Apples Entwicklungsabteilung hat sich nämlich entsprechende Gedanken gemacht, wie ein Patentantrag des Unternehmens zeigt. Die Schutzschrift wurde jetzt von US Patent & Tradmark Office veröffentlicht und von Patently Apple in der Datenbank der Behörde entdeckt. Apple beschreibt darin ein Verfahren, mit welchem sich Textnachrichten stimmlich personalisieren lassen. Voraussetzung dafür ist, dass ein Nutzer von iMessage sein Stimmprofil zur Verfügung stellt. Dieses kann beispielsweise anhand bisheriger Interaktionen mit Siri auf dem iPhone erstellt, aber auch durch das Einsprechen eines bestimmten Textes erzeugt werden.


Verfahren basiert auf individuellen Stimmprofilen
Das Stimmprofil wird dann Apples Vorstellungen zufolge zusammen mit einer Textnachricht verschickt, der Absender muss das allerdings ausdrücklich genehmigen. Das iPhone des Empfängers speichert die übermittelte Profildatei, auch hierfür ist wiederum eine Zustimmung erforderlich. Anschließend ist das Smartphone in der Lage, Texte dieses Absenders mithilfe KI-basierter Sprachsynthese in dessen Stimme vorzulesen. Der Vorgang muss nur einmal vollständig abgeschlossen werden, damit die individualisierte Sprachausgabe zukünftig automatisch zur Verfügung steht. Die Übermittlung des eigenen Stimmprofils kann laut dem Patentantrag auch vorsorglich erfolgen, und zwar unabhängig von Senden einer Nachricht. Ob Apple bereits an der praktischen Umsetzung des in der Schutzschrift beschriebenen Features arbeitet, ist nicht bekannt.

Kommentare

piik20.02.23 17:37
Nett, aber ob man das so will, sein Stimmprofil weitergeben?
Damit könnte man allerhand nicht so angenehmen Schabernack treiben.
+13
Tommy1980
Tommy198020.02.23 17:45
iMessage für Android und Windows wäre sinnvoll. Was soll ich als Anwender denn mit diesem Sprachkäse? Maaan Apple.
-4
KarstenM
KarstenM20.02.23 17:45
Mir drängt sich hier die Frage auf: Hat man auf die eigene Stimme das Urheberrecht?
+5
jmh
jmh20.02.23 18:02
ich denke, dem muss man dann aktiv zustimmen, bevor die eigene stimme fuer andere erklingt ...
wir schreiben alles klein, denn wir sparen damit zeit.
0
becreart20.02.23 18:03
jmh
ich denke, dem muss man dann aktiv zustimmen, bevor die eigene stimme fuer andere erklingt ...

wirklich?
0
Gammarus_Pulex
Gammarus_Pulex20.02.23 18:06
Warum dann nicht eine Sprachnachricht schicken?
+16
tk69
tk6920.02.23 18:23
Witzig, aber unnötig. Dann kann man gleich eine Sprachnachricht senden… 🤔
+7
tk69
tk6920.02.23 18:24
Tommy1980
iMessage für Android und Windows wäre sinnvoll. Was soll ich als Anwender denn mit diesem Sprachkäse? Maaan Apple.
Meinst du, dass du User von Whatsapp wegbewegen könntest?
0
Nebula
Nebula20.02.23 19:23
Sprachnachrichten sind die Pest. Waren sie schon zu Zeiten der Anrufbeantworter.
»Wir werden alle sterben« – Albert Einstein
+10
tranquillity
tranquillity20.02.23 20:29
Eben. Sinnvoller wäre doch wohl, wenn Sprachnachrichten automatisch als Text erscheinen würden. Dann dauert es auch nicht so lange, bis man den Inhalt erfasst hat.
+8
Calibrator20.02.23 20:47
Bin schon gespannt auf den ersten KI-gestützten Enkeltrick.
+7
Thorsten Hechtfischer20.02.23 21:22
Evtl wäre es am einfachsten miteinander zu telefonieren.Der Unterschied in der Wahrnehmung von gesprochenem zu geschriebenem ist meist immensö.
+4
MrWombat
MrWombat20.02.23 22:39
Nebula
Sprachnachrichten sind die Pest. Waren sie schon zu Zeiten der Anrufbeantworter.
Mühsam war die umständlichen Bedienung der Anrufbeantworter.
Sprachnachrichten empfinde ich mittlerweile als angenehmen Abwechslung - vorausgesetzt ich brauch nur einen Play Button drücken und muss mich nicht mühsam durch Menüs quälen.
0
Nebula
Nebula20.02.23 23:38
Ich meinte wirklich die Nachrichten und nicht den Zugang. Sprachnachrichten zu erfassen, nimmt deutlich mehr Zeit in Anspruch und meist geben sich die Leute auch keine Mühe. Es ist dann schnell eher lautes und zielloses Denken. Eine Vertextlichung fände ich auch auch sinnvoller, ohne Ähs und Öhs. Und Pausen, Husten, Gespräche mit dem Hund muss ich mir dann auch nicht anhören. Ich behaupte, eine typische 10-Minuten-Nachricht hat vielleicht 4 Minuten Inhalt. Nicht eingerechnet sind Wiederholungen in derselben oder zu vorherigen Nachrichten. Die passieren in Textform eher seltener und im Gespräch kann man sie leicht abwenden.
»Wir werden alle sterben« – Albert Einstein
+4
PharaoM
PharaoM21.02.23 00:55
Wenn Inhalte zu umständlich zu beschreiben sind, ist eine Sprachnachricht schon lange für mich die bessere Lösung.
Dafür werde ich aber sicher nicht Apple meine Stimme geben.
0
LoCal
LoCal21.02.23 09:54
Nebula
Sprachnachrichten sind die Pest. Waren sie schon zu Zeiten der Anrufbeantworter.

Ich mache das aber einen Unterschied zwischen vorgelesener Textnachricht (wie das z.B. bei CarPlay gelöst ist) und echter Sprachnachrichten.

Die vorgelesenen Textnachrichten sind völlig ok und frei von "Füllung".
Sprachnachrichten leiden ja vorallem darunter, dass die Versender meistens nicht in der Lage sind, ihre Gedanken in kurze Texte zusammen zufassen und dann auch noch mit mit Ähs, Hmms … und sonstigen Geräuschen in die Länge ziehen.
Ich hab zwar keine Lösung, doch ich bewundere dein Problem
+1
Apex
Apex21.02.23 10:02
ich wünschte eher man käme weg vom gebraddel und würde die Sprachnachrichten in Text umwandeln lassen können
+1
MrWombat
MrWombat21.02.23 10:13
Würde meine Stimme dann auch meinen Dialekt sprechen - oder auf Hochdeutsch
+1
Earlemann21.02.23 18:03
Puh. Bin offen für und interessiert an neuen Technologien, aber hier führte dieser Bericht auch erstmal zu Skepsis und Magenumdrehen.
Calibrator hat's auf den Punkt gebracht:
Calibrator
Bin schon gespannt auf den ersten KI-gestützten Enkeltrick.
Dabei geht's gar nicht mal nur so um diese iMessage Spielerei, sondern um die Erkenntnis, dass es offenbar schon längst möglich ist, durch Aufnahme von Sprache ein Stimmprofil zu erstellen. Apple sind nicht die Einzigen - Mit Erschrecken habe ich gerade gelesen, dass für Microsoft nur 3 Sekunden Sprachaufnahme ausreichen, um ein Stimmprofil zu erstellen:

Und die Qualität ist unglaublich gut - der Großteil der Hörer wird keinen Unterschied hören, bzw nicht erkennen, welches die Echte und welches die KI-Stimme ist.
Heisst: man kann seinen Ohren (bzw den Geräten, die uns Sprache vorspielen) künftig nicht mehr trauen. Der gemeine Enkeltrick ist dabei nur ein perfides Beispiel von Vielen, was passieren kann (und wird?) wenn dieses Thema in die falschen Hände gerät. Vermutlich wird nicht nur Geld vom leichtgläubigen Opa ergaunert, sondern Ehen geschieden, unangenehme Kollegen aus dem Job katapultiert, Kriege angezettelt?
+2
Calibrator21.02.23 21:03
Ich seh´ schon alle mit Vocodern vor den Bildschirmen sitzen und diktieren.
0
Gent
Gent22.02.23 14:58
Gruselig. Dann sprechen irgendwann mal Tote zu Dir.
-1
Earlemann27.04.23 08:41
Wie befürchtet - es ist schon da:

Und das sogar noch abartiger als erwartet. Die Scammer rufen Eltern an und verwenden die generierten AI Stimmprofile ihrer Kinder, um die Eltern so hart einzuschüchtern, in dem sie vorgeben, sie hätten die Kinder entführt! Die AI Stimme winselt am Telefon um Hilfe und das wird einige Eltern dazu bewegen Geld locker zu machen. Leute, passt auf. Traut Euren Ohren nicht. Sprecht Euch ab, denkt Euch ein Safeword aus.
0

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.