Wie Tausende Amazon-Mitarbeiter Alexa-Sprachbefehlen zuhören – interessanter Hintergrund-Artikel
Damit Sprachassistenten intelligent klingen und sinnvolle Antworten geben, ist im Hintergrund erst einmal jede Menge an manueller Sprachanalyse sowie redaktioneller Arbeit erforderlich. Beispielsweise sorgte eine eigene Siri-Redaktion dafür, dass Siri jene spaßig-launischen Antworten gab, die in den Anfangstagen des Dienstes für viel Belustigung sorgten. Ein sehr interessanter Bloomberg-
Artikel beleuchtet am Beispiel von Amazon, wie viele menschliche Ohren damit beschäftigt sind, Nutzer-Sprachbefehle auszuwerten. Zwar geht es im Artikel nur um Amazon, allerdings arbeitet Apple wohl nicht anders – anonymisierte und Nutzern nicht zuzuordnende Sprach-Schnipsel werden sechs Monate lang auf Apples Servern gespeichert.
Eine große Schar Analyse-ZuhörerDie Rede ist davon, dass "Tausende" Amazon-Mitarbeiter sich anhören, was Nutzer von Alexa erbaten. Diese müssen eine strenge Verschwiegenheitserklärung unterzeichnen und dürfen selbstverständlich nichts vom Gehörten nach außen weitergeben. Das Ziel dieses personalintensiven Einsatzes ist es, Alexa zu noch besserem Verständnis zu verhelfen und auch Antworten zu optimieren. Pro Schicht geht ein Reviewer rund 1000 Aufzeichnungen durch – zum größten Teil handelt es sich um die immer gleichlautenden, einfachen Steuerbefehle.
Umgang mit möglicherweise rechtswidrigen InhaltenEin allgemeiner Chat-Raum hilft den Mitarbeitern, schwierige und unverständliche Befehle gemeinsam zu bearbeiten. Die Beschäftigten sollen sich auch dann an den Kanal wenden, wenn sie belastende oder verstörende Dinge gehört haben – um Stress abzubauen, nicht um weitere Schritte einzuleiten. So heißt es in den Anweisungen, Amazons Aufgabe sei es nicht, in irgendeiner Weise einzuschreiten. Selbst wenn Alexa möglicherweise kriminelle Handlungen aufgezeichnet hat, bleiben die Daten unter Verschluss.
Große VorsichtAmazon betont, man lege extreme Sorgfalt beim Umgang mit den Aufzeichnungen an den Tag. Mitarbeiter haben keinerlei Möglichkeit, an Nutzerinformationen zu gelangen. Ein mehrstufiges Authentifizierungsverfahren und strenge Audits sorgen dafür, Zugang zu beschränken und personenbezogene Daten abzuschotten. Amazons Arbeitsweise unterscheidet sich damit nicht sonderlich von den Optimierungsverfahren, die Apple und Google verwenden. Beide betonen, Audio-Schnipsel zwar für eine gewisse Zeit aufzubewahren und damit die Spracherkennung zu verbessern, allerdings jegliche persönlichen Informationen abzuschneiden.