Google stoppt Auswertung von Sprachaufnahmen durch Menschen

Smarte Lautsprecher wie der Google Home Max schneiden Gespräche mit - die bislang auch von Menschen ausgewertet wurden Foto: Franziska Gabbert/Archiv

Vielen Nutzern von Sprachassistenten war nicht bewusst, dass die Mitschnitte auch von Mitarbeitern der Anbieter abgetippt werden können, um den Dienst zu verbessern. Nach einem Eklat stoppte Google die Praxis in Europa, und der Hamburger Datenschützer wurde aktiv.

Hamburg (dpa) - Google lässt in Europa Aufnahmen aus seinen vernetzten Lautsprechern vorerst nicht mehr von Menschen auswerten. Der Stopp gilt in der gesamten EU mindestens noch bis Ende Oktober, wie der Hamburger Datenschutzbeauftragte Johannes Caspar am Donnerstag mitteilte.

In den vergangenen Monaten war bekanntgeworden, dass Amazon, Google und Apple bei ihren Sprachassistenten Alexa, Assistant und Siri einen Teil der Aufnahmen auch von Menschen auswerten lassen, um die Genauigkeit der Spracherkennung zu verbessern. Sie betonen, dass die Fragmente dabei anonymisiert werden.

Caspar leitete ein Verwaltungsverfahren gegen den Internet-Konzern ein, um das Anhören der Mitschnitte durch Google-Mitarbeiter oder Dienstleister zu untersagen. Laut einer Mitteilung von Google an die Behörde sei das Transkribieren der Aufnahmen bereits am 10. Juli eingestellt worden, erklärte ein Sprecher des Datenschützers. Damals waren Mitschnitte von den vernetzten Google-Home-Lautsprechern aus den Niederlanden bekanntgeworden und hatten für einen Eklat gesorgt.

Caspar verwies speziell auf diesen Fall. Wie sich durch den Bericht der Whistleblower gezeigt habe, ließen sich den aufgezeichneten Gesprächen zum Teil sensible personenbezogene Informationen aus der Privat- und Intimsphäre entnehmen, argumentierte er. Zudem seien die Aufnahmen teilweise auch wegen fehlerhafter Aktivierung gestartet worden. Damit bekam Google Sätze mit, die gar nicht für den Sprachassistenten gedacht waren.

Caspar erklärte, er habe «erhebliche Zweifel», dass der Einsatz des Assistants von Google die Vorgaben der EU-Datenschutzgrundverordnung (DSGVO) erfülle. Sie sieht unter anderem vor, dass Nutzer über die Verwendung ihrer Daten ausreichend informiert werden müssen, um dem zustimmen zu können. Ihm geht es unter anderem «um eine transparente Aufklärung Betroffener über die Verarbeitung der Sprachbefehle, aber auch über die Häufigkeit und die Risiken von Fehlaktivierungen». Zudem gibt es das Problem, dass die Mikrofone der Lautsprecher in einem Haushalt zum Beispiel auch die Stimmen von Gästen einfangen können, die der Auswertung ihrer Daten nicht zugestimmt haben.

Caspar kann einen Stopp der Praxis für maximal drei Monate anordnen, denn grundsätzlich zuständig ist für Google in Europa die irische Datenschutzbehörde. Diese Frist liefe allerdings erst an, wenn er einen sogenannten Verwaltungsakt erlässt - noch läuft die Anhörung, und der Google-Verzicht ist freiwillig.

«Wir stehen mit der Hamburger Datenschutzbehörde in Kontakt und prüfen, wie wir zum einen Audioaufnahmen testen und zum anderen unseren Nutzern die Verwendung ihrer Daten besser erklären können», erklärte Google. Die Praxis trage dazu bei, dass die Spracherkennung für Menschen mit verschiedenen Dialekten und Akzenten funktioniere. «Im Zuge dieser Tests werden die Audioclips nicht mit den Nutzerkonten verknüpft. Im übrigen werden die Tests nur bei etwa 0,2 Prozent aller Clips durchgeführt.»

Der Hamburger Datenschützer ist in Deutschland für Google zuständig, da das Unternehmen dort seine deutsche Niederlassung hat. Caspar regte ähnliche Maßnahmen der zuständigen Behörden auch gegen andere Sprachassistenten wie Amazons Alexa und Apples Siri an.

Bis zu den ersten Medienberichten war kaum öffentlich bekannt, dass auch Menschen die Aufnahmen der Sprachassistenten zu hören bekommen. Apple verwies zumindest schon länger in einem Sicherheitsdokument darauf, dass auch «eine geringe Anzahl von Transkriptionen» für die Verbesserung des Dienstes eingesetzt werden könne. Zugleich schürte ein Bericht des Finanzdienstes Bloomberg im Frühjahr Zweifel daran, wie weit die Anonymisierung im Fall von Amazons Echo-Lautsprechern geht: Es hieß, Dienstleister bekämen zum Teil auch die Seriennummern der Geräte und den Vornamen des Nutzers angezeigt.