2297450

Kann man sich in Siri ab iOS 11 verlieben?

07.09.2017 | 16:23 Uhr | Halyna Kubiv

In einem ausführlichen Bericht schildert "Wired", wie Apple Siri auf Vordermann bringt. Werden Visionen aus Hollywood wahr?

Die Idee kam laut "Wired ", nachdem sich Apples leitender Ingenieur Alex Acero "Her" angeschaut hat. Dort gab Scarlett Johansson eine smarte digitale Assistentin, in die sich der andere Hauptprotagonist, gespielt von Joaquin Phoenix, verliebte. Der Clou im Film: Johansson war kein einziges Mal auf dem Bildschirm zu sehen, sie gab "Her" nur die Stimme. Acero lies den Film nochmals laufen, diesmal hat er den Streifen nicht geschaut, sondern mit verschlossenen Augen angehört. Haupterkenntnis: Im Unterschied zu Siri klang die imaginäre Assistentin ganz natürlich, die Roboterstimme störte nicht.

Dies war vor ein paar Jahren, in rund einer Woche wird mit iOS 11 eine neue Version von Siri (zunächst nur für Englisch) veröffentlicht. Das Hauptmerkmal der neuen Assistentin wird eine natürliche Stimme sein. Laut Acero hat Apple in den Anfangsjahren die Siri-Technologie (von Nuance ) lizenziert, vor wenigen Jahren hat die Apple-Abteilung das Back-End des Programms komplett überarbeitet und auf Maschinelles Lernen sowie schlaue Algorithmen gesetzt. Denn die Spracherkennung ist nur ein Aspekt von Siri, mit den neuen Methoden konnte der Assistent viel genauer werden und rund 95 Prozent aller Anfragen erkennen. Dazu kommt eine Art der Stimmenerkennung: Siri muss die Stimme aus den Umgebungsgeräuschen filtern, der Assistent muss ebenfalls die Stimme des Benutzers von allen anderen Stimmen unterscheiden. So ist beispielsweise die Erkennung auch bei den starken Akzenten möglich. Vor kurzem haben noch Sicherheitsforscher herausgefunden, wie Siri Geräusche unterscheiden kann, die kein menschliches Ohr wahrnimmt. Sprich, der Hack kann unbemerkt vom Nutzer durchgeführt werden. Um solche Angriffe zu verhindern, muss sich Siri nochmals verbessern.

Wie Siri neue Sprachen lernt

Wie der digitale Assistent menschlicher wird, kann man an einem Beispiel einer neuen Sprache verfolgen. Das Team um Acero sucht im Ziel-Land oder besser gesagt im Sprachraum, nach Datenbanken von Audio-Dateien, die dann Siri-Server bearbeiten. Dazu wird ein lokales Stimmen-Team angeheuert, die Mitglieder lesen Zeitungsartikel, Bücher, Webpublikationen. Danach transkribieren die Apple-Mitarbeiter diese Aufnahmen, identifizieren die Phoneme (kleinstes bedeutungstragener Bestandteil der gesprochenen Sprache) und trainieren somit das Siri-Netzwerk. Nach dieser ersten Sprachstunde wird Siri im Land freigegeben, jedoch erst nur im Diktat-Modus: An Siri direkt kann sich der Nutzer noch nicht wenden, jedoch eine Notiz oder Anfrage an die Websuche diktieren. Das gibt Apple noch mehr Sprach-Daten und so etwas wie kulturellen Kontext. Dabei beginnen Apple-Ingenieure eine epische Suche nach allen möglichen Profis, die Siri in mehreren Varianten vertonen sollten. Die Stimme soll auch eine Einstellung übertragen: Hilfreich und freundlich, entschlossen, aber nicht zu schroff; freundlich, aber nicht gestellt. Nach Acero hat nicht jeder guter Schauspieler eine gute Assistenten-Stimme, diese muss für das menschliches Ohr und Computer-Prozessor gut unterscheidbar sein. Dazu braucht Apple alle unterschiedlichen Varianten eines Lautes, je nachdem welche anderen Laute diesem im Wort folgen oder davor stehen.

Auf den Einwand von "Wired", Google Assistant und Alexa hätten Siri überholt, winken Joswiak und Acero ab. Siri ist nicht so präskriptiv wie es Google Assistant und Alexa seien. Die Anfragen können nicht nach einem gewissen Schema geformt werden, sondern werden so gestellt, wie es auch beim normalen Spachgebrauch üblich ist. Nach Angaben von Apple nutzen Siri rund 375 Millionen Menschen mindestens einmal pro Monat, dazu ist der Assistent in 36 Ländern verfügbar, das sind mehr als bei allen Wettbewerbern zusammen.

Und dennoch, Siri hat nach wie vor neben dem Problem mit der Robot-ählichen Stimme eines mit dem Gedächtnis, und zwar nicht dem eigenen, sondern dem des Nutzers. Apple will den Assistenten ab iOS 11 etwas proaktiver machen. Die Anwender müssen sich in die neue Siri-Version nicht gleich verlieben, sollten sie zumindest aber öfter nutzen.

Macwelt Marktplatz

2297450