1623844

Siri: 40 Jahre Forschung für intelligenten Sprachassistenten

06.11.2012 | 10:37 Uhr |

Der Sprachassistent im iPhone 4S und in den nachfolgenden Geräten von Apple hat eine weibliche Stimme und einen nicht übersehbaren Sinn für Humor, kennt sich gut mit aktuellen Wetterberichten und Finanzmärkten aus und kann alle aktuellen Spiele der Bundesliga aufzählen.

Dass Apple mit Siri im Oktober 2011 einen Volltreffer bei der Weiterentwicklung seiner Software gelandet hat, zeigt das Angebot an derzeit verfügbarer Konkurrenz: Der Spracherkennungs-Spezialist Nuance bringt seit letztem Sommer eine ähnliche Anwendung, die Nina heißt, auf den Markt. Google bietet seit dem Update auf die neueste Android-Version Jelly Bean seinen Suchdienst Google Now . Selbst die gewöhnliche Such-App auf dem iPhone hat der Konzern mit Spracherkennung ausgestattet. Hardwarehersteller wie LG und Samsung bieten für ihre Nutzer mit Quick Voice und S Voice auch Smartphone-Assistenten nach Siri-Art.

Beta-Version

Bei der Vorstellung im Oktober 2011 bezeichnete Scott Forstall die Funktion im iPhone 4S als eine Software im Beta-Stadium. Siri konnte kurz nach dem Start nur wenige Sprachen wie Englisch, Deutsch und Französisch und hatte Probleme mit starken Akzenten. Die Anfragen und Befehle, die der Assistent auf Englisch problemlos verstehen und ausführen konnte, führten in anderen Sprachen zu einer Standardantwort: „Soll ich im Internet danach suchen?“ Doch Apple hat bei der Vorstellung versprochen, dass die eingebaute iPhone-Sekretärin dazulernt, je mehr Nutzer die Funktion gebrauchen. Und tatsächlich, derzeit kann man seinen Tag ziemlich problemlos mit dem Assistenten organisieren .

Obwohl Apple Siri intelligent nennt, wird die Funktion durch die Zahl der Nutzer, die sie anwenden, verbessert. Die meisten Prozesse der Spracherkennung bearbeiten die Server von Apple, das iPhone schickt nur das aufbereitete Audiosignal ab. Nach Bearbeitung, Erkennung, Suche und Aufbereitung der Ergebnisse für die Sprachausgabe am iPhone bleiben die gesprochenen Schnipsel jedoch dort gespeichert.

Wie andere aktuelle Spracherkennungsprogramme basiert Apples Siri vermutlich auf einem statistischen Verfahren zur Auswertung der gesprochenen Sprache. Die Software versucht vorauszusagen, welche Variablen nach den bereits erkannten Daten in einer Einheit folgen werden. Dabei vergleicht die Software die gegebene Einheit mit einer Referenzdatenbank und wertet die Wahrscheinlichkeit mehrerer Möglichkeiten für die nachfolgenden Variablen aus. Als mögliche Lösung wird die Einheit mit dem höchsten Wahrscheinlichkeitsgrad gewählt ( Hidden Markov Model ).

In unserem Beispiel hat die Spracherkennungssoftware die Aufgabe, einzelne Wörter zu erkennen. Auf Grund der Vokale und Konsonanten (Phoneme) im Wort versucht die Software vorauszusagen, um welches Wort es sich dabei genau handelt. Hierbei wird die neue Audiodatei auf dem Server mit den bekannten Mustern aus der Datenbank verglichen. Je größer und vielfältiger die Datenbank mit solchen Mustern ausgestattet ist, desto genauer erkennt die Software einzelne gesprochene Wörter.

Abstammung von Siri

Der intelligente Sprachassistent von Apple entstammt einer App, deren Entwickler der Konzern 2010 übernommen hat. Mittlerweile ist jedoch nur noch einer der Gründer, Tom Gruber, bei Apple. Die beiden anderen, Adam Cheyer und Dag Kittlaus, haben die Firma verlassen, Kittlaus hat gleich nach der Siri-Veröffentlichung im Oktober 2011 gekündigt , Adam Cheyer ist seit dem Sommer 2012 nicht mehr bei Apple.

Doch die Geschichte des intelligenten Sprachassistenten fängt deutlich früher an. Die ersten Forschungen begannen bereits 1966, als DARPA (Defence Advanced Research Projects Agency) eine Abteilung zur Erforschung künstlicher Intelligenz Artificial Intelligence Center (AIC) gründete. DARPA ist eine Behörde des Verteidigungsministeriums der USA, deren primäre Aufgabe in der Forschung und Entwicklung für militärische Zwecke besteht. Zeitweise hieß die Behörde etwas harmloser ARPA (ohne „Defence“-Zusatz). Zu den anderen Projekten, die aus den Untersuchungslaboren der DARPA stammen, gehören APRANET , derzeit bekannt als Internet, und das Global Positioning System (GPS). Auch das Projekt eines externen Eingabe-Gerätes, später einfach Maus genannt, wurde von Douglas Engelbart und seinem Team bei DARPA 1968 erfunden.

Die Abteilung der künstlichen Intelligenz AIC bei DARPA ist eine der größten weltweit. Zu den erforschten Gebieten gehören neben der Spracherkennung auch Wissensdatenbanken, Robotik, Computergrafik, Diskurs und Kommunikation. Die Forschungsprojekte werden durch die Regierung finanziert. Den ersten Prototypen eines Dialog-Assistenten haben die Forscher von AIC bereits 1977 vorgestellt. In den nachfolgenden Jahren wurden die Projekte von AIC immer komplexer. Siri stammt aus dem neueren Projekt PAL ( Personal Assistant that Learns ).

SRI International

Im Juli 2003 hat die Forschungs- und Entwicklungsbehörde DARPA ein Finanzierungsprogramm in Höhe von 22 Millionen US-Dollar für das Projekt PAL in der Abteilung für künstliche Intelligenz AIC ausgeschrieben. Die Ausschreibung gewann SRI ( Stanford Research Institute ) International, ein naturwissenschaftlich orientiertes Forschungsinstitut an der Stanford University. Die Finanzierung wurde zunächst auf fünf Jahre beschränkt. Die erste Phase endete 2008, daraus resultierte CALO ( Cognitive Agent that Learns and Organizes ). Das Wort selbst stammt aus dem Lateinischen („calonist“) und bedeutet „Diener“ (des Soldaten).

Die Hauptanforderungen an solche Software waren proaktive Handlungen – CALO sollte im Idealfall etwas erklären können, aus den Erfahrungen lernen und Anweisungen folgen. Vorausgesetzt, dass das Programm wirklich aus den Interaktionen mit dem Nutzer lernt, kann es einfache wiederholbare Aufgaben übernehmen und bei komplexen Problemsituationen unterstützen. Derzeit wird am SRI International weiter zu CALO geforscht. Beim Übergang von der ersten zur zweiten Finanzierungsphase des Projekts gab es organisatorische und personelle Umstellungen. Dabei wurde Siri Inc. als eine Tochterfirma des Forschungsinstitutes ausgegliedert.

Menschen hinter Siri

Einer der Projektleiter in der ersten Finanzierungsphase von CALO am SRI International war Adam Cheyer . Zusammen mit ihm hatten Dag Kittlaus und Tom Gruber die neue Firma gegründet. Dag Kittlaus arbeitete seit August 2002 bei Motorola, 2007 wechselte er für kurze Zeit zu SRI International, von da an arbeitete er bis 2010 an Siri. Auch Tom Gruber kam über die Stanford University zu dem neuen Unternehmen. Er forschte am Knowledge Systems Laboratory, das sich auf Ontologie und Interaktion zwischen Menschen und Computern spezialisiert hat.

Von der Gründung im Dezember 2007 bis November 2009 konnte die neue Firma rund 24 Millionen US-Dollar an Investitionen sammeln. Die Hauptinvestoren waren dabei Morgenthaler Ventures, Menlo Ventures und ein Millionär aus Hong Kong, Li Ka-shing. Im Februar 2010 startete der virtuelle persönliche Assistent zum ersten Mal im App Store, nur zwei Monate später, im April, kaufte Apple die kleine Firma. Die Applikation war zunächst aus dem App Store verschwunden. Rund ein Jahr später war die Anwendung als iOS-Funktion fest im iPhone 4S implementiert.

 

 

0 Kommentare zu diesem Artikel
1623844