Wenn Sie ein Liebhaber von Apples Bücher-App auf Mac, iPad und iPhone schätzen, könnte eine neue Funktion Sie interessieren oder erschrecken: Apple hat den Start eines neuen digitalen Projekts zur Erstellung von Hörbüchern mithilfe von KI angekündigt. Da der Markt für Hörbücher stark wächst, aber nur ein Bruchteil der Bücher tatsächlich in Audiodateien umgewandelt wird, bietet Apples neue Technologie eine Möglichkeit, auf die “Kosten und Komplexität” verzichten zu können, die mit der Erstellung menschlicher Sprachaufnahmen verbunden sind.
Erste Bücher vorhanden – nur auf Englisch
Die ersten öffentlich verfügbaren Ergebnisse des Projekts sind bereits im Apple Book Store zu finden. Wenn Sie die Bücher-App öffnen und nach “AI Narration” suchen, finden Sie im US-Book-Store mehrere Dutzend Titel aus den Bereichen Belletristik und Romantik, die mit “Von Apple Books vorgelesen” gekennzeichnet sind. Im deutschen Ableger finden sich erst drei Titel, alle in englischer Sprache. Tippen Sie auf dieses Label und Sie werden darüber informiert, ob Ihnen das Buch von “Madison”, dem digitalen Sopran für diese Genres, oder von “Jackson”, dem Baritonäquivalent, vorgelesen wird. Beide basieren angeblich auf einem echten menschlichen Sprecher, aber der Ton wurde mithilfe von KI erzeugt.
Auf Apples Website kann man sich auch Hörproben von “Helena” und “Mitchell” anhören, den digitalen Stimmen für die Genres Sachbuch und Persönlichkeitsentwicklung, die jedoch noch nicht für öffentlich zugängliche Hörbücher verwendet wurden.
Sprachsynthese mit echten Vorbildern
Apple versichert uns, dass die Stimmen das Ergebnis “fortschrittlicher Sprachsynthesetechnologie mit wichtiger Arbeit von Teams aus Linguisten, Qualitätskontrollspezialisten und Toningenieuren” sind, aber es ist klar, dass die ansprechendste Eigenschaft von Madison und Jackson ihre Effizienz ist. Die Aufnahme eines menschlichen Sprechers dauert einige Wochen, kostet möglicherweise Tausende von Dollar und erfordert die Anwesenheit eines erfahrenen Sprechers oder einer berühmten Persönlichkeit (oder zunehmend auch des Autors), weshalb so viele Bücher weiterhin nur als Text vorliegen. Der KI-Ansatz erhöht die Kosteneffizienz des Prozesses beträchtlich.
Aber ist er auch wirklich effektiv? Ich habe mir die ersten Seiten von “Shelter From The Storm” von Kristen Ethridge angehört und war erstaunt, wie unmenschlich es klang. “Madison” klingt nicht wirklich wie eine Person und kann ihre Sprachmuster nicht überzeugend an den Inhalt des Textes anpassen. Es fehlt auch die nicht greifbare menschliche emotionale Qualität, die dem Hörer hilft, bei der Sache zu bleiben. Ich driftete immer wieder ab und filterte den Ton als Hintergrundgeräusch heraus.
Die Technologie wird zweifellos immer besser und kann vielleicht in einigen Jahren menschliche Sprecher ersetzen, aber so weit ist es noch nicht. Es ist klar, dass die Automatisierung der Sprachausgabe bei schnell produzierten Büchern mit geringer Leserzahl viel Geld einsparen wird, aber es ist auch klar, warum Apple bei der Einführung dieses Verfahrens für bekanntere Titel und bei der Bekanntmachung dieses Schrittes im Allgemeinen so zurückhaltend ist. Soweit uns bekannt ist, gab es keine Standard-Pressemitteilung für das Projekt, und Apple scheint seine Werbung eher an Autoren und Verleger als an Medienseiten oder die breite Öffentlichkeit zu richten.
Autoren und Verlage mit Kritik
Und diese Autoren sind vielleicht nicht so begeistert von der Idee. Wie der Guardian anmerkt, ist diese Strategie nicht nur bei den Lesern, sondern auch bei vielen anderen Interessengruppen auf Kritik gestoßen. Ein Hörbuchproduzent und ein Literaturagent, die von der Zeitung kontaktiert wurden, sprachen jeweils von dem Wert, den hochwertige Erzählungen bieten, und äußerten eine gewisse Skepsis gegenüber dem Projekt, aber ernsthaftere Vorbehalte könnten von politischen oder rechtlichen Instanzen kommen. Mit diesem neuen Dienst scheint Apple in die Erstellung und nicht nur in den Verkauf von Hörbüchern einzusteigen, was eine neue Front für Anschuldigungen wegen wettbewerbswidrigen Verhaltens eröffnen wird.
Dieser Artikel ist zunächst bei unseren Kollegen der Macworld erschienen und wurde aus dem Englischen übersetzt