ChatGPT ist in letzter Zeit das Gesprächsthema schlechthin in der Tech-Welt, und das aus gutem Grund. Das KI-gestützte Tool ist beeindruckend, aber es gibt auch zahlreiche Sorgen – Urheberrechtsverletzungen, Plagiate, Verwendung in Schulen, sogar verlorene Arbeitsplätze. Kein Wunder also, dass Menschen, die mit dem Schreiben ihren Lebensunterhalt verdienen, sich über KI aufregen, die scheinbar gut schreiben kann.
Aber es gibt auch Technologieunternehmen, die mit leuchtenden Augen die Zukunft sehen – die Fähigkeit von Computern, sich auf natürliche Weise zu unterhalten und Inhalte zu erstellen, die von Unternehmen tatsächlich genutzt werden können, und das in einem Umfang, mit einer Geschwindigkeit und zu Kosten, die Menschen unmöglich erreichen können.
Doch ChatGPT, Google Bard und Microsofts Bing Chat sind nur ein kleiner Teil der generativen KI-Revolution. Die Kunstwelt hat sich im letzten Jahr über neue generative KI-Kunsttools aufgeregt und sich mit den gleichen Problemen beschäftigt – Voreingenommenheit, Urheberrecht, verlorene Arbeitsplätze usw. Deepfakes, bei denen neuronale Netzwerke Menschen in Videos mit verblüffendem Realismus austauschen, waren nur die Spitze des Eisbergs.
KI-Tools sind gekommen, um zu bleiben – wo bleibt Apple
Diese Tools sind nicht nur eine Eintagsfliege. Sie stecken noch in den Kinderschuhen und werden sehr schnell besser. Große Technologieunternehmen wie Google und Microsoft sehen in dieser neuen generativen KI einen wichtigen Bestandteil unserer Zukunft. Die Behauptung und der Aufbau einer Führungsposition ist für sie so wichtig wie die Dominanz im Internet in den 90er-Jahren.
Aber es gibt einen Spieler, der nicht mitspielt: Apple. Das wertvollste Technologieunternehmen der Welt scheint eine komplette Revolution im Computerbereich zu verpassen. Apple ist kein Unbekannter im Bereich der künstlichen Intelligenz – mit Siri hat das Unternehmen eine Revolution im Bereich der Assistenten ausgelöst –, aber es hat seinen Vorsprung bereits verspielt, indem es nicht stark genug investiert hat, um sich gegen die Konkurrenz durchzusetzen.
Wiederholt sich die Geschichte mit generativer KI? Oder hat Apple etwas Erstaunliches in petto und ist einfach nur unglaublich geheimnisvoll, wie immer?
Analytische KI ist alt, kreative KI ist etwas Neues
Alle großen Technologieunternehmen schwärmen schon seit Jahren von KI. KI, die Ihre Sprache für Diktate und Sprachassistenten isoliert und analysiert und zwischen verschiedenen Stimmen unterscheiden kann, um personalisierte Ergebnisse zu erzielen. KI, die aufgenommene Töne zusammensetzt, um mit Ihnen zu “sprechen”. KI, die Teile von Bildern isoliert, um sie einfach zu bearbeiten. KI, die Objekte und Personen identifiziert, um Ihre Suche zu unterstützen. KI, mit der Sie den Text in jedem Bild auswählen können.
Apple macht all diese Sachen. Es ist dem Unternehmen so wichtig, dass es in alle seine Chips eine Neural Engine einbaut, eine spezielle Hardware, die maschinelle Lernaufgaben wie diese beschleunigt. Apple arbeitet sogar an der größten aller KI-Herausforderungen: selbstfahrende Autos.
Aber generative KI ist etwas anderes. Dabei handelt es sich um eine neuere Klasse der KI, die fast ohne Texteingabe etwas völlig Neues erschafft. Ja, das Trainieren der Modelle nimmt eine Menge Zeit und einen Berg von Daten in Anspruch, aber dann sind die Modelle, die die Benutzer ausführen, vergleichsweise klein sind und können scheinbar unendlich viele neue Dinge erzeugen. Eine KI, die alle Kartoffeln in Ihrem Fotoarchiv findet, ist etwas völlig anderes als eine, die eine Kartoffel von Grund auf in einer Vielzahl von Kunststilen zeichnen kann.

Microsoft Bing kann nun in natürlicher Sprache Suchergebnisse ausliefern.
Mark Hachman / IDG
ChatGPT, Bard und Bing
Die generative KI-Technologie, die im Moment für Schlagzeilen sorgt, ist ChatGPT von OpenAI. Der fortschrittliche Chatbot und die darauf aufbauenden Tools werden bereits in der Geschäftswelt eingesetzt, um Artikel, E-Mails, Vorlagen und vieles mehr zu generieren – mit einigen Kontroversen. Die Ergebnisse sind so gut, dass es einen Wettlauf um die Entwicklung guter Werkzeuge für Lehrkräfte gibt, um mit ChatGPT geschriebene Aufgaben zu erkennen.
Da es mit einer Vielzahl von Webdaten trainiert wurde, die zwar veraltet, aber für viele Dinge immer noch relevant sind, kann es fast wie eine Suchmaschine sein, mit der man sich unterhält. Das hat Google so sehr aufgeregt, dass es sein eigenes konkurrierendes KI-Produkt, Bard, angekündigt hat, das noch nicht ganz fertig ist, aber bald ausprobiert werden kann. Eine öffentliche Demo lieferte falsche Informationen über das James-Webb-Weltraumteleskop – Google hat also eindeutig noch einiges zu tun.
Microsoft hat außerdem eine neue Konversationssuchfunktion angekündigt, die Sie ab sofort in Bing und dem Edge-Browser nutzen können. Sie basiert auf ChatGPT mit einigen Erweiterungen und Änderungen.
Dies sind mehr als nur Spielzeuge oder Kuriositäten. Es handelt sich um echte Werkzeuge, mit denen Menschen echte Arbeit verrichten und kreative Projekte vorantreiben. Alles steht noch am Anfang, und manchmal hat man das Gefühl, dass es noch nicht reif für die breite Masse ist, aber das Tempo der Verbesserungen und Innovationen ist atemberaubend – die KI-Modelle verdoppeln ihre Komplexität und Raffinesse alle sechs Monate. (Man muss dabei anmerken, dass ChatGPT nicht unfehlbar ist, das Tool verdreht ebenfalls Fakten und denkt sich Quellenhinweise aus, die nur als echt aussehen. – Anm. d. Red)
Stabile Diffusion, Midjourney, DALL-E
Und es geht nicht nur um das geschriebene Wort. Vergangenes Jahr hatten wir alle unseren Spaß daran, aber mit weiterem Training und Verbesserungen sind diese generativen KI-Kunsttools für viel mehr gut als nur für die Erstellung von Bildern von Katzen im Anime-Stil, die mit einem Fischglas über dem Kopf tauchen.
Midjourney und Stable Diffusion sind inzwischen so gut, dass sie Kunstwerke erstellen, die problemlos die Titelseite eines Magazins zieren könnten – und sie können Dutzende Bilder in wenigen Minuten erstellen.
Diese Werkzeuge können viel mehr als nur völlig neue Bilder in einer Vielzahl von Stilen erstellen. Sie können auch bereits vorhandene Bilder verändern. Im App Store gibt es bereits eine Fülle von Apps zur Erstellung von Avataren und Profilen, die diese Software nutzen, um ein paar Fotos von Ihrem Gesicht zu machen und sie auf verblüffende Weise zu verändern, indem sie körperliche Merkmale verändern, ohne dass jemand etwas davon mitbekommt. So kann man sich beispielsweise eine Sonnenbrille aufsetzen, die völlig echt aussieht.
Vergangenes Jahr war das noch eine Spielerei, aber die Technologie entwickelt sich so schnell, dass sie bereits ein Werkzeug ist. Adobe hat bereits viele seiner Anwendungen mit KI-gesteuerten Bildgenerierungswerkzeugen verbessert, um Fotos mit nur einem Klick wiederherzustellen und das Löschen von Objekten erheblich zu verbessern. Das Unternehmen plant jedoch, sein Toolset bald um eine umfangreiche generative KI zu erweitern, mit der Sie buchstäblich Bilder in bestehende Fotos und Kunstwerke einfügen können, die so aussehen, als ob sie genau hineinpassen.

Anna Kendrick statt Marilyn Monroe auf dem Poster von Andy Warhol.
Ein schmales Fenster zum Handeln
Und was hat Apple mit all dem zu tun? Das Unternehmen hat sich als Technologieführer positioniert, insbesondere im kreativen Bereich. Aber abgesehen von einigen Blogbeiträgen einer ML-Forschungsseite und einigen relativ einfachen Optimierungen der Schnittstellen für Apple Silicon, scheint Apple diese Sache auszusitzen. Ich meine, ich finde DiffusionBee von Divam Gupta supercool, aber es ist eine kleine, unabhängige Drittanbieter-App, die seit einer ganzen Weile nicht mehr aktualisiert wurde und bereits hinter dem Stand der Technik bei der KI-Bilderzeugung zurückliegt.
Diese Technologie wird die Welt völlig verändern. Sie glauben mir nicht? Schauen Sie sich die Forschung von OpenAI zur Erzeugung von Musik an. Sie erzeugt neue Musik in einer Vielzahl von Stilen, darunter auch Gesang, völlig aus dem Nichts. Microsofts VALL-E kann schockierend realistische Stimmen erzeugen, die einer echten Person sehr nahe kommen, indem es nur einen winzigen Ausschnitt der Stimme dieser Person als Eingabe verwendet. Es kann sogar verschiedene emotionale Zustände imitieren.
Viele dieser Projekte und Dutzende weitere befinden sich noch in der Forschungsphase. Es ist nicht schwer, bei jedem von ihnen einige Mängel zu finden. Aber der Weg von der Forschung in die reale Welt wird schnell sein, und die Fehler werden dann kaum noch zu finden sein.
Mit der Neural Engine, die in den iPhone- und Mac-Chips integriert ist und bis zu 15,8 Billionen Operationen pro Sekunde ausführen kann, sowie mit Core ML und APIs für maschinelles Lernen verfügt Apple über die nötigen Werkzeuge, um einen eigenen generativen KI-Chatbot zu entwickeln. Aber wir haben noch keine Bewegung aus Cupertino gesehen. Genauigkeit und Geschwindigkeit sind bei KI-Chatbots von größter Bedeutung – Googles Aktienkurs und Glaubwürdigkeit stürzten diese Woche nach einem Fehler in seinem Bard-Chatbot ab – es ist also möglich, dass das Unternehmen hinter den Kulissen an Siri arbeitet. Aber angesichts der Fülle von Tools, die dem Unternehmen zur Verfügung stehen, bleibt die Frage: Passt Apple überhaupt auf?
Wenn Apple den Bereich der künstlichen Intelligenz (KI) nicht aufmerksam verfolgt, ist ihm vielleicht nicht bewusst, wie schnell er sich entwickelt. Es dauerte nur ein Jahr, bis generative KI von einem “albernen Online-Forschungsprojekt-Spielzeug” zu “duellierenden Ankündigungen von Microsoft und Google” wurde. In zwei weiteren Jahren werden diese Tools zehnmal besser sein und es wird viel mehr davon geben. Es wird schwer sein, zu unterscheiden, was echt ist und was von der KI aus dem Nichts generiert wurde. Wenn Sie große Ideen, aber nur begrenzte künstlerische Fähigkeiten haben, wird die generative KI die Verwirklichung Ihrer Träume erheblich erleichtern.

Billionen von Operationen pro Sekunde.
Foundry
Mit Siri war Apple der Vorreiter bei der Einführung eines KI-Sprachassistenten für die breite Masse. Als sich die Technologie weiterentwickelte, fiel Apple weit zurück, und heute wird Siri oft als Enttäuschung angesehen, die nicht mit Google Assistant oder Alexa mithalten kann. Wenn es um generative KI geht, hat Apple nicht einmal einen First-Mover-Vorteil, wie es ihn bei Siri hatte. Große und kleine Technologieunternehmen bieten bereits leistungsstarke Tools an. Wenn wir nichts unternehmen, wird Apple einfach einen Teil der Hardware herstellen, auf der unsere generative KI-gesteuerte Zukunft laufen wird.
Apple darf das Feld nicht den anderen überlassen
Ohne die Leistungsfähigkeit dieser neuen Technologie in seiner eigenen Software und seinen Diensten zu nutzen, wird Apple es allen anderen überlassen, den Stand der Technik für die vielleicht wichtigste Veränderung im Computerbereich seit Jahrzehnten zu definieren. Vielleicht ist das Unternehmen damit einverstanden, aber da die Hardware-Verkäufe abflachen und die Software- und Dienstleistungsseite von Apples Geschäft wächst, kann es sich nicht leisten, bei der generativen KI-Revolution nicht führend zu sein.
Natürlich ist Apple eines der geheimnisvollsten Unternehmen in der Tech-Branche, vor allem, wenn es um Software geht. Apple könnte große Teams haben, die hart daran arbeiten, generative KI-Funktionen in iMovie, Final Cut Pro, Logic Pro, Fotos, Mail, Messages und die gesamte iWork-Suite zu bringen. All diese Programme könnten durch leistungsstarke generative KI-Werkzeuge völlig umgestaltet werden. Wir wissen, dass Apple vor etwa einem Jahr mindestens ein Unternehmen für generative KI, AI Music, gekauft hat. Es wäre nicht unvernünftig, wenn Apple in diesem Jahr zumindest ein Tool zur sofortigen Erstellung eines Original-Soundtracks für Ihr Video in seine Produkte aufnehmen würde.
Es könnte sein, dass wir von Apple überhaupt nichts über generative KI hören, und dann auf der WWDC, BAM! Generative KI von Weltklasse in allen Apple-Produkten!
Ich hoffe, dass das der Fall ist, denn wenn Apple bei einer solch transformativen Technologie zu spät dran ist, wird seine Software in den kommenden Jahren der Konkurrenz um Jahre hinterherhinken.
Dieser Artikel stammt ursprünglich von unserer Schwesterpublikation “Macworld” und wurde aus dem Englischen übersetzt.