Schalten Sie den Editor’s Digest kostenlos frei
Roula Khalaf, Herausgeberin der FT, wählt in diesem wöchentlichen Newsletter ihre Lieblingsgeschichten aus.
Google hat eine neue Reihe generativer künstlicher Intelligenzmodelle auf den Markt gebracht, die zum ersten Mal direkt auf Mobiltelefonen laufen werden. Dies ist ein Durchbruch in den Bemühungen des Technologieunternehmens, es mit Konkurrenten wie dem ChatGPT-Hersteller OpenAI aufzunehmen.
Das Unternehmen beschrieb „Gemini“ als sein „größtes, leistungsfähigstes und allgemeinstes“ KI-System, das Informationen aus Bildern und Audio analysieren kann und über ausgefeilte Argumentations- und „Planungs“-Fähigkeiten verfügt. Es wird ab Mittwoch den Bard-Chatbot von Google antreiben und ab dem nächsten Jahr breiter in der Suchmaschine eingeführt.
Eine als „Nano“ bekannte Version von Gemini wurde speziell für die Ausführung auf Mobilgeräten entwickelt und sollte in die neuesten Pixel-Telefone von Google integriert werden. Google teilte der Financial Times mit, dass dies „nativ“ auf dem Gerät laufen würde und dass das „Nano“-Modell „für Mobilgeräte optimiert“ sei – sodass Android-Entwickler problemlos KI-Apps und -Funktionen erstellen können, die offline funktionieren oder privat genutzt werden können [information] besser privat auf dem Gerät bleiben“.
Dieser Fortschritt könnte dazu beitragen, ein wirtschaftliches Problem der Technologie zu lösen. Die Ausführung generativer KI mit der auf Mobiltelefonen verfügbaren Rechenleistung statt über die Cloud auf Servern großer Technologiekonzerne würde die Betriebskosten solcher Systeme erheblich senken. Dies bietet auch eine gewisse Sicherheit für diejenigen, die private Daten auf ein Gerät beschränken möchten.
„Ich glaube, dass der Übergang, den wir gerade mit KI erleben, der tiefgreifendste in unserem Leben sein wird, weitaus größer als der Übergang zu Mobilgeräten oder zum Web davor“, sagte Sundar Pichai, CEO von Google und Alphabet, in einem Blogbeitrag. „Diese neue Ära der Modelle stellt eine der größten wissenschaftlichen und technischen Anstrengungen dar, die wir als Unternehmen unternommen haben.“
Generative KI hat eine neue Front im Kampf um die Vorherrschaft großer Technologiekonzerne im Silicon Valley eröffnet. Googles neuestes generatives KI-System folgt einer Reihe von Modellen, die von Unternehmen veröffentlicht wurden, darunter von Microsoft unterstützte OpenAI, Meta und Start-ups wie Anthropic und Mistral, die alle in der Lage sind, plausible Antworten auf Fragen in natürlicher Sprache zu liefern: in Text, Code, Bild und Ton.
Letzten Monat hat der Unternehmensriese Microsoft einen generativen KI-Assistenten namens Copilot in seiner weit verbreiteten Microsoft 365-Suite von Produktivitäts-Apps eingeführt, zu der Word, PowerPoint und Excel gehören.
Laut Google erzielte Gemini bei einem „Industriestandard“-Benchmark, der sogenannte große Sprachmodelle bewertet, die Technologie, die generativen KI-Produkten zugrunde liegt, über 90 Prozent.
Das Unternehmen fügte hinzu, dass Gemini das erste KI-Modell war, das menschliche Experten bei bestimmten Aufgaben übertraf und in mehreren Tests das GPT3.5-Modell von OpenAI übertraf. Insbesondere kann es Probleme des mathematischen Denkens lösen, wissenschaftliche Daten analysieren und fortgeschrittene Codierung durchführen. Einen Vergleich mit dem neuesten GPT4-Modell von OpenAI hat Google nicht angegeben.
Gemini wird ab Mittwoch auch in Bard, dem KI-gestützten Chatbot von Google, in englischer Sprache integriert, der in mehr als 170 Gebieten verfügbar ist, darunter in den USA, Asien und Afrika, und es ist geplant, ihn im nächsten Jahr mit leistungsstärkerer Software zu aktualisieren.
Allerdings wird es noch nicht in Europa oder Großbritannien verfügbar sein, was laut Google auf regulatorische Hürden zurückzuführen ist.
„Wir arbeiten definitiv daran und arbeiten natürlich mit den lokalen Regulierungsbehörden zusammen. . . „Um sicherzustellen, dass wir mit diesen Leuten zusammenarbeiten, bevor wir in einem bestimmten Bereich starten“, sagte Sissie Hsiao, Vizepräsidentin bei Google und General Managerin von Bard.
Hsiao sagte, die Integration würde Bards Fähigkeiten verbessern, „Inhalte zu verstehen und zusammenzufassen, zu argumentieren, Brainstorming zu betreiben, zu schreiben und zu planen“.
Zu den von Google demonstrierten Einsatzmöglichkeiten von Gemini gehörte das Scannen eines handschriftlichen Arbeitsblatts mit mathematischen Formeln, das Markieren von Fehlern und deren Erklärung.
Eine weitere Demonstration von YouTuber Mark Rober nutzte Bard in Kombination mit Gemini, um ein Video zu drehen, in dem er testete, wie man das aerodynamischste Papierflugzeug herstellt. Die KI schlug Experimente und Verbesserungen des Designs sowie Möglichkeiten vor, seine Genauigkeit zu testen, einschließlich des Schießens durch einen Feuerring.
Versionen von Gemini werden im Laufe des Dezembers einigen Entwicklern und Unternehmenskunden zur Verfügung gestellt, wobei der Zugriff im nächsten Jahr breiter ausgerollt wird.