Google setzt seine Hoffnungen auf Gemini, um GPT-4 zu überholen


Schalten Sie den Editor’s Digest kostenlos frei

Es hat ein Jahr gedauert, aber Google hat endlich eine kohärente Antwort auf die überraschende Herausforderung seiner Dominanz im Bereich der künstlichen Intelligenz geliefert, die mit der Einführung von ChatGPT einherging.

Die Veröffentlichung von Gemini, einer Familie großer Sprachmodelle, in dieser Woche wird dem Unternehmen eine stärkere Plattform bieten, um sich sowohl gegen OpenAI, das Unternehmen hinter ChatGPT, als auch gegen Microsoft zu wehren, das in diesem Jahr die Modelle von OpenAI verwendet hat, um seine gesamte Software und Cloud-Dienste zu verbessern.

Die Frage ist nun, ob Gemini einen bedeutenden Unterschied zu den bestehenden Diensten von Google machen kann – und, was vielleicht noch wichtiger ist, ob es die Grundlage für eine neue Reihe von Diensten bilden kann, die KI viel tiefer in den Alltag tragen.

Mit den drei „Varianten“ von Gemini, die diese Woche angekündigt wurden, drückt Google endlich einer Technologie seinen Stempel auf, zu deren Pionierarbeit seine eigenen Forscher beigetragen haben, die aber durch ChatGPT von OpenAI in den Mainstream eingeführt wurde. Die Pro-Version steht beispielsweise in direktem Gegensatz zu GPT-3.5 von OpenAI, dem Modell hinter der kostenlosen Version von ChatGPT und dem Arbeitstier für viele der ersten generativen KI-Anwendungen anderer Unternehmen, die dieses Jahr auf den Markt kamen.

Der kleinere Gemini Nano wird mit Systemen wie der kleinsten Version von LLaMa 2, dem Open-Source-Modell von Facebook, verglichen, sodass er auf einem mobilen Gerät ausgeführt werden kann. Wie immer geht Apple mit Bedacht vor, bevor es generative KI auf das iPhone bringt, aber das Erscheinen von Gemini auf Googles neuestem Pixel-Handy ist ein Zeichen dafür, dass es sich nicht leisten kann, zu lange zu warten.

Es ist das Spitzenmodell Gemini Ultra, das Anfang nächsten Jahres erscheinen soll und das die größten Hoffnungen von Google in sich trägt, im Wettlauf um die Umwandlung generativer KI in ein nützlicheres Alltagswerkzeug mit GPT-4 von OpenAI gleichzuziehen oder es zu überholen. Das Unternehmen ist in diesem Jahr zurückgefallen, verfügt aber über einige klare Vorteile, die dazu beitragen könnten, Gemini im Jahr 2024 auf einen großen Markt zu bringen.

Eine davon ist die Verteilung. Google gab beispielsweise diese Woche bekannt, dass Gemini zu Chrome hinzugefügt wird, das mehr als 60 Prozent des Browsermarktes ausmacht, und Milliarden von Webnutzern sofortigen Zugriff auf Tools ermöglicht, mit denen beispielsweise Webinhalte analysiert werden können Seiten.

Während Google seine bestehende Marktmacht auf diese Weise nutzt, um seine KI-Ambitionen voranzutreiben, werden die Wettbewerbsbehörden genau beobachten.

Ein weiterer Vorteil für Google ist die Unsicherheit rund um OpenAI. Nach der schockierenden Entlassung und Wiedereinstellung von CEO Sam Altman im letzten Monat werden die vielen Unternehmen, die ihre eigenen generativen KI-Pläne auf der Grundlage der OpenAI-Modelle entwickelt haben, versuchen, ihre Wetten abzusichern.

Das Suchunternehmen hofft auch, dass sein Bard-Chatbot besser mit ChatGPT mithalten kann, da er über ein besseres Sprachmodell verfügt. Die größte Hoffnung, einen Vorsprung zurückzugewinnen, besteht jedoch möglicherweise darin, als Erster die nächsten bahnbrechenden Dienste auf Basis generativer KI zu entwickeln. Einige der für Gemini beanspruchten Fähigkeiten weisen darauf hin, wo Google diese vermutet.

Es hat zum Beispiel viel aus der Tatsache gemacht, dass Gemini von Anfang an „multimodal“ konzipiert war – das heißt, dass es nicht nur Text, sondern auch Bilder, Videos und Audio verstehen kann. Damit eignet es sich laut Google besser als Modelle wie GPT-4 für die Bewältigung von Alltagssituationen, die auf Sinne wie Sehen und Hören angewiesen sind.

Das könnte ein Schritt hin zu KI-Systemen sein, die in der realen Welt besser funktionieren. Es ist jedoch noch zu früh, um zu sagen, welche Anwendungen dies ermöglichen könnte oder ob Google tatsächlich die angebliche technische Überlegenheit erreicht hat.

Ein weiterer Entwicklungsweg liegt in den Argumentations- und Planungsfähigkeiten von Gemini, wie Google behauptet. Dies sind die Fähigkeiten, die den Boden für persönliche Assistenten bereiten könnten, die in der Lage sind, komplexe Probleme anzugehen und einen Aktionsplan zu erstellen.

Wenn solche Assistenten mit anderen Internetdiensten verknüpft werden, könnten sie auch zu Agenten werden, die im Namen ihrer Nutzer handeln. Stellen Sie sich zum Beispiel einen Einkaufsagenten vor, der nicht nur die gewünschten Produkte ausfindig macht, sondern diese auch bezahlt.

Dies zeichnet sich bereits jetzt als einer der wichtigsten KI-Schlachten des Jahres 2024 und darüber hinaus ab. Einen ersten Schritt in diese Richtung hat OpenAI letzten Monat gemacht, als es verkündete, dass seine Nutzer auf Basis seiner Modelle rudimentäre Agenten bauen und diese dann in einem OpenAI-App-Store zum Verkauf anbieten könnten. Das könnte auf den nächsten großen KI-Durchbruch über ChatGPT hinaus hinweisen – und dieses Mal hat Google nicht die Absicht, zurückzubleiben.

[email protected]



ttn-de-58

Schreibe einen Kommentar