Google gibt ersten Zugriff: Gemini AI soll mit GPT-4 konkurrieren

Erste Unternehmen haben Zugriff auf Googles Conversational AI Gemini. Das KI-Modell soll mit Open AI konkurrieren und könnte bald in die Dienste des Unternehmens integriert werden. Womöglich profitiert auch der Assistant.

Schon bald könnte Google OpenAI, Microsoft, Meta und Co. mit dem hochfunktionalen KI-Modell Gemini aktiv auf dem AI-Markt Konkurrenz machen. Nach Angaben von The Information könnte das multimodale Modell – das direkt als Pendant zu GPT-4 gelten kann – schon bald in Google-Dienste integriert werden. Einige Unternehmen haben jüngst Zugriff erhalten.

Unterstützt Gemini schon bald YouTube, die Suche, den Assistant und weitere Google-Dienste?

Jon Victor schreibt für The Information:

Giving outside developers access to the software, known as Gemini, means Google is getting close to incorporating it in its consumer services and selling it to businesses through the company’s cloud unit.

Gemini ist schon seit einiger Zeit im Test. Google hat die eigenen KI-Teams DeepMind und Brain Team zusammengelegt, um im AI-Wettbewerb möglichst schnell und effizient handeln zu können. Neben dem KI-Chatbot Bard (als Antwort auf ChatGPT und Bing Chat) und der stetigen Optimierung der auf AI basierenden Search Generative Experience setzt Google zusehends auf die Erweiterung der eigenen KI-Modelle. Dazu gehört neben PaLM 2 nun auch Gemini.


Google Search Generative Experience Update:

Website Support in AI-Antworten und Search Labs außerhalb der USA

© Google DeepMind - Unsplash, Turm aus Würfeln, abstrakt, weiß und blau, Linien gehen davon aus
© Google DeepMind – Unsplash

An Gemini sollen mehrere hundert Mitarbeiter:innen arbeiten. Google CEO Sundar Pichai erklärte kürzlich:

[…] Using the computational resources of Google, they’re focused on building more capable systems, safely and responsibly. This includes our next-generation foundation model, Gemini, which is still in training. Gemini was created from the ground up to be multimodal, highly efficient at tool and API integrations and built to enable future innovations, like memory and planning. While still early, we’re already seeing impressive multimodal capabilities not seen in prior models. Once fine-tuned and rigorously tested for safety, Gemini will be available at various sizes and capabilities, just like PaLM 2.

Das KI-Modell stellt einer Art LLM-Kombination dar und soll deutlich mehr Parameter nutzen als PaLM 2 und auch die vergleichbaren Modelle von OpenAI. Jetzt testen erste, ungenannte, Unternehmen die Nutzbarkeit. Künftig könnte Google Gemini in diversen Kontexten einsetzen, denn das KI-Modell soll eigenständig Probleme lösen und beispielsweise Text- und Bildelemente erstellen können – auch Videoelemente sind vorstellbar. Womöglich kommt das Modell als Grundlage mit generativer KI für den Google Assistant zum Tragen, auch eine Integration in der Suche und auf YouTube ist denkbar. Der KI-Experte Rowan Cheung fasst auf X den Status quo zum funktionalen KI-Modell zusammen.

Im Wettlauf mit OpenAI und Co. – KI-Modelle und -Features werden mit Hochdruck entwickelt

Während Google sich auf die Integration von immer mehr AI Tools und Modellen wie Gemini vorbereitet, trägt auch die Tech-Konkurrenz zu Diversifizierung des KI-Markts bei. So arbeitet beispielsweise Apple im Rahmen des Projekts Ajax an einer eigenen Conversational AI, wofür täglich Millionen ausgegeben werden. Meta wiederum arbeitet an einem eigenen neuen KI-Modell, das deutlich kraftvoller sein soll als das diesen Sommer gelaunchte Llama 2 und ebenfalls das Level von OpenAIs GPT-4 erreichen soll. Das Unternehmen hinter ChatGPT möchte im November auf dem ersten eigenen Developer Event, dem DevDay, neue Lösungen vorstellen – eine GPT-4.5 oder gar GPT-5-Vorstellung schloss CEO Sam Altman aber bereits aus.

Derweil dringen immer mehr KI-basierte Lösungen auf den Markt, die Advertisern, Sellern, Creatorn und Co. helfen können. Zwei Beispiele stellen Amazon jüngst gelaunchte neue KI-erstellte Produktbeschreibungen und Adobes Firefly-Lösungen, die jetzt auch kommerziell nutzbar sind, dar. Mit Gemini als Modell, das diversen AI-Lösungen zugrunde liegt, könnte Google jedoch bald für Aufruhr sorgen, da diverse Dienste davon profitieren könnten. Und die Google-Dienste werden schließlich von Milliarden Menschen genutzt. Erst vor Kurzem ist Demis Hassabis, Google DeepMind CEO und Mitgründer des Bereichs, vom TIME Magazine auf die Liste der 100 einflussreichsten Persönlichkeiten im Bereich der Künstlichen Intelligenz gesetzt worden. Dort ist er in Gesellschaft von Sam Altman, Microsofts Chief Scientist Jaime Teevan und auch Yann LeCun, dem Chief AI Scientist von Meta. Letzterer hat mit I-JEPA vor einiger Zeit ein KI-Modell vorgestellt, das wie Menschen und Tiere lernen soll und als „Human-like AI“ gilt.

0c341188caf74be3982ec4fc836627fd

Google Assistant wird revolutioniert und soll Gen AI Features wie ChatGPT und Bard erhalten

© Reza Rostampisheh - Unsplash, bunte Papierflieger auf graumeliertem Hintergrund
© Reza Rostampisheh – Unsplash