Google kann auf seinem Weg, den Thron der künstlichen Intelligenz zurückzugewinnen, nicht aufgehalten werden, denn sein Prestige steht dabei auf dem Spiel. Obwohl wir die riesige Menge an Überraschungen, die uns beim nächsten Google I/O erwarten, noch nicht kennen, hat das Unternehmen bereits einen großen Teil seiner aktuellen Modelle weiterentwickelt. Es plant sogar, Gmail durch die Einführung von Gemini zu revolutionieren.
Schritt für Schritt und Neuerung für Neuerung verbessert Google seine generative KI, in dem Versuch, gegenüber dem rasanten Vorstoß seines Hauptkonkurrenten, Open AI, Boden gutzumachen. Gemini spielt eine entscheidende Rolle in der Strategie von Google, da das Unternehmen sich darauf konzentriert hat, eine multimodale Strategie zu entwerfen, um mit den besten Waffen gegen alles, was ChatGPT mit sich bringt, anzutreten. Das Duell der Chatbots wird zu einem beinahe tödlichen Kampf.
Google spezialisiert seine generative KI auf Bild und Audio
Mit einer kürzlichen Veranstaltung, die auf die Cloud und die KI-Fähigkeiten ausgerichtet war, stellte Google alle Neuheiten vor, die sich an seine Kunden richten, insbesondere an die Geschäftskunden. Denn Workspace zog viel Aufmerksamkeit auf sich, obwohl nicht alles professionelle KI ist, von der auch wir Android-Nutzer durch den qualitativen und funktionalen Sprung von Gemini profitieren werden.
Google verbessert weiterhin seine Haupt-Generative-KI-Motoren, dazu gehört Image2 für die Erstellung grafischen Inhalts und Gemini Pro 1.5, das mittlere Sprachmodell (von den drei, die Gemini hat). Laut dem Unternehmen steigen die Generierungs- und Interpretationsfähigkeiten; zudem werden Neuerungen eingeführt, um den Inhalt, der für Chatbots geeignet ist, breiter zu gestalten.
Zu den Neuheiten in Googles KI gehören:
- Image2 erhält die Fähigkeit, Gifs zu erstellen. Obwohl es bereits sehr gute Ergebnisse bei der Erstellung von Bildern innerhalb von Tools wie Gemini (nur in den USA) erzielte, führt Google nun die Möglichkeit ein, dass Image2 bis zu vier Sekunden lange Gifs nur auf Anfrage erstellt. Außerdem wird Google ein unsichtbares Wasserzeichen einführen, um den als KI-erzeugt gekennzeichneten Inhalt zu identifizieren.
- Gemini Pro 1.5 analysiert jetzt auch Audioinhalte. Neben Text und Bildern kann der Chatbot nun auch beliebige Soundabschnitte identifizieren, ohne sie in Text umschreiben zu müssen. Dies ermöglicht beispielsweise die Zusammenfassung eines Anrufs oder eines Interviews.
- Googles KI erstellt jetzt Videos: Google Vids entsteht. Dieses Tool, das vorerst ausschließlich professionellen Nutzern von Workspace vorbehalten ist, ermöglicht die Erstellung von Videos auf Befehl. Der Inhalt wird voraussichtlich für Präsentationen und Ähnliches geeignet sein.
- Gemini kommt zu Gmail. Der Sprung, den Google vorbereitet hat, wird bald hier sein: Die Modelle von Gemini werden im E-Mail-Client landen, so dass das Erstellen neuer E-Mails einfach durch eine Anfrage erfolgt. Zudem wird Gmail Sprachbefehle integrieren.
Wie üblich werden all diese Neuheiten im Bereich der Künstlichen Intelligenz nach und nach den Nutzern zur Verfügung gestellt. Zuerst werden die Abonnenten von Google Workspaces davon profitieren, später werden sie in den Diensten für Privatpersonen eingeführt. Gemini wird nur für die Abonnenten von Google One auch in der mobilen App verfügbar sein.
No Responses