Googles KI holt gegenüber ChatGPT auf: Gemini Pro 1.5 steigt auf ein neues Niveau

Google kann auf seinem Weg, den Thron der künstlichen Intelligenz zurückzugewinnen, nicht aufgehalten werden, denn sein Prestige steht dabei auf dem Spiel. Obwohl wir die riesige Menge an Überraschungen, die uns beim nächsten Google I/O erwarten, noch nicht kennen, hat das Unternehmen bereits einen großen Teil seiner aktuellen Modelle weiterentwickelt. Es plant sogar, Gmail durch die Einführung von Gemini zu revolutionieren.

Schritt für Schritt und Neuerung für Neuerung verbessert Google seine generative KI, in dem Versuch, gegenüber dem rasanten Vorstoß seines Hauptkonkurrenten, Open AI, Boden gutzumachen. Gemini spielt eine entscheidende Rolle in der Strategie von Google, da das Unternehmen sich darauf konzentriert hat, eine multimodale Strategie zu entwerfen, um mit den besten Waffen gegen alles, was ChatGPT mit sich bringt, anzutreten. Das Duell der Chatbots wird zu einem beinahe tödlichen Kampf.

Google spezialisiert seine generative KI auf Bild und Audio

Mit einer kürzlichen Veranstaltung, die auf die Cloud und die KI-Fähigkeiten ausgerichtet war, stellte Google alle Neuheiten vor, die sich an seine Kunden richten, insbesondere an die Geschäftskunden. Denn Workspace zog viel Aufmerksamkeit auf sich, obwohl nicht alles professionelle KI ist, von der auch wir Android-Nutzer durch den qualitativen und funktionalen Sprung von Gemini profitieren werden.

Google verbessert weiterhin seine Haupt-Generative-KI-Motoren, dazu gehört Image2 für die Erstellung grafischen Inhalts und Gemini Pro 1.5, das mittlere Sprachmodell (von den drei, die Gemini hat). Laut dem Unternehmen steigen die Generierungs- und Interpretationsfähigkeiten; zudem werden Neuerungen eingeführt, um den Inhalt, der für Chatbots geeignet ist, breiter zu gestalten.

Gemini Pro 1.5

Zu den Neuheiten in Googles KI gehören:

  • Image2 erhält die Fähigkeit, Gifs zu erstellen. Obwohl es bereits sehr gute Ergebnisse bei der Erstellung von Bildern innerhalb von Tools wie Gemini (nur in den USA) erzielte, führt Google nun die Möglichkeit ein, dass Image2 bis zu vier Sekunden lange Gifs nur auf Anfrage erstellt. Außerdem wird Google ein unsichtbares Wasserzeichen einführen, um den als KI-erzeugt gekennzeichneten Inhalt zu identifizieren.
  • Gemini Pro 1.5 analysiert jetzt auch Audioinhalte. Neben Text und Bildern kann der Chatbot nun auch beliebige Soundabschnitte identifizieren, ohne sie in Text umschreiben zu müssen. Dies ermöglicht beispielsweise die Zusammenfassung eines Anrufs oder eines Interviews.
  • Googles KI erstellt jetzt Videos: Google Vids entsteht. Dieses Tool, das vorerst ausschließlich professionellen Nutzern von Workspace vorbehalten ist, ermöglicht die Erstellung von Videos auf Befehl. Der Inhalt wird voraussichtlich für Präsentationen und Ähnliches geeignet sein.
  • Gemini kommt zu Gmail. Der Sprung, den Google vorbereitet hat, wird bald hier sein: Die Modelle von Gemini werden im E-Mail-Client landen, so dass das Erstellen neuer E-Mails einfach durch eine Anfrage erfolgt. Zudem wird Gmail Sprachbefehle integrieren.

Wie üblich werden all diese Neuheiten im Bereich der Künstlichen Intelligenz nach und nach den Nutzern zur Verfügung gestellt. Zuerst werden die Abonnenten von Google Workspaces davon profitieren, später werden sie in den Diensten für Privatpersonen eingeführt. Gemini wird nur für die Abonnenten von Google One auch in der mobilen App verfügbar sein.

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

GPT-5 und größerer Kontext

Während die Technologie mit atemberaubender Geschwindigkeit voranschreitet, sticht die künstliche Intelligenz als eine der faszinierendsten Grenzen der Innovation hervor. Inmitten dieses technologischen Wirbels taucht GPT-5, die neueste Iteration des Sprachmodells von OpenAI, als ein Thema heißer Erwartungen auf. Diese neue Version des bereits beeindruckenden GPT-4 verspricht, die Fähigkeit von Maschinen, menschliche Sprache zu verstehen und […]

Wie man ChatGPT verwendet, um Ihre Texte zusammenzufassen und umzuschreiben

In der heutigen Zeit ist die Fähigkeit, originelle und relevante Inhalte zu produzieren, unerlässlich, besonders wenn man sich inmitten der riesigen Menge an Informationen im Internet hervorheben möchte. Der Fortschritt der künstlichen Intelligenz (KI) hat Werkzeuge wie ChatGPT Talk hervorgebracht, die den Prozess des Umschreibens und Zusammenfassens von Texten nicht nur schneller, sondern auch dynamischer […]

Maximieren Sie Ihren Gewinn: So verdienen Sie mit der Chat-GPT-Technologie

Einführung: Wie man mit Chat-GPT Geld verdient Im ständig fortschreitenden Bereich der künstlichen Intelligenz und des maschinellen Lernens taucht ein Begriff immer wieder auf: GPT oder Generative Pre-Trained Transformers. Einfach ausgedrückt, GPT ist ein wesentlicher Bestandteil von KI-Modellen und darauf spezialisiert, menschenähnlichen Text zu verstehen und zu erzeugen. Die dynamischen Fortschritte in diesem Bereich haben […]

Navigieren in der Co-Evolution von KI und Menschheit

Die KI verwandelt uns von Schöpfern und Antwortenden in Kuratoren und Fragesteller. In diesem provokativen Gespräch mit Peter Deng, VP für Verbraucherprodukte und Leiter von ChatGPT bei OpenAI, werden wir die Rolle der Menschen im Zeitalter der KI erkunden. Was sind die praktischen und philosophischen Implikationen der KI? Wie wird sie unsere Wahrnehmung von uns […]

Entdecken Sie die 6 besten Möglichkeiten, Chat GPT jetzt zu nutzen, um online Geld zu verdienen!

Einführung in die Nutzung von Chat GPT zur Gewinnmaximierung Unsere Einführung in die Gewinnmaximierung mit den besten Methoden des Generativen Vortrainierten Transformators (GPT) enthüllt revolutionäre Innovationen in der künstlichen Intelligenz, die den E-Commerce und den Kundenservice revolutionieren. Die vielfältigen Anwendungen des GPT umfassen unter anderem Chatbots und die Textgenerierung. Die besten Wege, um Chat GPT […]

Prompt-Techniken Wie man das Beste aus künstlicher Intelligenz herausholt

Prompt-Techniken: Wie man das Beste aus künstlicher Intelligenz herausholt

Generative Künstliche Intelligenz, wie ChatGPT, Gemini, DALL-E, Midjourney oder Stable Diffusion, sind fortschrittliche Technologien, die in der Lage sind, Texte, Dokumente, Mindmaps, Tabellen, Kalkulationstabellen, Präsentationen, Bilder oder Videos zu erstellen. Sie benötigen jedoch präzise Anleitungen, klare, direkte Vorgaben und ausreichende Informationen, um das bestmögliche Ergebnis zu erzielen. Diese Anweisungen oder Leitfäden werden als Prompts bezeichnet, […]