Der neueste Schlag von Elon Musk gegen ChatGPT: Sein Chatbot Grok analysiert jetzt Bilder

Elon Musk präsentiert sein erstes multimodales Modell, eine Weiterentwicklung seiner generativen künstlichen Intelligenz Grok, die jetzt mehrere Aufgaben beherrscht: Neben dem Schreiben von Texten analysiert und versteht sie nun auch Fotografien. Ursprünglich als “rebellisch und einfallsreich” beschrieben, wird dieser Chatbot nicht mehr nur auf Textfragen auf X (früher Twitter) beschränkt sein. Mit diesem Sprung möchte er große multimodale Modelle wie GPT-4 (das Gehirn hinter ChatGPT) oder Googles Gemini herausfordern.

Grok wurde vor Monaten als Alternative zu ChatGPT vorgestellt, die in das soziale Netzwerk X integriert werden sollte, das ebenfalls Elon Musk gehört. Die Weiterentwicklung zu einem Modell, das Bilder analysieren kann, deutet darauf hin, dass die Funktionen erweitert werden, auch um Einfluss auf das autonome Fahren zu nehmen.

xAI, das Unternehmen, das vom Magnaten zur Entwicklung von KI gegründet wurde, behauptet, dass sein Modell die Konkurrenz wie GPT-4V von OpenAI oder Gemini Pro 1.5 von Google in der “Verständnis der realen Welt” übertrifft. Die Daten stammen aus einem von der Firma selbst erstellten Test, den sie mit der Entwicklergemeinschaft teilen möchte.

Grok lernt, die Welt zu analysieren

Zu den Funktionen, die Grok jetzt beherrscht, gehört die Möglichkeit, eine Skizze auf einer Tafel in Python-Code umzuwandeln, um ein Videospiel zu erstellen. Gleichzeitig könnte dieser Chatbot eine Geschichte aus einer einfachen Kinderzeichnung schreiben, um einem kleinen Kind beim Einschlafen zu helfen. Er kann auch Bilder analysieren und Lösungen für verschiedene Probleme vorschlagen.

Unter den Tests, denen es unterzogen wurde und die das Unternehmen als Demonstration seiner Fähigkeiten veröffentlicht, wird es gebeten, die Himmelsrichtung anzugeben, in die das Plüschdinosaurier schaut. Dies bedeutet, dass die KI in der Lage sein muss, die Informationen zu verstehen, die der Kompass im Handy und die Platzierung des Objekts neben ihm liefern.

xAI führt auch zwei von fünf Szenen im Zusammenhang mit dem Fahren als Beispiel an. Es sollte nicht vergessen werden, dass dieses Unternehmen mit Tesla verbunden ist, da beide Unternehmen Musk gehören. Diese KI könnte dazu beitragen, die aktuellen autonomen oder assistierten Fahrsysteme weiterzuentwickeln. Es bleibt abzuwarten, ob die Gemeinschaft die Fähigkeiten und Schwächen des neuen Modells bewerten wird.

Grok-1.5 Vision, oder Grok-1.5V, wird bald für externe Bewertungen verfügbar sein, damit die Benutzer dieser KI ihre Fähigkeiten beurteilen können. Früher wurde der Code von Grok, als es nur Text verarbeitete, öffentlich gemacht, um der Entwicklergemeinschaft zu ermöglichen, damit zu experimentieren. Dies ist ein persönliches Versprechen von Musk, der seine ehemaligen Partner bei OpenAI beschuldigt hat, ihre ursprüngliche Mission zugunsten eines gewinnorientierten Modells aufgegeben zu haben.

Grok lernt, die Welt zu analysieren

Neue Metrik

“Grok-1.5V ist konkurrenzfähig mit bestehenden multimodalen Modellen in einer Reihe von Bereichen, von multidisziplinärem Denken bis zum Verständnis von Dokumenten, wissenschaftlichen Diagrammen, Grafiken, Screenshots und Fotografien”, so das Unternehmen in einem Beitrag auf seiner offiziellen Webseite.

Diese Behauptung wird durch eine Tabelle untermauert, die die von diesem Modell und anderen Marktteilnehmern in den oben genannten Tests erzielten Punktzahlen zeigt. Es handelt sich um den von xAI erstellten Test, RealWorldQA. “Wir freuen uns darauf, RealWorldQA der Gemeinschaft vorzustellen und beabsichtigen, es zu erweitern, wenn unsere multimodalen Modelle verbessert werden”, sagen sie.

Bewerte Diese Seite

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

Prompt-Techniken Wie man das Beste aus künstlicher Intelligenz herausholt

Prompt-Techniken: Wie man das Beste aus künstlicher Intelligenz herausholt

Generative Künstliche Intelligenz, wie ChatGPT, Gemini, DALL-E, Midjourney oder Stable Diffusion, sind fortschrittliche Technologien, die in der Lage sind, Texte, Dokumente, Mindmaps, Tabellen, Kalkulationstabellen, Präsentationen, Bilder oder Videos zu erstellen. Sie benötigen jedoch präzise Anleitungen, klare, direkte Vorgaben und ausreichende Informationen, um das bestmögliche Ergebnis zu erzielen. Diese Anweisungen oder Leitfäden werden als Prompts bezeichnet, […]

Krankenschwestern in den USA protestieren gegen den Einsatz von KI in Krankenhäusern

Krankenschwestern in den USA protestieren gegen den Einsatz von KI in Krankenhäusern

Die Gewerkschaft “National Nurses United” erklärt in einer Mitteilung, dass künstliche Intelligenz (KI) keine “Lebens- oder Todesentscheidungen” ohne menschliche Bewertung und kritisches Denken treffen kann. Künstliche Intelligenz hat seit der Einführung von ChatGPT Ende 2022 unser Leben verändert, und seitdem haben die KI-Modelle verschiedener Technologieunternehmen – wie OpenAI, Meta, Microsoft, Google oder Apple – ihre […]

Funcas befürchtet dass ChatGPT Kundendaten der Banken stehlen könnte

Funcas befürchtet dass ChatGPT Kundendaten der Banken stehlen könnte

Die Stiftung der Sparkassen (Funcas) hat die Banken vor dem Einsatz von generativer Künstlicher Intelligenz (GenAI) wie ChatGPT gewarnt, wegen der Gefahr, die diese beim Schutz vertraulicher Kundendaten darstellen könnte. Insbesondere empfiehlt die Organisation dem Finanzsektor, eigene Programme mit dieser Technologie zu entwickeln, um Lecks zu verhindern und die Vertraulichkeit sicherer zu bewahren. Laut Funcas […]

Empfiehlt den Einsatz von ChatGPT in Tausenden wissenschaftlichen Studien

Empfiehlt den Einsatz von ChatGPT in Tausenden wissenschaftlichen Studien

Der Bibliothekar Andrew Gray machte eine “sehr überraschende” Entdeckung. Er analysierte fünf Millionen wissenschaftliche Studien, die im letzten Jahr veröffentlicht wurden, und stellte einen plötzlichen Anstieg in der Verwendung bestimmter Wörter fest, wie “meticulously” (um 137% mehr), “intricate” (117%), “commendable” (83%) und “meticulous” (59%), in ihren englischen Versionen. Gray, vom University College London, sieht nur […]

Googles KI holt gegenüber ChatGPT auf Gemini Pro 1.5 steigt auf ein neues Niveau

Googles KI holt gegenüber ChatGPT auf: Gemini Pro 1.5 steigt auf ein neues Niveau

Google kann auf seinem Weg, den Thron der künstlichen Intelligenz zurückzugewinnen, nicht aufgehalten werden, denn sein Prestige steht dabei auf dem Spiel. Obwohl wir die riesige Menge an Überraschungen, die uns beim nächsten Google I/O erwarten, noch nicht kennen, hat das Unternehmen bereits einen großen Teil seiner aktuellen Modelle weiterentwickelt. Es plant sogar, Gmail durch […]

Skoda beginnt mit der Herstellung des überarbeiteten Octavia mit integrierter ChatGPT

Skoda beginnt mit der Herstellung des überarbeiteten Octavia mit integrierter ChatGPT

Skoda hat die Serienproduktion des überarbeiteten Octavia in seinem Hauptwerk in Mladá Boleslav gestartet. Die aktualisierte vierte Generation des Bestsellers der Marke bietet einen neu gestalteten Skoda-Kühlergrill, neue Matrix-LED-Scheinwerfer der zweiten Generation und die Integration von ChatGPT in die Sprachassistenten des Fahrzeugs, unter anderem Verbesserungen. Mit der Verlagerung der Octavia-Produktion Ende dieses Jahres nach Kvasiny […]