Der neueste Schlag von Elon Musk gegen ChatGPT: Sein Chatbot Grok analysiert jetzt Bilder

Elon Musk präsentiert sein erstes multimodales Modell, eine Weiterentwicklung seiner generativen künstlichen Intelligenz Grok, die jetzt mehrere Aufgaben beherrscht: Neben dem Schreiben von Texten analysiert und versteht sie nun auch Fotografien. Ursprünglich als “rebellisch und einfallsreich” beschrieben, wird dieser Chatbot nicht mehr nur auf Textfragen auf X (früher Twitter) beschränkt sein. Mit diesem Sprung möchte er große multimodale Modelle wie GPT-4 (das Gehirn hinter ChatGPT) oder Googles Gemini herausfordern.

Grok wurde vor Monaten als Alternative zu ChatGPT vorgestellt, die in das soziale Netzwerk X integriert werden sollte, das ebenfalls Elon Musk gehört. Die Weiterentwicklung zu einem Modell, das Bilder analysieren kann, deutet darauf hin, dass die Funktionen erweitert werden, auch um Einfluss auf das autonome Fahren zu nehmen.

xAI, das Unternehmen, das vom Magnaten zur Entwicklung von KI gegründet wurde, behauptet, dass sein Modell die Konkurrenz wie GPT-4V von OpenAI oder Gemini Pro 1.5 von Google in der “Verständnis der realen Welt” übertrifft. Die Daten stammen aus einem von der Firma selbst erstellten Test, den sie mit der Entwicklergemeinschaft teilen möchte.

Grok lernt, die Welt zu analysieren

Zu den Funktionen, die Grok jetzt beherrscht, gehört die Möglichkeit, eine Skizze auf einer Tafel in Python-Code umzuwandeln, um ein Videospiel zu erstellen. Gleichzeitig könnte dieser Chatbot eine Geschichte aus einer einfachen Kinderzeichnung schreiben, um einem kleinen Kind beim Einschlafen zu helfen. Er kann auch Bilder analysieren und Lösungen für verschiedene Probleme vorschlagen.

Unter den Tests, denen es unterzogen wurde und die das Unternehmen als Demonstration seiner Fähigkeiten veröffentlicht, wird es gebeten, die Himmelsrichtung anzugeben, in die das Plüschdinosaurier schaut. Dies bedeutet, dass die KI in der Lage sein muss, die Informationen zu verstehen, die der Kompass im Handy und die Platzierung des Objekts neben ihm liefern.

xAI führt auch zwei von fünf Szenen im Zusammenhang mit dem Fahren als Beispiel an. Es sollte nicht vergessen werden, dass dieses Unternehmen mit Tesla verbunden ist, da beide Unternehmen Musk gehören. Diese KI könnte dazu beitragen, die aktuellen autonomen oder assistierten Fahrsysteme weiterzuentwickeln. Es bleibt abzuwarten, ob die Gemeinschaft die Fähigkeiten und Schwächen des neuen Modells bewerten wird.

Grok-1.5 Vision, oder Grok-1.5V, wird bald für externe Bewertungen verfügbar sein, damit die Benutzer dieser KI ihre Fähigkeiten beurteilen können. Früher wurde der Code von Grok, als es nur Text verarbeitete, öffentlich gemacht, um der Entwicklergemeinschaft zu ermöglichen, damit zu experimentieren. Dies ist ein persönliches Versprechen von Musk, der seine ehemaligen Partner bei OpenAI beschuldigt hat, ihre ursprüngliche Mission zugunsten eines gewinnorientierten Modells aufgegeben zu haben.

Grok lernt, die Welt zu analysieren

Neue Metrik

“Grok-1.5V ist konkurrenzfähig mit bestehenden multimodalen Modellen in einer Reihe von Bereichen, von multidisziplinärem Denken bis zum Verständnis von Dokumenten, wissenschaftlichen Diagrammen, Grafiken, Screenshots und Fotografien”, so das Unternehmen in einem Beitrag auf seiner offiziellen Webseite.

Diese Behauptung wird durch eine Tabelle untermauert, die die von diesem Modell und anderen Marktteilnehmern in den oben genannten Tests erzielten Punktzahlen zeigt. Es handelt sich um den von xAI erstellten Test, RealWorldQA. “Wir freuen uns darauf, RealWorldQA der Gemeinschaft vorzustellen und beabsichtigen, es zu erweitern, wenn unsere multimodalen Modelle verbessert werden”, sagen sie.

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

GPT-5 und größerer Kontext

Während die Technologie mit atemberaubender Geschwindigkeit voranschreitet, sticht die künstliche Intelligenz als eine der faszinierendsten Grenzen der Innovation hervor. Inmitten dieses technologischen Wirbels taucht GPT-5, die neueste Iteration des Sprachmodells von OpenAI, als ein Thema heißer Erwartungen auf. Diese neue Version des bereits beeindruckenden GPT-4 verspricht, die Fähigkeit von Maschinen, menschliche Sprache zu verstehen und […]

Wie man ChatGPT verwendet, um Ihre Texte zusammenzufassen und umzuschreiben

In der heutigen Zeit ist die Fähigkeit, originelle und relevante Inhalte zu produzieren, unerlässlich, besonders wenn man sich inmitten der riesigen Menge an Informationen im Internet hervorheben möchte. Der Fortschritt der künstlichen Intelligenz (KI) hat Werkzeuge wie ChatGPT Talk hervorgebracht, die den Prozess des Umschreibens und Zusammenfassens von Texten nicht nur schneller, sondern auch dynamischer […]

Maximieren Sie Ihren Gewinn: So verdienen Sie mit der Chat-GPT-Technologie

Einführung: Wie man mit Chat-GPT Geld verdient Im ständig fortschreitenden Bereich der künstlichen Intelligenz und des maschinellen Lernens taucht ein Begriff immer wieder auf: GPT oder Generative Pre-Trained Transformers. Einfach ausgedrückt, GPT ist ein wesentlicher Bestandteil von KI-Modellen und darauf spezialisiert, menschenähnlichen Text zu verstehen und zu erzeugen. Die dynamischen Fortschritte in diesem Bereich haben […]

Navigieren in der Co-Evolution von KI und Menschheit

Die KI verwandelt uns von Schöpfern und Antwortenden in Kuratoren und Fragesteller. In diesem provokativen Gespräch mit Peter Deng, VP für Verbraucherprodukte und Leiter von ChatGPT bei OpenAI, werden wir die Rolle der Menschen im Zeitalter der KI erkunden. Was sind die praktischen und philosophischen Implikationen der KI? Wie wird sie unsere Wahrnehmung von uns […]

Entdecken Sie die 6 besten Möglichkeiten, Chat GPT jetzt zu nutzen, um online Geld zu verdienen!

Einführung in die Nutzung von Chat GPT zur Gewinnmaximierung Unsere Einführung in die Gewinnmaximierung mit den besten Methoden des Generativen Vortrainierten Transformators (GPT) enthüllt revolutionäre Innovationen in der künstlichen Intelligenz, die den E-Commerce und den Kundenservice revolutionieren. Die vielfältigen Anwendungen des GPT umfassen unter anderem Chatbots und die Textgenerierung. Die besten Wege, um Chat GPT […]

Prompt-Techniken Wie man das Beste aus künstlicher Intelligenz herausholt

Prompt-Techniken: Wie man das Beste aus künstlicher Intelligenz herausholt

Generative Künstliche Intelligenz, wie ChatGPT, Gemini, DALL-E, Midjourney oder Stable Diffusion, sind fortschrittliche Technologien, die in der Lage sind, Texte, Dokumente, Mindmaps, Tabellen, Kalkulationstabellen, Präsentationen, Bilder oder Videos zu erstellen. Sie benötigen jedoch präzise Anleitungen, klare, direkte Vorgaben und ausreichende Informationen, um das bestmögliche Ergebnis zu erzielen. Diese Anweisungen oder Leitfäden werden als Prompts bezeichnet, […]