OpenAI und Google trainieren ihre KI-Modelle mit YouTube-Videoaufzeichnungen

OpenAI und Google wurden beschuldigt, Transkriptionen von YouTube-Videos zur Schulung ihrer KI-Systeme zu verwenden, wie die ‘New York Times’ berichtet. Diese Praktiken könnten die Grenzen von Urheberrechtsverletzungen streifen und die von den digitalen Diensten, aus denen die Daten extrahiert werden, festgelegten Richtlinien herausfordern.

Die Nachfrage nach großen Datenmengen für das Training von KI-Modellen hat diese Unternehmen dazu veranlasst, in den entlegensten Ecken des Internets zu suchen, einschließlich Plattformen wie YouTube, wo die Menge und Vielfalt der Inhalte praktisch unbegrenzt ist. Die Verwendung dieser Daten wirft jedoch ernsthafte Fragen über die Legalität und Ethik solcher Praktiken auf.

Laut internen Quellen hat OpenAI ein Werkzeug namens Whisper speziell für die Transkription von YouTube-Videos entwickelt. Diese Transkriptionen wurden verwendet, um GPT-4, eines der bis dato fortschrittlichsten Sprachmodelle, zu perfektionieren. Dies würde gegen die Richtlinien von YouTube verstoßen, wie der CEO der Plattform, Neal Mohan, kürzlich in Bezug auf ein angebliches Training einer anderen KI von OpenAI, Sora, bestätigte.

Der Fall von Sora, einem generativen KI-Werkzeug von OpenAI, das in der Lage ist, realistische Videos aus beschreibenden Texten zu erstellen, stand ebenfalls im Mittelpunkt.

Das Unternehmen hat eine gewisse Mehrdeutigkeit über die für sein Training verwendeten Datenquellen beibehalten. Die Technologiedirektorin Mira Murati konnte dies nicht bestätigen und gab lediglich an, dass die Daten, die zum Training von Sora verwendet werden, “öffentlich verfügbare Daten und lizenzierte Daten” seien.

Die Kontroverse beschränkt sich jedoch nicht nur auf OpenAI. Interne Quellen deuten darauf hin, dass Google ebenfalls Transkriptionen von YouTube-Videos verwendet hat, um seine eigenen KI-Modelle zu verfeinern, insbesondere nach einer Änderung der Nutzungsbedingungen, die letztes Jahr eingeführt wurde.

Meta, bekannt für seine Fortschritte in großen Sprachmodellen und KI, ist in dieser Suche nach massiven Daten nicht zurückgeblieben. Das Unternehmen hat ebenfalls das Internet genutzt, um Informationen für das Training seiner Modelle zu sammeln, und steht vor dem Risiko rechtlicher Schritte wegen der Verwendung urheberrechtlich geschützter Inhalte, wie aus internen Aufzeichnungen hervorgeht, auf die das zitierte Medium Zugriff hatte.

YouTube warnt vor der unsachgemäßen Verwendung seiner Videos für das Training von Sora, der KI von OpenAI

YouTube warnt vor der unsachgemäßen Verwendung seiner Videos für das Training von Sora, der KI von OpenAI

Der CEO von YouTube, Neal Mohan, hat vor der möglichen Verwendung von Videos der Plattform zum Training des als Sora bekannten KI-Modells von OpenAI gewarnt. Laut Mohan würde eine solche Aktion eine “klare Verletzung” der YouTube-Richtlinien darstellen.

Sora, im Februar von OpenAI vorgestellt, ist ein KI-Modell, das in der Lage ist, realistische Videoszenen aus Textanweisungen zu generieren, mit genauen Details, komplexen Kamerabewegungen und sogar der Einbeziehung mehrerer Charaktere mit Emotionen.

Die Besorgnis entsteht im Zusammenhang mit den Daten, die zum Training von Sora verwendet wurden. Mira Murati, Technologiedirektorin von OpenAI, wies in einem kürzlichen Interview mit der ‘Wall Street Journal’ darauf hin, dass “öffentlich verfügbare Daten und lizenzierte Daten” verwendet werden.

Auf die Frage, ob die erwähnten Daten Videos von YouTube, Instagram oder Facebook umfassen, erklärte Murati, dass sie darüber keine Informationen habe.

Laut dem CEO von YouTube in einem Interview mit ‘Bloomberg’ gibt es derzeit keine bestätigten Informationen darüber, ob OpenAI tatsächlich Inhalte von YouTube-Videos für das Training von Sora verwendet hat.

Er betonte jedoch, dass es, sollte dies zu irgendeinem Zeitpunkt geschehen sein, eine Verletzung der Nutzungsbedingungen von YouTube durch das von Sam Altman geleitete Unternehmen darstellen würde. Dies liegt daran, dass die Content-Ersteller, die ihre Arbeit auf der Plattform veröffentlichen, darauf vertrauen, dass ihr Werk durch diese Bedingungen geschützt ist.

Bewerte Diese Seite

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

Prompt-Techniken Wie man das Beste aus künstlicher Intelligenz herausholt

Prompt-Techniken: Wie man das Beste aus künstlicher Intelligenz herausholt

Generative Künstliche Intelligenz, wie ChatGPT, Gemini, DALL-E, Midjourney oder Stable Diffusion, sind fortschrittliche Technologien, die in der Lage sind, Texte, Dokumente, Mindmaps, Tabellen, Kalkulationstabellen, Präsentationen, Bilder oder Videos zu erstellen. Sie benötigen jedoch präzise Anleitungen, klare, direkte Vorgaben und ausreichende Informationen, um das bestmögliche Ergebnis zu erzielen. Diese Anweisungen oder Leitfäden werden als Prompts bezeichnet, […]

Krankenschwestern in den USA protestieren gegen den Einsatz von KI in Krankenhäusern

Krankenschwestern in den USA protestieren gegen den Einsatz von KI in Krankenhäusern

Die Gewerkschaft “National Nurses United” erklärt in einer Mitteilung, dass künstliche Intelligenz (KI) keine “Lebens- oder Todesentscheidungen” ohne menschliche Bewertung und kritisches Denken treffen kann. Künstliche Intelligenz hat seit der Einführung von ChatGPT Ende 2022 unser Leben verändert, und seitdem haben die KI-Modelle verschiedener Technologieunternehmen – wie OpenAI, Meta, Microsoft, Google oder Apple – ihre […]

Funcas befürchtet dass ChatGPT Kundendaten der Banken stehlen könnte

Funcas befürchtet dass ChatGPT Kundendaten der Banken stehlen könnte

Die Stiftung der Sparkassen (Funcas) hat die Banken vor dem Einsatz von generativer Künstlicher Intelligenz (GenAI) wie ChatGPT gewarnt, wegen der Gefahr, die diese beim Schutz vertraulicher Kundendaten darstellen könnte. Insbesondere empfiehlt die Organisation dem Finanzsektor, eigene Programme mit dieser Technologie zu entwickeln, um Lecks zu verhindern und die Vertraulichkeit sicherer zu bewahren. Laut Funcas […]

Empfiehlt den Einsatz von ChatGPT in Tausenden wissenschaftlichen Studien

Empfiehlt den Einsatz von ChatGPT in Tausenden wissenschaftlichen Studien

Der Bibliothekar Andrew Gray machte eine “sehr überraschende” Entdeckung. Er analysierte fünf Millionen wissenschaftliche Studien, die im letzten Jahr veröffentlicht wurden, und stellte einen plötzlichen Anstieg in der Verwendung bestimmter Wörter fest, wie “meticulously” (um 137% mehr), “intricate” (117%), “commendable” (83%) und “meticulous” (59%), in ihren englischen Versionen. Gray, vom University College London, sieht nur […]

Googles KI holt gegenüber ChatGPT auf Gemini Pro 1.5 steigt auf ein neues Niveau

Googles KI holt gegenüber ChatGPT auf: Gemini Pro 1.5 steigt auf ein neues Niveau

Google kann auf seinem Weg, den Thron der künstlichen Intelligenz zurückzugewinnen, nicht aufgehalten werden, denn sein Prestige steht dabei auf dem Spiel. Obwohl wir die riesige Menge an Überraschungen, die uns beim nächsten Google I/O erwarten, noch nicht kennen, hat das Unternehmen bereits einen großen Teil seiner aktuellen Modelle weiterentwickelt. Es plant sogar, Gmail durch […]

Skoda beginnt mit der Herstellung des überarbeiteten Octavia mit integrierter ChatGPT

Skoda beginnt mit der Herstellung des überarbeiteten Octavia mit integrierter ChatGPT

Skoda hat die Serienproduktion des überarbeiteten Octavia in seinem Hauptwerk in Mladá Boleslav gestartet. Die aktualisierte vierte Generation des Bestsellers der Marke bietet einen neu gestalteten Skoda-Kühlergrill, neue Matrix-LED-Scheinwerfer der zweiten Generation und die Integration von ChatGPT in die Sprachassistenten des Fahrzeugs, unter anderem Verbesserungen. Mit der Verlagerung der Octavia-Produktion Ende dieses Jahres nach Kvasiny […]