Sam, ein etwa zweijähriger Junge aus Australien, hat 18 Monate lang täglich einige Minuten einen Helm mit einer Kamera getragen, die festhielt, worauf er schaute und was seine Aufmerksamkeit erregte. Mit diesen Daten wurde ein KI-Modell trainiert, und das Ergebnis hat die Forscher überrascht.
Einer der faszinierendsten Aspekte beim Aufwachsen eines Babys ist zu beobachten, wie sich seine Sprache entwickelt. Es ist beeindruckend zu sehen, wie sie mühelos Konzepte lernen und Objekte und Wörter verbinden. Jeder neue Laut wird begeistert gefeiert, ohne dass uns bewusst ist, dass es nicht nur niedlich ist, sondern auch eine enorme Leistung darstellt. Selbst die fortschrittlichsten KI-Modelle der heutigen Zeit sind nicht in der Lage, etwas Ähnliches zu tun.
Die Sprachmodelle, die Systeme wie ChatGPT antreiben, sind hervorragend darin, das nächste Wort in einem Satz vorherzusagen, aber sie besitzen nichts, was auch nur annähernd dem gesunden Menschenverstand eines Kleinkindes gleicht. Um auf akzeptablem Niveau Englisch schreiben zu können, werden diese Technologien mit riesigen Datensätzen trainiert, die Millionen von Wörtern enthalten. Babys hingegen haben in ihren ersten Lebensjahren nur Zugang zu einem kleinen Teil dieses Wissens und sind dennoch in der Lage, viel besser zu sprechen als die intelligenteste Künstliche Intelligenz.
Aber was, wenn eine KI wie ein Baby lernen könnte? Eine neue Studie der American Association for the Advancement of Science (AAAS), geleitet von Forschern der New York University in den USA und veröffentlicht in der Zeitschrift „Science“, berichtet, wie ein neues Maschinenlernmodell, das mit Video- und Audioaufnahmen aus der Perspektive eines Kleinkindes über mehr als ein Jahr trainiert wurde, neue Erkenntnisse über den frühen Spracherwerb geliefert hat.
So ist Sam, der Junge, auf den die KI aufmerksam wurde
Sam ist ein etwa zweijähriger Junge aus der Nähe von Adelaide in Australien. 18 Monate lang trug er täglich etwa 1% seiner Wachstunden einen Helm mit einer Kamera, die aufzeichnete, worauf er schaute und was seine Aufmerksamkeit erregte.
Insgesamt 61 Stunden Video, in denen Sam von seinem sechsten Lebensmonat bis kurz nach seinem zweiten Geburtstag seine Katzen, seine Eltern, sein Bett, seine Spielsachen, sein Haus, seine Mahlzeiten beobachtete… kurz gesagt: den Alltag eines Kleinkindes in der westlichen Welt.
Was könnte ein KI-Modell mit einem solchen Datensatz anfangen?
Die Forscher der New York University haben gezeigt, dass Künstliche Intelligenzsysteme Wörter und Konzepte aus der gleichen begrenzten Menge sensorischer Informationen erwerben können, die ein Baby erhält, und damit die aktuelle Annahme herausfordern, dass Millionen von Parametern notwendig sind, um eine KI zu lehren. Dies markiert einen Meilenstein in diesem Bereich und in der Linguistik.
Mit den Daten der Kamerahelm von Sam wurde ein KI-Modell trainiert. So basiert diese Künstliche Intelligenz ihr Lernen auf den Bildern und Geräuschen, die ein Kind erlebt, das gerade lernt zu sprechen.
Speziell für das Training des Modells wurden 600.000 Videobilder mit den Sätzen kombiniert, die von Sams Eltern oder anderen Personen im Raum ausgesprochen wurden, als das Bild aufgenommen wurde: insgesamt 37.500 „Ausdrücke“.
Um das Modell zu trainieren, wurden manchmal Wörter und Objekte kombiniert und manchmal nicht. Es gab zwei Hinweise: Wenn Objekte und Wörter zusammen auftauchen, ist das ein Zeichen dafür, dass sie verbunden sein könnten. Aber wenn ein Objekt und ein Wort nicht zusammen auftauchen, ist das ein Zeichen dafür, dass sie wahrscheinlich nicht übereinstimmen.
Nach den Forschern, die das Experiment durchgeführt haben, konnte das KI-Modell Wörter mit den Objekten, die sie repräsentieren, verbinden.
„Dies ist die erste Studie, die zeigt, wie ein neuronales Netz, das mit realistischen Entwicklungsdaten eines Kindes trainiert wurde, lernen kann, Wörter mit ihren visuellen Äquivalenten zu verbinden“, sagte Wai Keen Vong, Hauptautor der Studie.
Diese Entdeckung eröffnet neue Wege für die Entwicklung effizienterer und natürlicher KI-Systeme und bietet wertvolle Einblicke in den frühen Spracherwerb bei Menschen.
No Responses