Voice Engine, die neue Künstliche Intelligenz von Sam Altman, kann eine natürlich klingende Sprache generieren, um Lesehilfe zu bieten, Inhalte zu übersetzen oder die Dienstleistungserbringung in entlegenen Umgebungen zu verbessern.
OpenAI, das Unternehmen von Sam Altman, wurde in Spanien mit der Einführung von ChatGPT im November 2022 populär. Aber über diesen KI-Chatbot hinaus entschied sich die Organisation, ihr Technologieangebot zu erweitern und startete im Februar dieses Jahres Sora, eine KI, die in der Lage ist, Videos von bis zu 60 Sekunden aus Text zu erstellen.
Dennoch, um auf Unternehmensebene weiter zu wachsen und sich im Bereich der künstlichen Intelligenz hervorzuheben, stellt OpenAI sein neues Projekt vor, genannt Voice Engine, ein Modell, das Texteingabe und eine einzige 15-Sekunden-Audioaufnahme verwendet, um eine natürlich klingende Sprache zu erzeugen, die dem ursprünglichen Sprecher sehr ähnlich ist.
Wir dir, was diese Technologie ist, wie sie funktioniert, wann sie verfügbar sein wird und welche Risiken oder Gefahren sie für den Menschen darstellt.
Was ist Voice Engine
Voice Engine ist eine künstliche Intelligenz, die, indem sie eine Stimme nur 15 Sekunden lang hört, in der Lage ist, eine synthetische Kopie dieser Stimme zu erstellen, indem sie ihren Ton nachahmt.
OpenAI entwickelte Voice Engine erstmals Ende 2022 und nutzte es, um voreingestellte Stimmen zu stärken, die in der Text-zu-Sprache-API verfügbar sind, sowie ChatGPT Voice und Read Aloud. Seitdem verfolgt das Unternehmen von Sam Altman einen vorsichtigen und informierenden Ansatz für eine “breitere Veröffentlichung aufgrund des Potenzials für den Missbrauch von synthetischer Stimme”.
Und mit Blick auf die Zukunft hofft OpenAI, “einen Dialog über den verantwortungsvollen Einsatz von synthetischen Stimmen und wie die Gesellschaft sich an diese neuen Fähigkeiten anpassen kann” zu beginnen. Auf dieser Grundlage wird eine “informiertere Entscheidung darüber getroffen, ob diese Technologie im großen Maßstab implementiert und wie dies geschehen soll”.
Wie Voice Engine verwendet wird
Um diese künstliche Intelligenz zu nutzen, reicht eine Texteingabe mit der Beschreibung dessen, was wir wünschen, und eine 15-Sekunden-Audioaufnahme aus, um einen Clip zu erstellen. Und nach diesen Schritten wird Voice Engine eine dem Menschen ähnliche Stimme erstellen.
Andererseits, bezüglich seiner Anwendungen, erklärt OpenAI in seinem offiziellen Blog, dass Voice Engine Lesehilfe bieten, Inhalte übersetzen, die Dienstleistungserbringung in entlegenen Umgebungen verbessern, Patienten helfen kann, ihre Stimme wiederzuerlangen, oder Menschen unterstützen kann, die verbale Kommunikation nicht nutzen, unter anderem.
Wann Voice Engine verfügbar sein wird
Voice Engine ist derzeit noch nicht für Nutzer verfügbar, jedoch hat OpenAI beschlossen, eine Vorschau dieser Technologie in seinem offiziellen Blog zu geben, um ihr Potenzial hervorzuheben.
Die Sicherheitsmaßnahmen von OpenAI
In der Mitteilung des offiziellen Blogs behauptet OpenAI, dass “Partner, die Voice Engine testen, unsere Nutzungsrichtlinien akzeptieren, die das Vortäuschen einer anderen Person oder Organisation ohne Zustimmung oder rechtliche Befugnis verbieten. Zudem erfordern unsere Bedingungen mit diesen Partnern die ausdrückliche und informierte Zustimmung des ursprünglichen Sprechers und wir erlauben es Entwicklern nicht, Möglichkeiten zu schaffen, damit einzelne Nutzer ihre eigenen Stimmen erstellen können. Partner müssen auch deutlich ihrer Zuhörerschaft offenlegen, dass die Stimmen, die sie hören, durch KI generiert werden. Schließlich haben wir eine Reihe von Sicherheitsmaßnahmen implementiert, die Wasserzeichen umfassen, um die Herkunft jedes durch Voice Engine generierten Audios zu verfolgen, sowie ein proaktives Monitoring, wie es verwendet wird.
No Responses