Was ist Voice Engine die neue Künstliche Intelligenz von OpenAI die deine Stimme klonen kann

Voice Engine, die neue Künstliche Intelligenz von Sam Altman, kann eine natürlich klingende Sprache generieren, um Lesehilfe zu bieten, Inhalte zu übersetzen oder die Dienstleistungserbringung in entlegenen Umgebungen zu verbessern.

OpenAI, das Unternehmen von Sam Altman, wurde in Spanien mit der Einführung von ChatGPT im November 2022 populär. Aber über diesen KI-Chatbot hinaus entschied sich die Organisation, ihr Technologieangebot zu erweitern und startete im Februar dieses Jahres Sora, eine KI, die in der Lage ist, Videos von bis zu 60 Sekunden aus Text zu erstellen.

Dennoch, um auf Unternehmensebene weiter zu wachsen und sich im Bereich der künstlichen Intelligenz hervorzuheben, stellt OpenAI sein neues Projekt vor, genannt Voice Engine, ein Modell, das Texteingabe und eine einzige 15-Sekunden-Audioaufnahme verwendet, um eine natürlich klingende Sprache zu erzeugen, die dem ursprünglichen Sprecher sehr ähnlich ist.

Wir dir, was diese Technologie ist, wie sie funktioniert, wann sie verfügbar sein wird und welche Risiken oder Gefahren sie für den Menschen darstellt.

Was ist Voice Engine

Voice Engine ist eine künstliche Intelligenz, die, indem sie eine Stimme nur 15 Sekunden lang hört, in der Lage ist, eine synthetische Kopie dieser Stimme zu erstellen, indem sie ihren Ton nachahmt.

OpenAI entwickelte Voice Engine erstmals Ende 2022 und nutzte es, um voreingestellte Stimmen zu stärken, die in der Text-zu-Sprache-API verfügbar sind, sowie ChatGPT Voice und Read Aloud. Seitdem verfolgt das Unternehmen von Sam Altman einen vorsichtigen und informierenden Ansatz für eine “breitere Veröffentlichung aufgrund des Potenzials für den Missbrauch von synthetischer Stimme”.

Und mit Blick auf die Zukunft hofft OpenAI, “einen Dialog über den verantwortungsvollen Einsatz von synthetischen Stimmen und wie die Gesellschaft sich an diese neuen Fähigkeiten anpassen kann” zu beginnen. Auf dieser Grundlage wird eine “informiertere Entscheidung darüber getroffen, ob diese Technologie im großen Maßstab implementiert und wie dies geschehen soll”.

Wie Voice Engine verwendet wird

Wie Voice Engine verwendet wird

Um diese künstliche Intelligenz zu nutzen, reicht eine Texteingabe mit der Beschreibung dessen, was wir wünschen, und eine 15-Sekunden-Audioaufnahme aus, um einen Clip zu erstellen. Und nach diesen Schritten wird Voice Engine eine dem Menschen ähnliche Stimme erstellen.

Andererseits, bezüglich seiner Anwendungen, erklärt OpenAI in seinem offiziellen Blog, dass Voice Engine Lesehilfe bieten, Inhalte übersetzen, die Dienstleistungserbringung in entlegenen Umgebungen verbessern, Patienten helfen kann, ihre Stimme wiederzuerlangen, oder Menschen unterstützen kann, die verbale Kommunikation nicht nutzen, unter anderem.

Wann Voice Engine verfügbar sein wird

Voice Engine ist derzeit noch nicht für Nutzer verfügbar, jedoch hat OpenAI beschlossen, eine Vorschau dieser Technologie in seinem offiziellen Blog zu geben, um ihr Potenzial hervorzuheben.

Die Sicherheitsmaßnahmen von OpenAI

In der Mitteilung des offiziellen Blogs behauptet OpenAI, dass “Partner, die Voice Engine testen, unsere Nutzungsrichtlinien akzeptieren, die das Vortäuschen einer anderen Person oder Organisation ohne Zustimmung oder rechtliche Befugnis verbieten. Zudem erfordern unsere Bedingungen mit diesen Partnern die ausdrückliche und informierte Zustimmung des ursprünglichen Sprechers und wir erlauben es Entwicklern nicht, Möglichkeiten zu schaffen, damit einzelne Nutzer ihre eigenen Stimmen erstellen können. Partner müssen auch deutlich ihrer Zuhörerschaft offenlegen, dass die Stimmen, die sie hören, durch KI generiert werden. Schließlich haben wir eine Reihe von Sicherheitsmaßnahmen implementiert, die Wasserzeichen umfassen, um die Herkunft jedes durch Voice Engine generierten Audios zu verfolgen, sowie ein proaktives Monitoring, wie es verwendet wird.

Bewerte Diese Seite

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

Prompt-Techniken Wie man das Beste aus künstlicher Intelligenz herausholt

Prompt-Techniken: Wie man das Beste aus künstlicher Intelligenz herausholt

Generative Künstliche Intelligenz, wie ChatGPT, Gemini, DALL-E, Midjourney oder Stable Diffusion, sind fortschrittliche Technologien, die in der Lage sind, Texte, Dokumente, Mindmaps, Tabellen, Kalkulationstabellen, Präsentationen, Bilder oder Videos zu erstellen. Sie benötigen jedoch präzise Anleitungen, klare, direkte Vorgaben und ausreichende Informationen, um das bestmögliche Ergebnis zu erzielen. Diese Anweisungen oder Leitfäden werden als Prompts bezeichnet, […]

Krankenschwestern in den USA protestieren gegen den Einsatz von KI in Krankenhäusern

Krankenschwestern in den USA protestieren gegen den Einsatz von KI in Krankenhäusern

Die Gewerkschaft “National Nurses United” erklärt in einer Mitteilung, dass künstliche Intelligenz (KI) keine “Lebens- oder Todesentscheidungen” ohne menschliche Bewertung und kritisches Denken treffen kann. Künstliche Intelligenz hat seit der Einführung von ChatGPT Ende 2022 unser Leben verändert, und seitdem haben die KI-Modelle verschiedener Technologieunternehmen – wie OpenAI, Meta, Microsoft, Google oder Apple – ihre […]

Funcas befürchtet dass ChatGPT Kundendaten der Banken stehlen könnte

Funcas befürchtet dass ChatGPT Kundendaten der Banken stehlen könnte

Die Stiftung der Sparkassen (Funcas) hat die Banken vor dem Einsatz von generativer Künstlicher Intelligenz (GenAI) wie ChatGPT gewarnt, wegen der Gefahr, die diese beim Schutz vertraulicher Kundendaten darstellen könnte. Insbesondere empfiehlt die Organisation dem Finanzsektor, eigene Programme mit dieser Technologie zu entwickeln, um Lecks zu verhindern und die Vertraulichkeit sicherer zu bewahren. Laut Funcas […]

Empfiehlt den Einsatz von ChatGPT in Tausenden wissenschaftlichen Studien

Empfiehlt den Einsatz von ChatGPT in Tausenden wissenschaftlichen Studien

Der Bibliothekar Andrew Gray machte eine “sehr überraschende” Entdeckung. Er analysierte fünf Millionen wissenschaftliche Studien, die im letzten Jahr veröffentlicht wurden, und stellte einen plötzlichen Anstieg in der Verwendung bestimmter Wörter fest, wie “meticulously” (um 137% mehr), “intricate” (117%), “commendable” (83%) und “meticulous” (59%), in ihren englischen Versionen. Gray, vom University College London, sieht nur […]

Googles KI holt gegenüber ChatGPT auf Gemini Pro 1.5 steigt auf ein neues Niveau

Googles KI holt gegenüber ChatGPT auf: Gemini Pro 1.5 steigt auf ein neues Niveau

Google kann auf seinem Weg, den Thron der künstlichen Intelligenz zurückzugewinnen, nicht aufgehalten werden, denn sein Prestige steht dabei auf dem Spiel. Obwohl wir die riesige Menge an Überraschungen, die uns beim nächsten Google I/O erwarten, noch nicht kennen, hat das Unternehmen bereits einen großen Teil seiner aktuellen Modelle weiterentwickelt. Es plant sogar, Gmail durch […]

Skoda beginnt mit der Herstellung des überarbeiteten Octavia mit integrierter ChatGPT

Skoda beginnt mit der Herstellung des überarbeiteten Octavia mit integrierter ChatGPT

Skoda hat die Serienproduktion des überarbeiteten Octavia in seinem Hauptwerk in Mladá Boleslav gestartet. Die aktualisierte vierte Generation des Bestsellers der Marke bietet einen neu gestalteten Skoda-Kühlergrill, neue Matrix-LED-Scheinwerfer der zweiten Generation und die Integration von ChatGPT in die Sprachassistenten des Fahrzeugs, unter anderem Verbesserungen. Mit der Verlagerung der Octavia-Produktion Ende dieses Jahres nach Kvasiny […]