Přejít k hlavnímu obsahu

OpenAI Voice Engine dokáže naklonovat hlas z 15sekundové nahrávky – hrozba nebo příležitost?

Pavel Trousil 03.04.2024
info ikonka
Zdroj: Vygenerováno v Midjourney

Nástroj Voice Engine od společnosti OpenAI má přinést revoluci v převodu textu na řeč. Potřebuje pouhých 15 sekund zvukového záznamu mluvícího člověka, aby naklonoval jeho hlas. Vývojáři ale produkt nezveřejní, dokud si nebudou jisti, že se podařilo zvládnout potenciál pro zneužití.

Kapitoly článku

Ve světě, kde hlasoví asistenti a personalizované služby nabývají na významu, přichází společnost OpenAI s novinkou nazvanou Voice Engine. Tato nová technologie prý dokáže z krátké zvukové nahrávky vygenerovat hlas, který například dokáže přečíst text v téměř libovolném jazyce. Očekává s e široké uplatnění tohoto nástroje - od asistence při vzdělávání až po obnovu hlasu u lidí, kteří ztratili svůj vlastní.

Proces využívá nejmodernější algoritmy umělé inteligence k vytvoření imitace lidského hlasu, která je údajně téměř k nerozeznání od originálu. Společnost OpenAI již oznámila, že při zavádění této technologie budou přijata přísná bezpečnostní opatření na ochranu před zneužitím, například krádeží identity.
 

Mohlo by vás zajímat

Jak nová technologie funguje, si můžete vyzkoušet na webové stránce OpenAI, kde jsou 15vteřinové zvukové nahrávky a také audio vygenerované na základě těchto nahrávek.

Jak chce OpenAI zajistit bezpečnost

OpenAI je nezisková organizace pro výzkum umělé inteligence, známá svým chatbotem ChatGPT. Vývoji nových technologií bere zodpovědně a chce zabránit jejich zneužití. Co se týká nástroje Voice Engine, u něj chce zabránit zneužití pomocí vodoznaků a seznamu hlasů, které se nesmí napodobovat.
 

Mohlo by vás zajímat

"Je důležité, aby lidé na celém světě pochopili, kam tato technologie směřuje, ať už ji nakonec sami široce nasadíme, nebo ne," uvedla společnost OpenAI.

Obavy ze zneužití jsou oprávněné. Jeden z nejzajímavějších případů s klonováním hlasů v letošním roce pochází z prezidentských primárek v americkém státě New Hampshire, během nichž probíhaly robotické hovory prezidenta Bidena generované umělou inteligencí, které vyzývaly voliče, aby se neúčastnili denního hlasování.

Následně Americká Federální obchodní komise (FTC) oficiálně prohlásila robotické hovory generované umělou inteligencí za nezákonné a vypsala odměnu 25 000 dolarů, aby získala nápady, jak bojovat proti rostoucí hrozbě klonování hlasu umělou inteligencí.
 

čtení
info ikonka
Zdroj: Vygenerováno v Midjourney
Příkladů využití Voice Engine je hodně. Tento nástroj by mohl číst, nebo napomoct vrátit postiženým lidem jejich hlas.

Jak bude možné Voice Engine využít

Podle OpenAI lze Voice Engine využít například k asistenci při čtení, pro překlad obsahu, pro podporu postižených osob, které nemohou mluvit – mohou znovu získat schopnost mluvit vlastním hlasem. Všechny tyto případy použití už byly demonstrovány a byly součástí práce, kterou OpenAI provádí s prvními partnery.

Zdroj: OpenAI, The Register, Schmidtisblog
 


Máte k článku připomínku? Napište nám

Sdílet článek

Mohlo by se vám líbit








Všechny nejnovější zprávy

doporučujeme