OpenAI mund të klonojë zërat me vetëm 15 sekonda audio

Teknologji

OpenAI mund të klonojë zërat me vetëm 15 sekonda audio

Më: 1 prill 2024 Në ora: 20:21
Drejtuesi i OpenAI

Një model i ri gjuhësor i zbuluar nga krijuesi i ChatGPT OpenAI mund të klonojë zërin e një personi duke përdorur audio me vlerë vetëm sekondash, zbuloi kompania ndërsa ndau njohuri paraprake nga studimi i aftësive të teknologjisë.

Modeli i inteligjencës artificiale, i quajtur Voice Engine, ka nevojë për vetëm një mostër të vetme audio prej 15 sekondash për të gjeneruar një fjalim që imiton atë të altoparlantit origjinal, njoftoi OpenAI në një postim në blog të premten. Teknologjia u zhvillua për herë të parë në fund të vitit 2022 dhe është përdorur për të fuqizuar zërat e paracaktuar të disponueshëm në API-në e tekstit në të folur, si dhe në veçoritë e saj ChatGPT Voice dhe Read Aloud.

Teknologjia është testuar me partnerët e korporatave të OpenAI me rezultate novatore. Për shembull, kompania ndau audion tronditëse të një vajze të re që fliste falë mjekëve Fatima Mirza, Rohaid Ali dhe Konstantina Svokos me Institutin e Neuroshkencave Norman Prince.

Vajza humbi aftësinë për të folur normalisht për shkak të një tumori vaskular të trurit. Ndërsa ende është në gjendje të formojë fjalë dhe fjali, zëri i saj nuk tingëllon njësoj si dikur. Mjekët përdorën një video audio që ajo regjistroi për një projekt shkollor për t’i rikthyer zërin e saj normal, në mënyrë që të mos tingëllojë më i dëmtuar kur ajo flet.

commentFirst article
Sot mund të lexoni Shfletoni kopertinat