OpenAI mund të klonojë zërat me vetëm 15 sekonda audio

1 Prill, 2024

Një model i ri gjuhësor i zbuluar nga krijuesi i ChatGPT OpenAI mund të klonojë zërin e një personi duke përdorur audio me vlerë vetëm sekondash, zbuloi kompania ndërsa ndau njohuri paraprake nga studimi i aftësive të teknologjisë.

Modeli i inteligjencës artificiale, i quajtur Voice Engine, ka nevojë për vetëm një mostër të vetme audio prej 15 sekondash për të gjeneruar një fjalim që imiton atë të altoparlantit origjinal, njoftoi OpenAI në një postim në blog të premten. Teknologjia u zhvillua për herë të parë në fund të vitit 2022 dhe është përdorur për të fuqizuar zërat e paracaktuar të disponueshëm në API-në e tekstit në të folur, si dhe në veçoritë e saj ChatGPT Voice dhe Read Aloud.

Teknologjia është testuar me partnerët e korporatave të OpenAI me rezultate novatore. Për shembull, kompania ndau audion tronditëse të një vajze të re që fliste falë mjekëve Fatima Mirza, Rohaid Ali dhe Konstantina Svokos me Institutin e Neuroshkencave Norman Prince.

Vajza humbi aftësinë për të folur normalisht për shkak të një tumori vaskular të trurit. Ndërsa ende është në gjendje të formojë fjalë dhe fjali, zëri i saj nuk tingëllon njësoj si dikur. Mjekët përdorën një video audio që ajo regjistroi për një projekt shkollor për t’i rikthyer zërin e saj normal, në mënyrë që të mos tingëllojë më i dëmtuar kur ajo flet.

OpenAI mund të klonojë zërat me vetëm 15 sekonda audio

EDITOR PICKS

Emrat/ ‘Kërcet’ grushti në Bulqizë, disa persona konfliktohen me njëri-tjetrin, dyshohet se…

Turi me Diasporën, ja ku do të mbahet takimi i radhës i Ramës me...

Paga mesatare në Zvicër është mbi 6 mijë franga, ky është kantoni me pagat...

Franca, dëmtimi i Griezmann ndërpret një rekord të bujshëm

EDHE MË SHUMË LAJME

Kujt i duhet BKT, përveç Sehyanit dhe Çalikut?

Përvjetori i lindjes së aktorit Aleksandër Moisiu

Ndërron jetë në moshën 65 vjeçare ylli i “Batman”, Val Kilmer!

KATEGORI E POPULLARIZUAR

Studiuesit bëjnë një zbulim tronditës në thellësitë e Detit të Kuq