“Microsoft” cəmi 3 saniyəlik nümunə əsasında istənilən şəxsin səsini təqlid edə bilən “VALL-E” adlı mətni nitqə çevirən neyron şəbəkəsini yaradıb.
Yenisabah.az xəbər verir ki, “VALL-E”nin yaradılması zamanı “EnCodec” audio sıxılma texnologiyası və ümumi müddəti təxminən 60 min saat olan 7 mindən çox insanın səs yazıları kitabxanasından istifadə edilib.
“Microsoft” şirkəti hesab edir ki, yeni neyron şəbəkə mətn əsasında audio məzmunun yaradılması zamanı faydalı olacaq. “VALL-E” tamamilə orijinal məzmun yaratmaq üçün “GPT-3” mətn generatoru ilə birlikdə istifadə edilə bilər. pizza hut
Telegram kanalımız