Szukaj na tym blogu

poniedziałek, 19 grudnia 2016

WaveNet,

WaveNet, może być przełomem jeśli chodzi o odtwarzanie ludzkiego głosu, ponieważ zamiast analizować nagrania audio, 
system po prostu "uczy" się mówić. 
Deep Mind stworzył mu bazę 44 godzin nagrań 109 różnych lektorów, a WaveNet "uczy się" właśnie na nich. Przetwarza on około 16 tys. próbek głosu na sekundę i jest z tego w stanie wygenerować coś na kształt mowy.
Co jednak najciekawsze, WaveNet robi to wszystko bez udziału człowieka - używa danych statystycznych.

Brak komentarzy: