WaveNet, może być przełomem jeśli chodzi o odtwarzanie ludzkiego głosu, ponieważ zamiast analizować nagrania audio,
system po prostu "uczy" się mówić.
Deep Mind stworzył mu bazę 44 godzin nagrań 109 różnych lektorów, a WaveNet "uczy się" właśnie na nich. Przetwarza on około 16 tys. próbek głosu na sekundę i jest z tego w stanie wygenerować coś na kształt mowy.
Co jednak najciekawsze, WaveNet robi to wszystko bez udziału człowieka - używa danych statystycznych.
Brak komentarzy:
Prześlij komentarz