Szukaj na tym blogu

poniedziałek, 25 lutego 2019

drugi etap uczenia.

 Program został parokrotnie sklonowany i poszczególne wersje zaczęły rozgrywać mecze same ze sobą - DeepMind stworzył ligę graczy. Programy o najlepszych wynikach, ale grające różnymi strategiami, były klonowane i modyfikowane dla osiągania specyficznych celów, na przykład pokonywania programów o innych strategiach. Chodziło nie o stworzenie jednego, najlepszego programu, ale kilku znakomitych, ale grających rozmaitymi strategiami. Przez dwa tygodnie takiego uczenia każdy program rozegrał około 10 milionów gier, bo pojedynki między programami zamiast kilkanaście minut trwały tylko ułamki sekund.

 jego gra nie było dziwaczna. Byłem pod wrażeniem tego, że AlphaStar tworzył zaawansowane posunięcia i różne strategie niemal w każdej grze, grając w sposób bardzo ludzki, czego się nie spodziewałem - mówił po meczu Grzegorz Komincz.

Brak komentarzy: