61
Skład administracji / Odp: Q matic
« Ostatnia wiadomość wysłana przez truemoney dnia Październik 12, 2018, 11:39:48 »Ten artykuł jest drugą częścią darmowej serii postów na blogu o Deep Reinforcement Learning. Aby uzyskać więcej informacji i więcej zasobów, zapoznaj się z sylabusem kursu. Zobacz pierwszy artykuł tutaj .
W tym artykule dowiesz się:
Czym jest Q-Learning
Jak zaimplementować go z Numpy
Wielki obraz: Rycerz i księżniczka
Powiedzmy, że jesteś rycerzem i musisz uratować księżniczkę uwięzioną w zamku pokazanym na powyższej mapie.
Możesz przenosić jedną płytkę na raz. Wróg nie może, ale ląduje na tej samej płytce co wróg, a ty umrzesz. Twoim celem jest przejście do zamku najszybszą możliwą trasą. Można to ocenić za pomocą systemu "punktacji punktowej".