Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
Bevezetés
- Tanulás pozitív megerősítésen keresztül
Element / Reinforcement Learning
Fontos feltételek (műveletek, állapotok, jutalmak, irányelvek, érték, Q-érték stb.)
A táblázatos megoldási módszerek áttekintése
Szoftverügynök létrehozása
Érték-, politika- és modell-alapú megközelítések megértése
Munka a Markov döntési folyamattal (MDP)
Hogyan határozzák meg az irányelvek az ügynök viselkedését
Monte Carlo módszerek alkalmazása
Időbeli különbségek tanulása
n-lépés Bootstrapping
Hozzávetőleges megoldási módszerek
Politikai előrejelzés közelítéssel
Politikai ellenőrzés közelítéssel
Politikán kívüli módszerek közelítéssel
A jogosultsági nyomok megértése
Irányelv gradiens módszerek használata
Összegzés és következtetés
Követelmények
- Gépi tanulásban szerzett tapasztalat
- Programming tapasztalat
Közönség
- Adattudósok
21 Órák