Kurzusleírás

Bevezetés a Reinforcement Learning-be

  • A megerősítő tanulás és alkalmazásai áttekintése
  • A felügyelt, a nem felügyelt és a megerősített tanulás közötti különbségek
  • Kulcsfogalmak: ügynök, környezet, jutalom és politika

Markov döntési folyamatok (MDP)

  • Az állapotok, cselekvések, jutalmak és állapotváltások megértése
  • Értékfüggvények és a Bellman-egyenlet
  • Dinamikus programozás MDP-k megoldásához

Core RL algoritmusok

  • Táblázatos módszerek: Q-Learning és SARSA
  • Irányelv alapú módszerek: REINFORCE algoritmus
  • Actor-Critic keretrendszerek és alkalmazásaik

Mély Reinforcement Learning

  • Bevezetés a Deep Q-Networksbe (DQN)
  • Tapasztalja meg a visszajátszást és a célhálózatokat
  • Házirend gradiensek és fejlett mély RL-módszerek

RL keretrendszerek és eszközök

  • Bevezetés az OpenAI edzőterembe és más RL környezetekbe
  • PyTorch vagy TensorFlow használata RL-modellfejlesztéshez
  • RL ügynökök képzése, tesztelése és teljesítményértékelése

Kihívások RL-ben

  • A feltárás és a kiaknázás egyensúlya a képzésben
  • Ritka jutalmak és kreditbeosztási problémák kezelése
  • Scalaképesség és számítási kihívások RL-ben

Hands-On Activities

  • Q-Learning és SARSA algoritmusok bevezetése a semmiből
  • Egy DQN-alapú ügynök betanítása egy egyszerű játékra az OpenAI edzőteremben
  • Finomhangolású RL modellek a jobb teljesítmény érdekében egyéni környezetben

Összegzés és a következő lépések

Követelmények

  • A gépi tanulási elvek és algoritmusok alapos ismerete
  • Jártasság a Python programozásban
  • Neurális hálózatok és mély tanulási keretrendszerek ismerete

Közönség

  • Gépi tanulási mérnökök
  • AI szakértők
 14 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák