Kurzusleírás

Bevezetés a Large Language Models (LLMs)-be

  • Az LLM-ek áttekintése
  • Definíció és jelentősége
  • Alkalmazások az AI-ban ma

Transzformátor építészet

  • Mi az a transzformátor és hogyan működik?
  • Főbb összetevők és jellemzők
  • Beágyazás és pozíciókódolás
  • Többfejű figyelem
  • Előrecsatolt neurális hálózat
  • Normalizálás és maradék csatlakozások

Transzformátor modellek

  • Önfigyelő mechanizmus
  • Kódoló-dekódoló architektúra
  • Pozíciós beágyazások
  • BERT (Bidirectional Encoder Representations from Transformers)
  • GPT (generatív előképzett transzformátor)

Teljesítményoptimalizálás és buktatók

  • Kontextus hossza
  • Mamba és állapottér modellek
  • Felvillanó figyelem
  • Ritka transzformátorok
  • Látótranszformátorok
  • A kvantálás jelentősége

A transzformátorok fejlesztése

  • Visszakeresés bővített szöveggenerálás
  • Modellek keveréke
  • A gondolatok fája

Finomhangolás

  • Az alacsony szintű alkalmazkodás elmélete
  • Finomhangolás QLora segítségével

Méretezési törvények és optimalizálás az LLM-ekben

  • A méretezési törvények jelentősége az LLM-ek számára
  • Adat- és modellméret-skálázás
  • Számítási skálázás
  • A paraméterek hatékonyságának skálázása

Optimalizálás

  • A modell mérete, az adatméret, a számítási költségvetés és a következtetési követelmények közötti kapcsolat
  • Az LLM-ek teljesítményének és hatékonyságának optimalizálása
  • A legjobb gyakorlatok és eszközök az LLM-ek képzéséhez és finomhangolásához

LLM-ek képzése és finomhangolása

  • LLM-ek képzésének lépései és kihívásai a semmiből
  • Adatgyűjtés és karbantartás
  • Nagyszabású adat-, CPU- és memóriaigény
  • Optimalizálási kihívások
  • Nyílt forráskódú LLM-ek tájképe

A Reinforcement Learning alapjai (RL)

  • Bevezetés a Reinforcement Learning-be
  • Tanulás pozitív megerősítésen keresztül
  • Definíció és alapfogalmak
  • Markov döntési folyamat (MDP)
  • Dinamikus programozás
  • Monte Carlo módszerek
  • Időbeli különbségek tanulása

Mély Reinforcement Learning

  • Deep Q-Networks (DQN)
  • Proximális házirend-optimalizálás (PPO)
  • Element / Reinforcement Learning

Az LLM-ek integrációja és Reinforcement Learning

  • Az LLM-ek összekapcsolása a Reinforcement Learning-vel
  • Hogyan használják az RL-t az LLM-ekben
  • Reinforcement Learning emberi visszajelzéssel (RLHF)
  • Alternatívák az RLHF-hez

Esettanulmányok és alkalmazások

  • Valós alkalmazások
  • Sikertörténetek és kihívások

Speciális témák

  • Fejlett technikák
  • Speciális optimalizálási módszerek
  • Élvonalbeli kutatás és fejlesztés

Összegzés és a következő lépések

Követelmények

  • A Machine Learning alapvető ismerete

Közönség

  • Adattudósok
  • Szoftvermérnökök
 21 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák