Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
Bevezetés a Large Language Models (LLMs)-be
- Az LLM-ek áttekintése
- Definíció és jelentősége
- Alkalmazások az AI-ban ma
Transzformátor építészet
- Mi az a transzformátor és hogyan működik?
- Főbb összetevők és jellemzők
- Beágyazás és pozíciókódolás
- Többfejű figyelem
- Előrecsatolt neurális hálózat
- Normalizálás és maradék csatlakozások
Transzformátor modellek
- Önfigyelő mechanizmus
- Kódoló-dekódoló architektúra
- Pozíciós beágyazások
- BERT (Bidirectional Encoder Representations from Transformers)
- GPT (generatív előképzett transzformátor)
Teljesítményoptimalizálás és buktatók
- Kontextus hossza
- Mamba és állapottér modellek
- Felvillanó figyelem
- Ritka transzformátorok
- Látótranszformátorok
- A kvantálás jelentősége
A transzformátorok fejlesztése
- Visszakeresés bővített szöveggenerálás
- Modellek keveréke
- A gondolatok fája
Finomhangolás
- Az alacsony szintű alkalmazkodás elmélete
- Finomhangolás QLora segítségével
Méretezési törvények és optimalizálás az LLM-ekben
- A méretezési törvények jelentősége az LLM-ek számára
- Adat- és modellméret-skálázás
- Számítási skálázás
- A paraméterek hatékonyságának skálázása
Optimalizálás
- A modell mérete, az adatméret, a számítási költségvetés és a következtetési követelmények közötti kapcsolat
- Az LLM-ek teljesítményének és hatékonyságának optimalizálása
- A legjobb gyakorlatok és eszközök az LLM-ek képzéséhez és finomhangolásához
LLM-ek képzése és finomhangolása
- LLM-ek képzésének lépései és kihívásai a semmiből
- Adatgyűjtés és karbantartás
- Nagyszabású adat-, CPU- és memóriaigény
- Optimalizálási kihívások
- Nyílt forráskódú LLM-ek tájképe
A Reinforcement Learning alapjai (RL)
- Bevezetés a Reinforcement Learning-be
- Tanulás pozitív megerősítésen keresztül
- Definíció és alapfogalmak
- Markov döntési folyamat (MDP)
- Dinamikus programozás
- Monte Carlo módszerek
- Időbeli különbségek tanulása
Mély Reinforcement Learning
- Deep Q-Networks (DQN)
- Proximális házirend-optimalizálás (PPO)
- Element / Reinforcement Learning
Az LLM-ek integrációja és Reinforcement Learning
- Az LLM-ek összekapcsolása a Reinforcement Learning-vel
- Hogyan használják az RL-t az LLM-ekben
- Reinforcement Learning emberi visszajelzéssel (RLHF)
- Alternatívák az RLHF-hez
Esettanulmányok és alkalmazások
- Valós alkalmazások
- Sikertörténetek és kihívások
Speciális témák
- Fejlett technikák
- Speciális optimalizálási módszerek
- Élvonalbeli kutatás és fejlesztés
Összegzés és a következő lépések
Követelmények
- A Machine Learning alapvető ismerete
Közönség
- Adattudósok
- Szoftvermérnökök
21 Órák