Kurzusleírás
- Machine Learning bevezetés
- A gépi tanulás típusai – felügyelt és nem felügyelt tanulás
- A statisztikai tanulástól a gépi tanulásig
- A Data Mining munkafolyamat:
- Business megértés
- Adatok megértése
- Adatok előkészítése
- Modellezés
- Értékelés
- Telepítés
- Gépi tanulási algoritmusok
- A probléma megoldásához megfelelő algoritmus kiválasztása
- Túlillesztés és torzítás-variancia kompromisszum ML-ben
- ML könyvtárak és programozási nyelvek
- Miért használjunk programozási nyelvet
- R és Python közötti választás
- Python gyorspálya
- Python források
- Python Könyvtárak gépi tanuláshoz
- Jupyter notebookok és interaktív kódolás
- ML algoritmusok tesztelése
- Általánosítás és túlillesztés
- A túlszerelés elkerülése
- Holdout módszer
- Keresztellenőrzés
- Bootstrapping
- Numerikus előrejelzések értékelése
- Pontossági mérőszámok: ME, MSE, RMSE, MAPE
- Paraméter- és előrejelzési stabilitás
- Osztályozási algoritmusok kiértékelése
- Pontosság és problémái
- A zavaros mátrix
- Kiegyensúlyozatlan osztályok probléma
- A modell teljesítményének megjelenítése
- Profit görbe
- ROC görbe
- Emelési görbe
- Modell kiválasztása
- Modellhangolás – rácskeresési stratégiák
- Példák itt: Python
- Adatok előkészítése
- Adatimportálás és tárolás
- Az adatok megértése – alapfeltárások
- Adatmanipulációk panda könyvtárral
- Adattranszformációk – Data Wrangling
- Feltáró elemzés
- Hiányzó megfigyelések – észlelés és megoldások
- Outliers – észlelés és stratégiák
- Szabványosítás, normalizálás, binarizálás
- Kvalitatív adatrögzítés
- Példák itt: Python
- Osztályozás
- Bináris vs többosztályos osztályozás
- Osztályozás matematikai függvényekkel
- Lineáris diszkrimináns függvények
- Másodfokú diszkriminancia függvények
- Logisztikus regressziós és valószínűségi megközelítés
- k-legközelebbi szomszédok
- Naiv Bayes
- Döntési fák
- KOSÁR
- Zsákolás
- Random Forests
- Fellendítés
- Xgboost
- Támogatja a vektoros gépeket és kerneleket
- Maximális árrés osztályozó
- Támogatja a Vector gépet
- Együttes tanulás
- Példák itt: Python
- Regresszió és numerikus előrejelzés
- Legkisebb négyzetek becslése
- Változókiválasztási technikák
- Szabályosítás és stabilitás- L1, L2
- Nemlinearitások és általánosított legkisebb négyzetek
- Polinomiális regresszió
- Regressziós spline
- Regressziós fák
- Példák itt: Python
- Felügyelet nélküli tanulás
- Klaszterezés
- Centroid alapú klaszterezés – k-középek, k-medoidok, PAM, CLARA
- Hierarchikus klaszterezés – Diana, Ágnes
- Modell alapú klaszterezés - EM
- Önszerveződő térképek
- Klaszterek értékelése és értékelése
- Dimenziócsökkentés
- Főkomponens elemzés és faktoranalízis
- Szinguláris érték felbontás
- Többdimenziós méretezés
- Példák itt: Python
- Klaszterezés
- Szövegbányászat
- Adatok előfeldolgozása
- A zsákos szavak modellje
- Száradás és lemmizáció
- Szavak gyakoriságának elemzése
- Érzelemelemzés
- Szófelhők létrehozása
- Példák itt: Python
- Ajánlómotorok és együttműködési szűrés
- Ajánlási adatok
- Felhasználó alapú együttműködési szűrés
- Tétel alapú együttműködési szűrés
- Példák itt: Python
- Társulási minta bányászat
- Gyakori elemkészletek algoritmusa
- Piaci kosár elemzés
- Példák itt: Python
- Outlier elemzés
- Extrém értékelemzés
- Távolság alapú kiugró értékek észlelése
- Sűrűség alapú módszerek
- Nagy dimenziós kiugró értékek észlelése
- Példák itt: Python
- Machine Learning esettanulmány
- Business problémamegértés
- Adatok előfeldolgozása
- Algoritmus kiválasztása és hangolása
- A megállapítások értékelése
- Telepítés
Követelmények
A Machine Learning alapelemek ismerete és tudatossága
Vélemények (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Kurzus - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurzus - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback