Kurzusleírás

Első nap: Nyelvi alapok

  • A kurzus bevezetése
  • Data Science ról
    • Data Science definíció
    • Data Science elvégzése folyamat
  • R Language bevezetése
  • Változók és típusok
  • Vezérlőstruktúrák (ciklusok / feltételek)
  • R skalárok, vektorok és mátrixok
    • R vektorok definiálása
    • Mátrixok
  • Szövegkezelés
    • Karakter típus
    • Fájlbeolvasás
  • Listák
  • Függvények
    • Függvények bevezetése
    • Záróközkönyvek
    • lapply/sapply függvények
  • Adatkeretek
  • Minden szakaszhoz laborok

Második nap: Középfokú R Programming

  • Adatkeretek és fájlbeolvasás
  • Adatok fájlból való beolvasása
  • Adatfelkészítés
  • Beépített adathalmazok
  • Vizualizáció
    • Grafikai csomag
    • plot() / oszlopdiagram / hist() / boxplot() / szórásdiagram
    • Hőkép
    • ggplot2 csomag (qplot(), ggplot())
  • Dplyr segítségével történő vizsgálat
  • Minden szakaszhoz laborok

Harmadik nap: Haladó Programming R-rel

  • Statisztikai modellzés R-rel
    • Statisztikai függvények
    • NA kezelése
    • Eloszások (Binomális, Poisson, Normális)
  • Regresszió
    • Lineáris regressziók bevezetése
  • Ajánlások
  • Szövegszabályozás (tm csomag / Word felhők)
  • Clusterizálás
    • Clusterizálás bevezetése
    • KMeans
  • Osztályozás
    • Osztályozás bevezetése
    • Naive Bayes
    • Döntési fák
    • Tanítás caret csomaggal
    • Algoritmusok értékelése
  • R és Big Data
    • R csatlakoztatása adatbázisokhoz
    • Big Data ökoszisztéma
  • Minden szakaszhoz laborok

Követelmények

  • A programozási alapok ismerete előnyös

Beállítás

 21 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (7)

Közelgő kurzusok

Rokon kategóriák