Kurzusleírás

spark.mllib: adattípusok, algoritmusok és segédprogramok

  • Adattípusok
  • Alapstatisztika
    • összefoglaló statisztika
    • összefüggések
    • rétegelt mintavétel
    • hipotézis tesztelés
    • streaming szignifikancia tesztelése
    • véletlenszerű adatgenerálás
  • Osztályozás és regresszió
    • lineáris modellek (SVM-ek, logisztikai regresszió, lineáris regresszió)
    • naiv Bayes
    • döntési fák
    • faegyüttesek (Random Forest és Gradient-Boosted Trees)
    • izotóniás regresszió
  • Együttműködési szűrés
    • váltakozó legkisebb négyzetek (ALS)
  • Klaszterezés
    • k-át jelenti
    • Gauss keverék
    • teljesítmény iterációs klaszterezés (PIC)
    • látens Dirichlet allokáció (LDA)
    • felező k-középeket
    • streaming k-means
  • Dimenziócsökkentés
    • szinguláris érték dekompozíció (SVD)
    • főkomponens-elemzés (PCA)
  • Funkciók kinyerése és átalakítása
  • Gyakori mintabányászat
    • FP-növekedés
    • egyesületi szabályok
    • PrefixSpan
  • Értékelési mérőszámok
  • PMML modell export
  • Optimalizálás (fejlesztő)
    • sztochasztikus gradiens süllyedés
    • korlátozott memóriájú BFGS (L-BFGS)

spark.ml: magas szintű API-k ML-folyamatokhoz

  • Áttekintés: becslések, transzformátorok és csővezetékek
  • Jellemzők kinyerése, átalakítása és kiválasztása
  • Osztályozás és regresszió
  • Klaszterezés
  • Haladó témák

Követelmények

Az alábbiak egyikének ismerete:

  • Jáva
  • Scala
  • Piton
  • SparkR.
 35 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (1)

Közelgő kurzusok

Rokon kategóriák