Kurzusleírás

Az Google Colab és a Apache Spark bemutatása

  • Az Google Colab áttekintése
  • Bevezetés a Apache Spark-ba
  • A Spark beállítása az Google Colabban

Adatfeldolgozás a Apache Spark segítségével

  • Munka RDD-kkel és DataFrame-ekkel
  • Nagy adathalmazok betöltése és feldolgozása
  • Spark SQL használata strukturált adatok lekérdezéséhez

Advanced Analytics Spark segítségével

  • Gépi tanulás a Spark MLlib segítségével
  • Valós idejű adatelemzés végrehajtása
  • Elosztott számítástechnika a Spark segítségével

Vizualizáció és Collaboration az Google Colabban

  • A Colab integrálása népszerű vizualizációs könyvtárakkal
  • Együttműködő munkafolyamatok a Colab jegyzetfüzetekkel
  • Az eredmények megosztása és exportálása

Munkafolyamatok optimalizálása Big Data

  • A Spark hangolása a teljesítményhez
  • A memória és tárhely használatának optimalizálása
  • Munkafolyamatok skálázása nagy adatkészletekhez

Big Data a Felhőben

  • Az Google Colab integrálása felhőalapú eszközökkel
  • Felhőalapú tárolás használata nagy adatokhoz
  • A Spark használata elosztott felhőkörnyezetekben

Esettanulmányok és bevált gyakorlatok

  • A valós big data alkalmazások áttekintése
  • Esettanulmányok Apache Spark és Colab használatával
  • A big data elemzésének legjobb gyakorlatai

Összegzés és a következő lépések

Követelmények

  • Adattudományi fogalmak alapismeretei
  • Ismerkedés a következővel: Apache Spark
  • Python programozási ismeretek

Közönség

  • Adattudósok
  • Adatmérnökök
  • Nagy adatokkal dolgozó kutatók
 14 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák