Kurzusleírás

Bevezetés

  • Databricks és Apache Spark áttekintése
  • Az Databricks architektúra megértése

Kezdő lépések

  • A környezet beállítása
  • Beállítás és konfigurálás Databricks
  • Navigálás a Databricks felhasználói felületen
  • Databricks munkaterület létrehozása

Adatok kezelése itt: Databricks

  • Csatlakozás Apache Spark adatforráshoz
  • Az alapvető oszlopok és adattípusok megértése
  • Fájlrendszer kezelése notebookokba

Munkák és klaszterek kezelése

  • Klaszterek létrehozása és konfigurálása
  • Feladatok létrehozása a Notebook segítségével
  • Futó munkák
  • Az állások és a munka részleteinek megtekintése

A Delta Lake használata itt: Databricks

  • Adatok betöltése a Delta Lake-be
  • Adatkezelés a Delta Lake-ben

Biztosítás Databricks

  • Databricks biztonság kezelése
  • Biztonsági mentés és helyreállítás kezelése

Hibaelhárítás

Összegzés és a következő lépések

Követelmények

  • Az adatelemzés alapjai
  • Apache Spark ismerete

Közönség

  • Adatmérnökök
  • Adattudósok
  • Fejlesztők
 14 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák