Kurzusleírás

A Data Analysis és Big Data bemutatása

  • Mitől Big Data "nagy"?
    • Sebesség, térfogat, változatosság, igazságosság (VVVV)
  • A hagyományos adatfeldolgozás korlátai
  • Elosztott feldolgozás
  • Statisztikai elemzés
  • Az elemzés típusai Machine Learning
  • Data Visualization

Big Data Szerepek és felelősségek

  • Rendszergazdák
  • Fejlesztők
  • Adatelemzők

Languages Használt: Data Analysis

  • R Language
    • Miért R a Data Analysis?
    • Adatkezelés, számítás és grafikus megjelenítés
  • Python
    • Miért Python a Data Analysis-hez?
    • Adatok kezelése, feldolgozása, tisztítása és roppantása

Megközelítések Data Analysis

  • Statisztikai elemzés
    • Idősor elemzés
    • Forecasting korrelációs és regressziós modellekkel
    • Következtető Statistics (becslés)
    • Leíró Statistics Big Data halmazokban (pl. az átlag kiszámítása)
  • Machine Learning
    • Felügyelt vs felügyelet nélküli tanulás
    • Osztályozás és klaszterezés
    • Konkrét módszerek költségének becslése
    • Szűrő
  • Természetes nyelvi feldolgozás
    • Szöveg feldolgozása
    • A szöveg jelentésének megértése
    • Automatikus szöveggenerálás
    • Érzelemelemzés / témaelemzés
  • Computer Vision
    • Képek beszerzése, feldolgozása, elemzése és megértése
    • 3D jelenetek rekonstruálása, értelmezése és megértése
    • Képadatok felhasználása döntések meghozatalához

Big Data Infrastruktúra

  • Adattárolás
    • Relációs adatbázisok (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Nem relációs adatbázisok (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4j s
    • Az árnyalatok megértése
      • Hierarchikus adatbázisok
      • Objektumorientált adatbázisok
      • Dokumentumorientált adatbázisok
      • Gráf-orientált adatbázisok
      • Más
  • Elosztott feldolgozás
    • Hadoop
      • HDFS mint elosztott fájlrendszer
      • MapReduce az elosztott feldolgozáshoz
    • Szikra
      • All-in-one memória fürt számítási keretrendszer nagyszabású adatfeldolgozáshoz
      • Strukturált adatfolyam
      • Spark SQL
      • Machine Learning könyvtárak: MLlib
      • Grafikonfeldolgozás a GraphX segítségével
  • Scalaképesség
    • Nyilvános felhő
      • AWS, Google, Aliyun stb.
    • Privát felhő
      • OpenStack, Cloud Foundry stb.
    • Automatikus skálázhatóság

A megfelelő megoldás kiválasztása a problémára

A jövő Big Data

Összegzés és a következő lépések

Követelmények

  • A matematika általános megértése
  • A programozás általános ismerete
  • Az adatbázisok általános ismerete

Közönség

  • Fejlesztők / programozók
  • IT tanácsadók
 35 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (7)

Közelgő kurzusok

Rokon kategóriák