Kurzusleírás
1. szakasz: Data Management HDFS-ben
- Különféle adatformátumok (JSON/Avro/Parquet)
- Tömörítési sémák
- Adatmaszkolás
- Labs : Különböző adatformátumok elemzése; tömörítést tesz lehetővé
2. szakasz: Advanced Pig
- Felhasználó által definiált funkciók
- Bevezetés a sertéskönyvtárakba (ElephantBird / Data-Fu)
- Összetett strukturált adatok betöltése a Pig segítségével
- Pig Tuning
- Labs : fejlett pig scripting, összetett adattípusok elemzése
3. szakasz: Haladó Hive
- Felhasználó által definiált funkciók
- Tömörített táblázatok
- Hive Teljesítményhangolás
- Labs: tömörített táblázatok létrehozása, táblázatformátumok és konfigurációk kiértékelése
4. szakasz: Speciális HBase
- Speciális sémamodellezés
- Tömörítés
- Tömeges adatfeldolgozás
- Széles asztal / magas asztal összehasonlítása
- HBase és Pig
- HBase és Hive
- HBase teljesítményhangolás
- Labs : HBase hangolása; HBase adatok elérése a Pig & Hive; A Phoenix használata adatmodellezéshez
Követelmények
- jól ismeri az Java programozási nyelvet (a legtöbb programozási gyakorlat java-ban van)
- kényelmes a Linux környezetben (tudjon navigálni Linux parancssorban, szerkeszteni a fájlokat a vi / nano segítségével)
- a Hadoop munkaismerete.
Labor környezet
Nulla telepítés: Nem kell hadoop szoftvert telepíteni a hallgatók gépére! A tanulók számára egy működő hadoop klasztert biztosítunk.
A tanulóknak a következőkre lesz szükségük
- SSH-kliens (Linux és Mac-ben már vannak ssh-kliensek, Windowshoz a Putty ajánlott)
- egy böngésző a fürt eléréséhez. Javasoljuk a Firefox böngészőt
Vélemények (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurzus - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
practical things of doing, also theory was served good by Ajay