Kurzusleírás
Az Google Colab és a Apache Spark bemutatása
- Az Google Colab áttekintése
- Bevezetés a Apache Spark-ba
- A Spark beállítása az Google Colabban
Adatfeldolgozás a Apache Spark segítségével
- Munka RDD-kkel és DataFrame-ekkel
- Nagy adathalmazok betöltése és feldolgozása
- Spark SQL használata strukturált adatok lekérdezéséhez
Advanced Analytics Spark segítségével
- Gépi tanulás a Spark MLlib segítségével
- Valós idejű adatelemzés végrehajtása
- Elosztott számítástechnika a Spark segítségével
Vizualizáció és Collaboration az Google Colabban
- A Colab integrálása népszerű vizualizációs könyvtárakkal
- Együttműködő munkafolyamatok a Colab jegyzetfüzetekkel
- Az eredmények megosztása és exportálása
Munkafolyamatok optimalizálása Big Data
- A Spark hangolása a teljesítményhez
- A memória és tárhely használatának optimalizálása
- Munkafolyamatok skálázása nagy adatkészletekhez
Big Data a Felhőben
- Az Google Colab integrálása felhőalapú eszközökkel
- Felhőalapú tárolás használata nagy adatokhoz
- A Spark használata elosztott felhőkörnyezetekben
Esettanulmányok és bevált gyakorlatok
- A valós big data alkalmazások áttekintése
- Esettanulmányok Apache Spark és Colab használatával
- A big data elemzésének legjobb gyakorlatai
Összegzés és a következő lépések
Követelmények
- Adattudományi fogalmak alapismeretei
- Ismerkedés a következővel: Apache Spark
- Python programozási ismeretek
Közönség
- Adattudósok
- Adatmérnökök
- Nagy adatokkal dolgozó kutatók
Vélemények (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Kurzus - ArcGIS Fundamentals
Labor gyakorlat
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Kurzus - Automated Monitoring with Zabbix
Gépi fordítás
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Kurzus - QGIS for Geographic Information System
Tetszett Pablo stílusa, az a tény, hogy rengeteg témával foglalkozott a jelentéskészítéstől, a html-el történő testreszabáson át az egyszerű ML algoritmusok megvalósításáig. Good egyensúly elméleti információk / gyakorlatok. Pablo valóban lefedett minden olyan témát, ami érdekelt, és átfogó választ adott a kérdéseimre.
Cristian Tudose - SC Automobile Dacia SA
Kurzus - Advanced Data Analysis with TIBCO Spotfire
Gépi fordítás
Actual application of spotfire and all basic functions.