SMACK Stack for Data Science Képzés
A SMACK az adatplatform szoftverek gyűjteménye, nevezetesen Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, és Apache Kafka. A SMACK stack használatával a felhasználók létrehozhatják és méretezhetik az adatfeldolgozó platformokat.
Ez az oktató által vezetett, élő képzés (online vagy on-site) olyan adattudósokra irányul, akik a SMACK stack-t szeretnék használni az adatfeldolgozó platformok létrehozásához a nagy adatmegoldásokhoz.
A képzés befejezése után a résztvevők képesek lesznek:
- A nagy adatok feldolgozására szolgáló adatcsövek architektúrájának megvalósítása.
- Fejleszteni a klaszter infrastruktúráját Apache Mesos és Docker.
- Az adatok elemzése a Spark és Scala segítségével.
- A nem strukturált adatok kezelése az Apache segítségével Cassandra.
A kurzus formája
- Interaktív előadás és vita.
- Rengeteg gyakorlat és gyakorlat.
- Hands-on megvalósítás egy élő laboratóriumi környezetben.
Szakképesítési lehetőségek
- Ahhoz, hogy egy személyre szabott képzést kérjen erre a kurzusra, kérjük, vegye fel velünk a kapcsolatot a rendezéshez.
Kurzusleírás
Bevezetés
SMACK verem áttekintése
- Mi az a Apache Spark? Apache Spark jellemzői
- Mi az a Apache Mesos? Apache Mesos jellemzői
- Mi az Apache Akka? Apache Akka jellemzői
- Mi az Apache Cassandra? Apache Cassandra jellemzői
- Mi az Apache Kafka? Apache Kafka jellemzői
Scala Nyelv
- Scala szintaxis és szerkezet
- Scala szabályozza az áramlást
Fejlesztési környezet előkészítése
- A SMACK verem telepítése és konfigurálása
- Telepítés és konfigurálás Docker
Apache Akka
- Színészek használata
Apache Cassandra
- Adatbázis létrehozása az olvasási műveletekhez
- Biztonsági mentésekkel és helyreállítással végzett munka
Csatlakozók
- Stream létrehozása
- Akka alkalmazás készítése
- Adatok tárolása a Cassandra segítségével
- Csatlakozók áttekintése
Apache Kafka
- Klaszterekkel végzett munka
- Üzenetek létrehozása, közzététele és fogyasztása
Apache Mesos
- Erőforrások elosztása
- Futó klaszterek
- Az Apache Aurora és Docker
- Szolgáltatások és munkák működtetése
- Spark, Cassandra és Kafka telepítése a Mesoson
Apache Spark
- Adatfolyamok kezelése
- Munka RDD-kkel és adatkeretekkel
- Adatelemzés végrehajtása
Hibaelhárítás
- Szolgáltatási hibák és hibák kezelése
Összefoglalás, és következtetés
Követelmények
- Az adatfeldolgozó rendszerek ismerete
Közönség
- Adattudósok
A nyílt képzésekhez 5+ résztvevő szükséges.
SMACK Stack for Data Science Képzés - Booking
SMACK Stack for Data Science Képzés - Enquiry
SMACK Stack for Data Science - Érdeklődjön a vezetői tanácsadásról!
Érdeklődjön a vezetői tanácsadásról!
Vélemények (1)
very interactive...
Richard Langford
Kurzus - SMACK Stack for Data Science
Közelgő kurzusok
Rokon tanfolyam
Introduction to Data Science and AI using Python
35 ÓrákEz egy ötnapos bevezetés az Data Science és az AI számára.
A tanfolyam példákkal és gyakorlatokkal szolgál a Python segítségével
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) középszintű résztvevőknek szól, akik szeretnék automatizálni és kezelni a gépi tanulási munkafolyamatokat, beleértve a modelloktatást, érvényesítést és telepítést a Apache Airflow segítségével.
A képzés végére a résztvevők képesek lesznek:
- A Apache Airflow beállítása a gépi tanulási munkafolyamat összehangolásához.
- Automatizálja az adat-előfeldolgozást, a modellképzést és az érvényesítési feladatokat.
- Integrálja az Airflow-t gépi tanulási keretrendszerekkel és eszközökkel.
- Telepítsen gépi tanulási modelleket automatizált folyamatok segítségével.
- Figyelemmel kísérheti és optimalizálhatja a gépi tanulási munkafolyamatokat a termelésben.
Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
21 ÓrákEz a kurzus azoknak a fejlesztőknek és adattudósoknak szól, akik szeretnék megérteni és megvalósítani a mesterséges intelligenciát alkalmazásaikban. Különös hangsúlyt kap az adatelemzés, az elosztott mesterséges intelligencia és a természetes nyelvi feldolgozás.
Anaconda Ecosystem for Data Scientists
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adatkutatóknak szól, akik a Anaconda ökoszisztémát szeretnék használni csomagok és adatelemzési munkafolyamatok egyetlen platformon történő rögzítésére, kezelésére és üzembe helyezésére.
A képzés végére a résztvevők képesek lesznek:
- Telepítse és konfigurálja a Anaconda összetevőket és könyvtárakat.
- Ismerje meg a Anaconda alapfogalmait, szolgáltatásait és előnyeit.
- Csomagok, környezetek és csatornák kezelése a Anaconda Navigátor segítségével.
- Használja a Conda, R és Python csomagokat az adattudományhoz és a gépi tanuláshoz.
- Ismerjen meg néhány gyakorlati felhasználási esetet és technikát több adatkörnyezet kezeléséhez.
AWS Cloud9 for Data Science
28 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak a középszintű adattudósoknak és elemzőknek szól, akik az AWS Cloud9-et szeretnék használni az egyszerűsített adattudományi munkafolyamatokhoz.
A képzés végére a résztvevők képesek lesznek:
- Adattudományi környezet beállítása az AWS Cloud9 szolgáltatásban.
- Végezzen adatelemzést a Python, R és Jupyter Notebook használatával a Cloud9-ben.
- Integrálja az AWS Cloud9-et olyan AWS adatszolgáltatásokkal, mint az S3, RDS és Redshift.
- Használja az AWS Cloud9-et a gépi tanulási modell fejlesztéséhez és telepítéséhez.
- Optimalizálja a felhőalapú munkafolyamatokat az adatok elemzéséhez és feldolgozásához.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 Órákáttekintés
A szolgáltatók (CSP) nyomást gyakorolnak a költségek csökkentésére és az átlagos felhasználói bevétel (ARPU) maximalizálására, miközben kiváló ügyfélélményt biztosítanak, de az adatok mennyisége tovább növekszik. A globális mobil adatforgalom növekedni fog egy kombinált éves növekedési ütemben (CAGR) 78 százalékkal 2016-ra, elérve a 10,8 exabyt havonta.
Eközben a CSP-k nagy mennyiségű adatot generálnak, beleértve a hívási részleteket (CDR), a hálózati adatokat és az ügyféladatokat. Azok a cégek, amelyek teljes mértékben kihasználják ezeket az adatokat, versenyképes küszöböt szereznek. A The Economist Intelligence Unit közelmúltbeli felmérése szerint az adatközpontú döntéshozatalt használó vállalatok 5-6% -os termelékenységnövekedést élveznek. Azonban a vállalatok 53 százaléka csak az értékes adataik felét használja fel, és a megkérdezettek egyharmada megjegyezte, hogy a hasznos adatok hatalmas mennyiségét nem használják fel. Az adatok mennyisége olyan magas, hogy a kézi elemzés lehetetlen, és a legtöbb örökletes szoftverrendszer nem tudja megtartani, ami értékes adatokat hagy el vagy figyelmen kívül hagy.
Big Data & Analytics’ nagy sebességű, méretezhető nagy adat szoftverrel a CSP-k minálhatják az összes adatukat a jobb döntéshozatal érdekében kevesebb idő alatt. Különböző termékek és technikák végső szoftver platformot biztosítanak a nagy adatokból származó betekintések gyűjtésére, előkészítésére, elemzésére és bemutatására. Az alkalmazási területek közé tartozik a hálózati teljesítmény nyomon követése, a csalás kimutatása, az ügyfélhullám kimutatása és a hitelkockázatelemzés. Big Data & Analytics termékek skála kezelni terabytes adatokat, de az ilyen eszközök végrehajtása új típusú felhőalapú adatbázis rendszer, mint a Hadoop vagy a tömeges skála párhuzamos számítógépes processzor ( KPU stb.)
Ez a tanfolyam dolgozik Big Data BI for Telco fedezi az összes feltörekvő új területeket, amelyekben a CSP-k befektetnek a termelékenység növelése és megnyitása új üzleti bevételi áram. A kurzus teljes 360 fokos áttekintést nyújt a Big Data BI-ről a Telco-ban, hogy a döntéshozók és a vezetők nagyon széles és átfogó áttekintést kapjanak a Big Data BI lehetőségekről a Telco-ban a termelékenység és a bevételi nyereség érdekében.
kurzus célkitűzései
A kurzus fő célja, hogy új Big Data üzleti intelligencia technikákat vezessen be 4 ágazatban Telecom Business (Marketing/Sales, Network Operation, Financial Operation és Customer Relation Management). A diákokat be kell mutatni a következőkre:
- Bevezetés Big Data-mi a 4Vs (volumen, sebesség, sokszínűség és valószínűség) a Big Data- Generáció, kivonás és menedzsment a Telco perspektívából
- Hogyan különbözik az elemző az öröklési adatok elemzőjétől
- Otthoni indokolás Big Data -Telco perspektívája
- Bevezetés a Hadoop Ökoszisztéma- ismerkedés az összes Hadoop eszközök, mint a Hive, Pig, SPARC – mikor és hogyan használják megoldani Big Data problémát
- Hogyan Big Data kivonható elemezni az analitikai eszköz-hogyan Business Analysis’s csökkentheti a fájdalompontok gyűjtése és elemzése az adatok révén integrált Hadoop dashboard megközelítés
- Az Insight elemzés, a vizualizációs elemzés és az előrejelzési elemzés alapvető bemutatása a Telco számára
- Az ügyfélszóró elemzés és a Big Data-how Big Data elemzés csökkenti az ügyfélszórót és az ügyfél elégedetlenségét a Telco-ügyvizsgálatokban
- Hálózati hibák és szolgáltatási hibák elemzése a Hálózati meta-adatokból és az IPDR-ből
- Pénzügyi elemzés - csalás, csalás és ROI becslés az értékesítésből és az üzemeltetési adatokból
- Ügyfél beszerzési probléma-cél marketing, ügyfél szegmentáció és cross-sales az értékesítési adatokból
- Bevezetés és összefoglaló az összes Big Data analitikai termékről és arról, hogy hol illeszkednek a Telco analitikai térbe
- Következtetés-hogyan lehet lépésről lépésre megközelíteni Big Data Business Intelligence bevezetését a szervezetbe
Célközönség
- Hálózati üzemeltetések, Pénzügyi Menedzserek, CRM menedzserek és vezető IT menedzserek a Telco CIO irodájában.
- Business Az elemzők a Telco
- CFO irodai menedzserek / elemzők
- Operációs menedzserek
- QA menedzserek
Introduction to Google Colab for Data Science
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) kezdő szintű adattudósoknak és informatikai szakembereknek szól, akik az Google Colab segítségével szeretnék megtanulni az adattudomány alapjait.
A képzés végére a résztvevők képesek lesznek:
- Az Google Colab beállítása és navigálása.
- Írja meg és futtassa az alapvető Python kódot.
- Adatkészletek importálása és kezelése.
- Készítsen vizualizációkat Python könyvtárak használatával.
A Practical Introduction to Data Science
35 ÓrákAzok a résztvevők, akik elvégzik ezt a képzést, gyakorlati, valós ismereteket szereznek a Data Science-ről és a kapcsolódó technológiákról, módszertanokról és eszközökről.
A résztvevők gyakorlati gyakorlatokon keresztül lehetőséget kapnak arra, hogy ezt a tudást a gyakorlatba is átültessék. A csoportos interakció és az oktatói visszajelzések az óra fontos részét képezik.
A kurzus a Data Science elemi fogalmainak bemutatásával kezdődik, majd a Data Science-ben használt eszközök és módszertanok felé halad.
Közönség
- Fejlesztők
- Műszaki elemzők
- informatikai tanácsadók
A tanfolyam formátuma
- Rész előadás, részben beszélgetés, gyakorlatok és nehéz gyakorlati gyakorlatok
Jegyzet
- Ha személyre szabott képzést szeretne kérni ehhez a tanfolyamhoz, kérjük, vegye fel velünk a kapcsolatot, hogy megbeszéljük.
Data Science for Big Data Analytics
35 ÓrákA nagy adat olyan adatkészletek, amelyek annyira terjedelmesek és összetettek, hogy a hagyományos adatfeldolgozó alkalmazásszoftverek nem megfelelőek ezek kezelésére. A nagy adat kihívások között szerepel az adatok rögzítése, az adatok tárolása, az adatok elemzése, a keresés, a megosztás, az átvitel, a megjelenítés, a lekérdezés, a frissítés és az adatvédelem.
Introduction to Graph Computing
28 ÓrákEzen az oktató által vezetett, élő képzésen a Magyarország-ban a résztvevők megismerkedhetnek a technológiai kínálatokkal és a grafikonadatok feldolgozásának megvalósítási módszereivel. A cél a valós objektumok, jellemzőik és kapcsolataik azonosítása, majd a kapcsolatok modellezése és adatként való feldolgozása Graph Computing (más néven Graph Analytics) megközelítéssel. Kezdjük egy átfogó áttekintéssel, és leszűkítjük a konkrét eszközöket, miközben esettanulmányok, gyakorlati gyakorlatok és élő telepítések sorozatán lépkedünk végig.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg a grafikonadatok megőrzését és bejárását.
- Válassza ki a legjobb keretrendszert egy adott feladathoz (a gráfadatbázisoktól a kötegelt feldolgozási keretrendszerekig).
- A Hadoop, a Spark, GraphX és a Pregel megvalósítása számos gépen párhuzamosan végezhet gráfszámítást.
- Tekintse meg a valós világban felmerülő big data problémákat grafikonok, folyamatok és bejárások formájában.
Kaggle
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adattudósoknak és fejlesztőknek szól, akik szeretnének tanulni és karrierjüket a Data Science-ban az Kaggle segítségével építeni.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg az adattudományt és a gépi tanulást.
- Fedezze fel az adatelemzést.
- További információ a Kaggle-ről és annak működéséről.
Accelerating Python Pandas Workflows with Modin
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adattudósoknak és fejlesztőknek szól, akik az Modin segítségével párhuzamos számításokat kívánnak készíteni és megvalósítani a Pandas-vel a gyorsabb adatelemzés érdekében.
A képzés végére a résztvevők képesek lesznek:
- Állítsa be a szükséges környezetet a Pandas munkafolyamatok nagyarányú fejlesztésének megkezdéséhez az Modin segítségével.
- Ismerje meg az Modin szolgáltatásait, felépítését és előnyeit.
- Ismerje meg a különbségeket Modin, Dask és Ray között.
- Hajtsa végre a Pandas műveletet gyorsabban az Modin segítségével.
- Valósítsa meg a teljes Pandas API-t és funkciókat.
GPU Data Science with NVIDIA RAPIDS
14 ÓrákEz az oktató által vezetett, élő képzés a Magyarország-ban (online vagy helyszíni) azoknak az adattudósoknak és fejlesztőknek szól, akik a RAPIDS segítségével GPU gyorsított adatfolyamokat, munkafolyamatokat és vizualizációkat kívánnak készíteni, gépi tanulási algoritmusokat alkalmazva, mint például az XGBoost, a cuML stb.
A képzés végére a résztvevők képesek lesznek:
- Állítsa be a szükséges fejlesztői környezetet az adatmodellek NVIDIA-val való felépítéséhez RAPIDS.
- Ismerje meg a RAPIDS szolgáltatásait, összetevőit és előnyeit.
- Használja ki az GPU-eket a végpontok közötti adat- és elemzési folyamatok felgyorsításához.
- Valósítson meg GPU-gyorsított adat-előkészítést és ETL-t cuDF-el és Apache Arrow-val.
- Ismerje meg, hogyan hajthat végre gépi tanulási feladatokat XGBoost és cuML algoritmusokkal.
- Készítsen adatvizualizációkat és hajtson végre grafikonelemzést a cuXfilter és cuGraph segítségével.
Python and Spark for Big Data (PySpark)
21 ÓrákEzen az oktató által vezetett, élő képzésen a Magyarország-ban a résztvevők megtanulják, hogyan használhatják a Python-t és a Spark-ot a nagy adatok elemzésére, miközben gyakorlati gyakorlatokon dolgoznak.
A képzés végére a résztvevők képesek lesznek:
- Ismerje meg, hogyan használja a Sparkot a Python-val a Big Data elemzéséhez.
- Dolgozz olyan gyakorlatokon, amelyek a valós eseteket utánozzák.
- Használjon különféle eszközöket és technikákat a nagy adatelemzéshez az PySpark segítségével.
Apache Spark MLlib
35 ÓrákAz MLlib a Spark gépi tanulási (ML) könyvtára. Célja, hogy a gyakorlati gépi tanulás méretezhető és egyszerű legyen. Közös tanulási algoritmusokból és segédprogramokból áll, beleértve a besorolást, a regressziót, a klaszterezést, az együttműködő szűrést, a dimenziócsökkentést, valamint az alacsonyabb szintű optimalizálási primitíveket és a magasabb szintű csővezeték API-kat.
Ez két csomagra oszlik:
A spark.mllib tartalmazza az RDD-re épített eredeti API-t.
A spark.ml magasabb szintű API-t kínál, amely a DataFrames tetején épült ML-csővezetékek építéséhez.
Közönség
Ez a tanfolyam olyan mérnökökre és fejlesztőkre irányul, akik egy beépített gépkönyvtárat kívánnak használni az Apache Spark