Kursnummer | 5731 |
Leitung |
Valentin Shilin
|
erster Termin | Montag, 01.12.2025 18:00–19:40 Uhr |
letzter Termin | Montag, 26.01.2026 18:00–19:40 Uhr |
Plätze | min. 6 / max. 8 noch genügend Plätze frei |
Entgelt | 142,60 EUR |
Ort |
Online-Angebot
|
Apache Spark - Big Data in der Praxis
Apache Spark ist eines der führenden Frameworks für die verteilte Verarbeitung großer Datenmengen. In diesem Kurs lernen die Teilnehmenden die Grundlagen von Spark sowie die notwendigen Vorkenntnisse in Scala kennen und bauen darauf Schritt für Schritt praxisnahe Anwendungen auf.
Die Inhalte sind in sechs Module gegliedert:
- Modul 1: Einführung - Spark-Grundlagen und erste Schritte in Scala
- Modul 2: Big Data - Hadoop, HDFS, Hive, Spark in YARN und Kubernetes
- Modul 3: APIs - RDD, DataFrames, Datasets, SparkSQL, UDF/UDAF, Pandas API und Apache Arrow
- Modul 4: Datenquellen - Dateien, Datenbanken, Kafka und Structured Streaming
- Modul 5: Erweitere Funktionen - Spark ML, Graphenverarbeitung und Testen von Spark-Anwendungen
- Modul 6: Produktion - Orchestierung, Monitoring und Optimierung von Spark-Anwendungen.
Der Kurs verbindet Theorie mit praktischen Übungen und richtet sich an Entwickler*innen und Data Engineers, die Spark in realen Projekten einsetzen möchten.
Vorraussetzungen: Computer mit stabiler Internetverbindung. Materialien werden als Docker-Dateien mit Anleitung bereitgestellt. Bei diesem Kurs handelt es sich um ein Onlineangebot.
# | Datum | Uhrzeit |
---|---|---|
1. | Mo., 01.12.2025 | 18:00–19:40 Uhr |
2. | Mi., 03.12.2025 | 18:00–19:40 Uhr |
3. | Mo., 08.12.2025 | 18:00–19:40 Uhr |
4. | Mi., 10.12.2025 | 18:00–19:40 Uhr |
5. | Mo., 15.12.2025 | 18:00–19:40 Uhr |
6. | Mi., 17.12.2025 | 18:00–19:40 Uhr |
7. | Mi., 07.01.2026 | 18:00–19:40 Uhr |
8. | Mo., 12.01.2026 | 18:00–19:40 Uhr |
9. | Mi., 14.01.2026 | 18:00–19:40 Uhr |
10. | Mo., 19.01.2026 | 18:00–19:40 Uhr |
11. | Mi., 21.01.2026 | 18:00–19:40 Uhr |
12. | Mo., 26.01.2026 | 18:00–19:40 Uhr |