Szkolenie Hadoop
Poziom
ŚredniozaawansowanyCzas
16h / 2 dniTermin
IndywidualnieCena
IndywidualnieSzkolenie z Hadoop
Szkolenie Hadoop to intensywny, dwudniowy kurs skoncentrowany na praktycznym zastosowaniu tego popularnego frameworka do przetwarzania i analizy dużych zbiorów danych. Program szkolenia jest zaprojektowany tak, aby uczestnicy zdobyli solidne podstawy teoretyczne (20%) oraz rozwinęli swoje umiejętności praktyczne (80%) poprzez liczne warsztaty i projekty. Kurs jest idealny dla osób pragnących zrozumieć i wykorzystać Hadoop w swoich projektach.
Dla kogo jest szkolenie z Hadoop?
Programistów i inżynierów danych, którzy chcą poszerzyć swoje umiejętności o Hadoop
Data scientistów i analityków danych pragnących przetwarzać duże zbiory danych w efektywny sposób
Specjalistów IT i big data, którzy chcą wykorzystać Hadoop w swoich projektach
Wymagane umiejętności technologiczne:
- Znajomość podstaw programowania w Java lub Pythonie
- Podstawowa wiedza z zakresu przetwarzania danych
- Umiejętność pracy w środowisku Unix/Linux
Czego nauczysz się na szkoleniu z Hadoop?
- Jak efektywnie zarządzać danymi w HDFS i tworzyć zadania MapReduce
- Jak przetwarzać i analizować dane z użyciem Hive i Pig
- Jak optymalizować zadania MapReduce i zarządzać zasobami Hadoop
- Jak wdrożyć i monitorować aplikacje Hadoop w środowisku produkcyjnym
Program szkolenia
Dzień 1: Podstawy Hadoop i przetwarzania danych
Architektura Hadoop
- Omówienie głównych komponentów Hadoop: HDFS, MapReduce, YARN
- Interakcja między komponentami
Podstawy HDFS i MapReduce
- Zarządzanie plikami w HDFS
- Tworzenie i uruchamianie podstawowych zadań MapReduce
Podstawy Apache Hive i Apache Pig
- Wprowadzenie do Hive: struktura tabel, zapytania SQL
- Analiza struktury plików pod Hive
- Wprowadzenie do Pig: skrypty Pig Latin
Warsztat: Przetwarzanie danych z użyciem MapReduce
- Implementacja prostego zadania MapReduce
- Analiza wyników i optymalizacja zadania
Dzień 2: Zaawansowane techniki i praktyczne zastosowania
Zaawansowane przetwarzanie danych
- Pisanie zaawansowanych zapytań Hive
- Tworzenie skomplikowanych skryptów Pig
Optymalizacja i tunning wydajności
- Techniki optymalizacji zadań MapReduce
- Zarządzanie zasobami w klastrze Hadoop
Warsztat: Analiza danych z użyciem Hive i Pig
- Implementacja zapytań Hive na rzeczywistych zbiorach danych
- Tworzenie skryptów Pig do przetwarzania danych
Deployowanie i zarządzanie klastrami Hadoop
- Przygotowanie i wdrażanie aplikacji Hadoop
- Monitorowanie i zarządzanie klastrami Hadoop w środowisku produkcyjnym
Optymalizacja kosztowa – czyli jak kontrolować i optymalizować koszty wynikające z hurtowni Redshift.
Pobierz program
Pobierz szczegółowy program w PDF, żeby dowiedzieć się więcej o godzinach i tematach zajęć.