Poziom

Średniozaawansowany

Czas

16h / 2 dni

Termin

Indywidualnie

Cena

Indywidualnie

Szkolenie z Hadoop

Szkolenie Hadoop to intensywny, dwudniowy kurs skoncentrowany na praktycznym zastosowaniu tego popularnego frameworka do przetwarzania i analizy dużych zbiorów danych. Program szkolenia jest zaprojektowany tak, aby uczestnicy zdobyli solidne podstawy teoretyczne (20%) oraz rozwinęli swoje umiejętności praktyczne (80%) poprzez liczne warsztaty i projekty. Kurs jest idealny dla osób pragnących zrozumieć i wykorzystać Hadoop w swoich projektach.

Dla kogo jest szkolenie z Hadoop?
  • logo infoshare Programistów i inżynierów danych, którzy chcą poszerzyć swoje umiejętności o Hadoop
  • logo infoshare Data scientistów i analityków danych pragnących przetwarzać duże zbiory danych w efektywny sposób
  • logo infoshare Specjalistów IT i big data, którzy chcą wykorzystać Hadoop w swoich projektach

Wymagane umiejętności technologiczne:

  • Znajomość podstaw programowania w Java lub Pythonie
  • Podstawowa wiedza z zakresu przetwarzania danych
  • Umiejętność pracy w środowisku Unix/Linux

Czego nauczysz się na szkoleniu z Hadoop?

  • Jak efektywnie zarządzać danymi w HDFS i tworzyć zadania MapReduce
  • Jak przetwarzać i analizować dane z użyciem Hive i Pig
  • Jak optymalizować zadania MapReduce i zarządzać zasobami Hadoop
  • Jak wdrożyć i monitorować aplikacje Hadoop w środowisku produkcyjnym

Program szkolenia

Dzień 1: Podstawy Hadoop i przetwarzania danych

 

Architektura Hadoop

  • Omówienie głównych komponentów Hadoop: HDFS, MapReduce, YARN
  • Interakcja między komponentami

Podstawy HDFS i MapReduce

  • Zarządzanie plikami w HDFS
  • Tworzenie i uruchamianie podstawowych zadań MapReduce

Podstawy Apache Hive i Apache Pig

  • Wprowadzenie do Hive: struktura tabel, zapytania SQL
  • Analiza struktury plików pod Hive
  • Wprowadzenie do Pig: skrypty Pig Latin

Warsztat: Przetwarzanie danych z użyciem MapReduce

  • Implementacja prostego zadania MapReduce
  • Analiza wyników i optymalizacja zadania

Dzień 2: Zaawansowane techniki i praktyczne zastosowania

 

Zaawansowane przetwarzanie danych

  • Pisanie zaawansowanych zapytań Hive
  • Tworzenie skomplikowanych skryptów Pig

Optymalizacja i tunning wydajności

  • Techniki optymalizacji zadań MapReduce
  • Zarządzanie zasobami w klastrze Hadoop

Warsztat: Analiza danych z użyciem Hive i Pig

  • Implementacja zapytań Hive na rzeczywistych zbiorach danych
  • Tworzenie skryptów Pig do przetwarzania danych

Deployowanie i zarządzanie klastrami Hadoop

  • Przygotowanie i wdrażanie aplikacji Hadoop
  • Monitorowanie i zarządzanie klastrami Hadoop w środowisku produkcyjnym

Optymalizacja kosztowa – czyli jak kontrolować i optymalizować koszty wynikające z hurtowni Redshift.

Pobierz program

Pobierz szczegółowy program w PDF, żeby dowiedzieć się więcej o godzinach i tematach zajęć.

Skontaktuj sie z nami

zorganizujemy dla Ciebie szkolenie dopasowane do Twoich potrzeb

Przemysław Wołosz

Key Account Manager

przemyslaw.wolosz@infoShareAcademy.com

    Administratorem danych osobowych jest InfoShare Academy Sp. z o.o. z siedzibą w Gdańsku, al. Grunwaldzka 427B, 80-309 Gdańsk, KRS: 0000531749, NIP: 5842742121. Dane osobowe przetwarzane są zgodnie z klauzulą informacyjną.