Kompleksowe szkolenie Machine Learning
Poziom
PodstawowyCzas
45h / 6 dniTermin
IndywidualnieCena
IndywidualnieKompleksowe szkolenie Machine Learning
Produkowanie coraz większej liczby danych przez ludzi doprowadziło do sytuacji, w której dotychczasowe narzędzia przestały wystarczać. Dodatkowo, nic nie wskazuje, by liczba ta miała zacząć maleć, co potwierdza tezę, że zapotrzebowanie na specjalistów uczenia maszynowego będzie rosło. Popularność hasła „Machine Learning” w Google Trends wskazuje na to, że popularność i zainteresowanie tematem rośnie w olbrzymim tempie.
Dla kogo jest to szkolenie?
Dla programistów, analityków danych, analityków biznesowych, marketerów, designerów i wszystkich tych, którym uczenie maszynowe znacznie ułatwia pracę
Dla osób, które potrafią wykonać podstawową analizę danych (tabele, wykresy, proste statystyki) i rozumieją pojęcia typu cecha/etykieta
Dla osób, które mają podstawowe doświadczenie w programowaniu w języku Python (typy danych, instrukcje warunkowe i pętle, funkcje) oraz gotowość do pracy w Jupyter Notebook.
Czego nauczysz się na szkoleniu?
- Wykorzystania Pythona oraz bibliotek Pandas, NumPy, scikit-learn i Matplotlib w zadaniach Machine Learning
- Przygotowania danych do modelowania: wczytywanie, czyszczenie, transformacje, kodowanie danych jakościowych, podział train/val/test
- Budowy modeli regresji i klasyfikacji oraz podstawy strojenia: walidacja krzyżowa, dobór hiperparametrów
- Oceny i porównania modeli: metryki, baseline, unikanie data leakage, interpretacja wyników
- Praktyki jakości i odpowiedzialności: reprodukowalność (seed, środowisko), podstawy interpretowalności i ograniczeń modeli, sygnały driftu i potrzeba monitorowania
Program szkolenia
Moduł 1: Wstęp do Machine Learning
- Wprowadzenie do uczenia maszynowego i zastosowania biznesowe
- Podstawowe pojęcia: cecha, etykieta, overfitting/underfitting, bias-variance, metryki
- Podział danych: trening, walidacja, test; walidacja krzyżowa; data leakage
- Rodzaje uczenia maszynowego: nadzorowane, nienadzorowane, przez wzmacnianie
- Cechy i reprezentacja danych
- Dane jakościowe i dane ilościowe: kodowanie, skale, braki danych
Moduł 2: Przetwarzanie i analiza danych
Przegląd bibliotek:
- Pandas
- NumPy
- Matplotlib
- scikit-learn
- Praca z plikami
- Czyszczenie danych (data cleaning)
- Transformacja danych (data wrangling)
Moduł 3: Jupyter Notebook
- Środowisko interaktywne
- Wirtualne środowisko Python i reprodukowalność
- Komórki, kod, Markdown
- Widgety
- IPython
Moduł 4: Modele uczenia maszynowego
- Regresja liniowa
- Regresja logistyczna
- Drzewo decyzyjne
- Random Forest
- XGBoost
- Naive Bayes
- Klasyfikacja KNN
- SVM
Moduł 5: Porównanie modeli i konsolidacja
- Dobór modeli do specyficznych zastosowań: metryki, baseline, walidacja, koszt błędów
- Porównanie różnych modeli: walidacja krzyżowa, strojenie hiperparametrów, krzywe ROC/PR, macierz pomyłek
- Ćwiczenia praktyczne: pipeline scikit-learn, interpretowalność, ograniczenia i ryzyka, sygnały driftu