Kompleksowe szkolenie Machine Learning

Poziom

Podstawowy

Czas

45h / 6 dni

Termin

Indywidualnie

Cena

Indywidualnie

Kompleksowe szkolenie Machine Learning

Pro­du­ko­wa­nie coraz więk­szej liczby danych przez ludzi dopro­wa­dziło do sytu­acji, w któ­rej dotych­cza­sowe narzę­dzia prze­stały wystar­czać. Dodat­kowo, nic nie wska­zuje, by liczba ta miała zacząć maleć, co potwier­dza tezę, że zapo­trze­bo­wa­nie na specjalistów uczenia maszynowego będzie rosło. Popu­lar­ność hasła „Machine Learning” w Google Trends wska­zuje na to, że popu­lar­ność i zain­te­re­so­wa­nie tematem rośnie w olbrzy­mim tem­pie.

Dla kogo jest to szkolenie?
  • logo infoshare Dla programistów, analityków danych, analityków biznesowych, marketerów, designerów i wszystkich tych, którym uczenie maszynowe znacznie ułatwia pracę
  • logo infoshare Dla osób, które potrafią wykonać podstawową analizę danych (tabele, wykresy, proste statystyki) i rozumieją pojęcia typu cecha/etykieta
  • logo infoshare Dla osób, które mają podstawowe doświadczenie w programowaniu w języku Python (typy danych, instrukcje warunkowe i pętle, funkcje) oraz gotowość do pracy w Jupyter Notebook.

Czego nauczysz się na szkoleniu?

  • Wykorzystania Pythona oraz bibliotek Pandas, NumPy, scikit-learn i Matplotlib w zadaniach Machine Learning
  • Przygotowania danych do modelowania: wczytywanie, czyszczenie, transformacje, kodowanie danych jakościowych, podział train/val/test
  • Budowy modeli regresji i klasyfikacji oraz podstawy strojenia: walidacja krzyżowa, dobór hiperparametrów
  • Oceny i porównania modeli: metryki, baseline, unikanie data leakage, interpretacja wyników
  • Praktyki jakości i odpowiedzialności: reprodukowalność (seed, środowisko), podstawy interpretowalności i ograniczeń modeli, sygnały driftu i potrzeba monitorowania

Program szkolenia

Moduł 1: Wstęp do Machine Learning

 

  • Wprowadzenie do uczenia maszynowego i zastosowania biznesowe
  • Podstawowe pojęcia: cecha, etykieta, overfitting/underfitting, bias-variance, metryki
  • Podział danych: trening, walidacja, test; walidacja krzyżowa; data leakage
  • Rodzaje uczenia maszynowego: nadzorowane, nienadzorowane, przez wzmacnianie
  • Cechy i reprezentacja danych
  • Dane jakościowe i dane ilościowe: kodowanie, skale, braki danych

 

Moduł 2: Przetwarzanie i analiza danych

 

Przegląd bibliotek:

  • Pandas
  • NumPy
  • Matplotlib
  • scikit-learn
  • Praca z plikami
  • Czyszczenie danych (data cleaning)
  • Transformacja danych (data wrangling)

 

Moduł 3: Jupyter Notebook

 

  • Środowisko interaktywne
  • Wirtualne środowisko Python i reprodukowalność
  • Komórki, kod, Markdown
  • Widgety
  • IPython

 

Moduł 4: Modele uczenia maszynowego

 

  • Regresja liniowa
  • Regresja logistyczna
  • Drzewo decyzyjne
  • Random Forest
  • XGBoost
  • Naive Bayes
  • Klasyfikacja KNN
  • SVM

 

Moduł 5: Porównanie modeli i konsolidacja

 

  • Dobór modeli do specyficznych zastosowań: metryki, baseline, walidacja, koszt błędów
  • Porównanie różnych modeli: walidacja krzyżowa, strojenie hiperparametrów, krzywe ROC/PR, macierz pomyłek
  • Ćwiczenia praktyczne: pipeline scikit-learn, interpretowalność, ograniczenia i ryzyka, sygnały driftu

Skontaktuj sie z nami

zorganizujemy dla Ciebie szkolenie dopasowane do Twoich potrzeb

Przemysław Wołosz

Key Account Manager

przemyslaw.wolosz@infoShareAcademy.com

    Administratorem danych osobowych jest InfoShare Academy Sp. z o.o. z siedzibą w Gdańsku, al. Grunwaldzka 427B, 80-309 Gdańsk, KRS: 0000531749, NIP: 5842742213. Dane osobowe przetwarzane są zgodnie z klauzulą informacyjną.