Szkolenie Scikit-Learn
Poziom
ŚredniozaawansowanyCzas
16h / 2 dniTermin
IndywidualnieCena
IndywidualnieSzkolenie Scikit-Learn
Szkolenie Scikit-Learn to intensywny, dwudniowy kurs, w którym 80% czasu poświęcone jest praktycznym warsztatom, a 20% teorii. Kurs ma na celu przekazanie solidnych podstaw teoretycznych oraz praktycznych umiejętności w zakresie korzystania z Scikit-Learn, popularnej biblioteki do uczenia maszynowego w Pythonie. Uczestnicy będą pracować z rzeczywistymi danymi, przygotowywać dane, budować i trenować modele oraz dowiedzą się, jak zastosować zdobytą wiedzę w swoich projektach.
Dla kogo jest to szkolenie?
Programistów i inżynierów danych, którzy chcą poszerzyć swoje umiejętności o Scikit-Learn
Analityków danych pragnących zastosować Scikit-Learn w swoich projektach
Osób pracujących z danymi, które chcą uporządkować praktyczny workflow modelowania, walidacji i porównywania modeli w Pythonie
Wymagane umiejętności technologiczne:
Znajomość podstaw programowania w Pythonie
Podstawowa wiedza z zakresu uczenia maszynowego
Umiejętność pracy w środowisku Jupyter Notebook
Czego nauczysz się na tym szkoleniu?
- Jak zainstalować i skonfigurować Scikit-Learn w swoim środowisku pracy oraz utrzymać powtarzalność uruchomień (wersje, zależności)
- Jak budować, trenować i porównywać modele uczenia maszynowego w Scikit-Learn z użyciem pipeline’ów, walidacji i właściwych metryk
- Jak stosować modele drzewiaste i zespołowe oraz wykonywać dostrajanie hiperparametrów w kontrolowany sposób (CV, search)
- Jak przygotować model Scikit-Learn do uruchomienia w scenariuszu referencyjnym (eksport, wejścia/wyjścia, testy regresji jakości) oraz rozpoznać typowe ryzyka jakości (data leakage, drift)
Program szkolenia
Dzień 1: Wprowadzenie do Scikit-Learn i podstawy uczenia maszynowego
Wprowadzenie do Scikit-Learn
- Historia i rozwój Scikit-Learn
- Główne komponenty biblioteki: estimator, transformer, pipeline, metryki
Instalacja i konfiguracja środowiska
- Instalacja Scikit-Learn i zależności: wersje, zgodność, powtarzalność
- Konfiguracja środowiska pracy (Jupyter Notebook)
Podstawy uczenia maszynowego z Scikit-Learn
- Operacje na zbiorach danych: wczytywanie, przetwarzanie, podział danych, analiza
- Przygotowanie danych do modeli: imputacja, kodowanie, skalowanie, selekcja cech
- Podstawowe modele: regresja liniowa, klasyfikacja; baseline, metryki
Warsztat: Pierwszy model i konsolidacja workflow
- Model regresji liniowej: pipeline, walidacja, metryki
- Trening i ewaluacja modelu na rzeczywistych danych: porównanie, unikanie data leakage
Dzień 2: Bardziej zaawansowane techniki i praktyczne zastosowania
Inne modele w Scikit-Learn
- Drzewa decyzyjne i lasy losowe
- Modele zespołowe (Boosting, Bagging, Stacking)
Optymalizacja i dostrajanie modeli
- Techniki optymalizacji hiperparametrów (Grid Search, Random Search, successive halving)
- Walidacja krzyżowa i metryki oceny modelu: porównanie, stabilność, dobór progu
Warsztat: Klasyfikacja i regresja
- Dane do klasyfikacji i regresji: przetwarzanie, niezbalansowanie klas, pipeline
- Model klasyfikacji i regresji: trening, strojenie, raport metryk
Wdrożenie modeli Scikit-Learn
- Eksport modeli i artefakty: joblib/pickle, wersjonowanie, schemat wejść/wyjść
- Uruchomienie modelu w środowisku produkcyjnym: API referencyjne, testy regresji jakości, sygnały driftu