Szkolenie Scikit-Learn

Poziom

Średniozaawansowany

Czas

16h / 2 dni

Termin

Indywidualnie

Cena

Indywidualnie

Szkolenie Scikit-Learn to intensywny, dwudniowy kurs, w którym 80% czasu poświęcone jest praktycznym warsztatom, a 20% teorii. Kurs ma na celu przekazanie solidnych podstaw teoretycznych oraz praktycznych umiejętności w zakresie korzystania z Scikit-Learn, popularnej biblioteki do uczenia maszynowego w Pythonie. Uczestnicy będą pracować z rzeczywistymi danymi, przygotowywać dane, budować i trenować modele oraz dowiedzą się, jak zastosować zdobytą wiedzę w swoich projektach.

Dla kogo jest to szkolenie?

Programistów i inżynierów danych, którzy chcą poszerzyć swoje umiejętności o Scikit-Learn
Analityków danych pragnących zastosować Scikit-Learn w swoich projektach
Osób pracujących z danymi, które chcą uporządkować praktyczny workflow modelowania, walidacji i porównywania modeli w Pythonie

Wymagane umiejętności technologiczne:

Znajomość podstaw programowania w Pythonie
Podstawowa wiedza z zakresu uczenia maszynowego
Umiejętność pracy w środowisku Jupyter Notebook

Czego nauczysz się na tym szkoleniu?

Jak zainstalować i skonfigurować Scikit-Learn w swoim środowisku pracy oraz utrzymać powtarzalność uruchomień (wersje, zależności)
Jak budować, trenować i porównywać modele uczenia maszynowego w Scikit-Learn z użyciem pipeline’ów, walidacji i właściwych metryk
Jak stosować modele drzewiaste i zespołowe oraz wykonywać dostrajanie hiperparametrów w kontrolowany sposób (CV, search)
Jak przygotować model Scikit-Learn do uruchomienia w scenariuszu referencyjnym (eksport, wejścia/wyjścia, testy regresji jakości) oraz rozpoznać typowe ryzyka jakości (data leakage, drift)

Program szkolenia

Dzień 1: Wprowadzenie do Scikit-Learn i podstawy uczenia maszynowego

Wprowadzenie do Scikit-Learn

Historia i rozwój Scikit-Learn
Główne komponenty biblioteki: estimator, transformer, pipeline, metryki

Instalacja i konfiguracja środowiska

Instalacja Scikit-Learn i zależności: wersje, zgodność, powtarzalność
Konfiguracja środowiska pracy (Jupyter Notebook)

Podstawy uczenia maszynowego z Scikit-Learn

Operacje na zbiorach danych: wczytywanie, przetwarzanie, podział danych, analiza
Przygotowanie danych do modeli: imputacja, kodowanie, skalowanie, selekcja cech
Podstawowe modele: regresja liniowa, klasyfikacja; baseline, metryki

Warsztat: Pierwszy model i konsolidacja workflow

Model regresji liniowej: pipeline, walidacja, metryki
Trening i ewaluacja modelu na rzeczywistych danych: porównanie, unikanie data leakage

Dzień 2: Bardziej zaawansowane techniki i praktyczne zastosowania

Inne modele w Scikit-Learn

Drzewa decyzyjne i lasy losowe
Modele zespołowe (Boosting, Bagging, Stacking)

Optymalizacja i dostrajanie modeli

Techniki optymalizacji hiperparametrów (Grid Search, Random Search, successive halving)
Walidacja krzyżowa i metryki oceny modelu: porównanie, stabilność, dobór progu

Warsztat: Klasyfikacja i regresja

Dane do klasyfikacji i regresji: przetwarzanie, niezbalansowanie klas, pipeline
Model klasyfikacji i regresji: trening, strojenie, raport metryk

Wdrożenie modeli Scikit-Learn

Eksport modeli i artefakty: joblib/pickle, wersjonowanie, schemat wejść/wyjść
Uruchomienie modelu w środowisku produkcyjnym: API referencyjne, testy regresji jakości, sygnały driftu

Skontaktuj sie z nami

zorganizujemy dla Ciebie szkolenie dopasowane do Twoich potrzeb

Przemysław Wołosz

Key Account Manager

+48 730 830 801

przemyslaw.wolosz@infoShareAcademy.com