Szkolenie Scikit-Learn

Poziom

Średniozaawansowany

Czas

16h / 2 dni

Termin

Indywidualnie

Cena

Indywidualnie

Szkolenie Scikit-Learn

Szkolenie Scikit-Learn to intensywny, dwudniowy kurs, w którym 80% czasu poświęcone jest praktycznym warsztatom, a 20% teorii. Kurs ma na celu przekazanie solidnych podstaw teoretycznych oraz praktycznych umiejętności w zakresie korzystania z Scikit-Learn, popularnej biblioteki do uczenia maszynowego w Pythonie. Uczestnicy będą pracować z rzeczywistymi danymi, przygotowywać dane, budować i trenować modele oraz dowiedzą się, jak zastosować zdobytą wiedzę w swoich projektach.

Dla kogo jest to szkolenie?
  • logo infoshare Programistów i inżynierów danych, którzy chcą poszerzyć swoje umiejętności o Scikit-Learn
  • logo infoshare Analityków danych pragnących zastosować Scikit-Learn w swoich projektach
  • logo infoshare Osób pracujących z danymi, które chcą uporządkować praktyczny workflow modelowania, walidacji i porównywania modeli w Pythonie
Wymagane umiejętności technologiczne:
  • logo infoshare Znajomość podstaw programowania w Pythonie
  • logo infoshare Podstawowa wiedza z zakresu uczenia maszynowego
  • logo infoshare Umiejętność pracy w środowisku Jupyter Notebook

Czego nauczysz się na tym szkoleniu?

  • Jak zainstalować i skonfigurować Scikit-Learn w swoim środowisku pracy oraz utrzymać powtarzalność uruchomień (wersje, zależności)
  • Jak budować, trenować i porównywać modele uczenia maszynowego w Scikit-Learn z użyciem pipeline’ów, walidacji i właściwych metryk
  • Jak stosować modele drzewiaste i zespołowe oraz wykonywać dostrajanie hiperparametrów w kontrolowany sposób (CV, search)
  • Jak przygotować model Scikit-Learn do uruchomienia w scenariuszu referencyjnym (eksport, wejścia/wyjścia, testy regresji jakości) oraz rozpoznać typowe ryzyka jakości (data leakage, drift)

Program szkolenia

Dzień 1: Wprowadzenie do Scikit-Learn i podstawy uczenia maszynowego

 

 

Wprowadzenie do Scikit-Learn

  • Historia i rozwój Scikit-Learn
  • Główne komponenty biblioteki: estimator, transformer, pipeline, metryki

 

Instalacja i konfiguracja środowiska

  • Instalacja Scikit-Learn i zależności: wersje, zgodność, powtarzalność
  • Konfiguracja środowiska pracy (Jupyter Notebook)

 

Podstawy uczenia maszynowego z Scikit-Learn

  • Operacje na zbiorach danych: wczytywanie, przetwarzanie, podział danych, analiza
  • Przygotowanie danych do modeli: imputacja, kodowanie, skalowanie, selekcja cech
  • Podstawowe modele: regresja liniowa, klasyfikacja; baseline, metryki

 

Warsztat: Pierwszy model i konsolidacja workflow

  • Model regresji liniowej: pipeline, walidacja, metryki
  • Trening i ewaluacja modelu na rzeczywistych danych: porównanie, unikanie data leakage

 

 

Dzień 2: Bardziej zaawansowane techniki i praktyczne zastosowania

 

 

Inne modele w Scikit-Learn

  • Drzewa decyzyjne i lasy losowe
  • Modele zespołowe (Boosting, Bagging, Stacking)

 

Optymalizacja i dostrajanie modeli

  • Techniki optymalizacji hiperparametrów (Grid Search, Random Search, successive halving)
  • Walidacja krzyżowa i metryki oceny modelu: porównanie, stabilność, dobór progu

 

Warsztat: Klasyfikacja i regresja

  • Dane do klasyfikacji i regresji: przetwarzanie, niezbalansowanie klas, pipeline
  • Model klasyfikacji i regresji: trening, strojenie, raport metryk

 

Wdrożenie modeli Scikit-Learn

  • Eksport modeli i artefakty: joblib/pickle, wersjonowanie, schemat wejść/wyjść
  • Uruchomienie modelu w środowisku produkcyjnym: API referencyjne, testy regresji jakości, sygnały driftu

Skontaktuj sie z nami

zorganizujemy dla Ciebie szkolenie dopasowane do Twoich potrzeb

Przemysław Wołosz

Key Account Manager

przemyslaw.wolosz@infoShareAcademy.com

    Administratorem danych osobowych jest InfoShare Academy Sp. z o.o. z siedzibą w Gdańsku, al. Grunwaldzka 427B, 80-309 Gdańsk, KRS: 0000531749, NIP: 5842742213. Dane osobowe przetwarzane są zgodnie z klauzulą informacyjną.