Kurs Data Science + AI

Program aktualizowany w 2026 r.

Certyfikat

Zdalnie z trenerem na żywo

Projekt indywidualny

Dostęp do nagrań przez 6 mc-y

Termin12.09.2026 – 20.12.2026sprawdź liczbę godzin »

Kiedysoboty i niedziele (15:00-19:00)

Cena (brutto)

6 500 zł

7 900 zł

Najniższa cena z 30 dni: 6 500 zł

Raty PayU 0%

Formy finansowania sprawdź »

Zgłoś się Zobacz program

Dla kogo jest kurs Data Science + AI?

Jeśli pracujesz z danymi i chcesz wejść poziom wyżej — od raportowania i analizy do budowy modeli Machine Learning, pracy z GenAI oraz podstaw MLOps — ten kurs jest dla Ciebie. Nauczysz się praktycznego workflow Data Science: od pozyskania i przygotowania danych, przez tworzenie modeli ML, aż po ich wdrożenie, monitoring i przekładanie wyników na decyzje biznesowe.

Nie musisz znać Pythona ani SQL przed startem, ale kurs zakłada gotowość do pracy z kodem, notebookami i narzędziami AI. Podstawy techniczne będą wprowadzane w praktyce — dokładnie wtedy, gdy będą potrzebne do rozwiązania konkretnego problemu Data Science lub Machine Learning.

Podstawowe wymagania:
– sprawna obsługa komputera i swobodne poruszanie się w środowisku cyfrowym,
– podstawowa znajomość Excela, Google Sheets lub pracy z danymi tabelarycznymi,
– rozumienie podstawowej struktury danych: kolumn, wierszy, nagłówków i typów danych,
– zdolność analitycznego i logicznego myślenia,
– gotowość do pracy z kodem w notebookach, nawet bez wcześniejszego doświadczenia programistycznego,
– gotowość do korzystania z narzędzi AI jako wsparcia nauki i pracy z danymi,
– znajomość języka angielskiego pozwalająca korzystać z dokumentacji, komunikatów błędów i narzędzi technologicznych.

Ten kurs jest dla Ciebie, jeśli jesteś:

Analitykiem danych lub BI Specialist

Osobą po kursie analizy danych

Specjalistą biznesowym pracującym z danymi

Osobą techniczną, która chce wejść w Data Science i ML

Co dostaniesz w ramach kursu?

80 godzin zajęć z trenerem na żywo

Projekt kursowy: AI-powered Data Science Case Study

Materiały i notebooki do pracy po kursie

Pracę z AI na każdym etapie kursu

Dostęp do nagrań zajęć

Certyfikat ukończenia kursu

Co będziesz potrafił(a) zrobić po kursie?

pozyskiwać dane z plików, API i prostych źródeł webowych

przygotowywać dane do modeli ML z użyciem Pythona i SQL

czyścić dane, analizować ich jakość i rozpoznawać problemy wpływające na model

przeprowadzać EDA pod tworzenie modelu, a nie tylko pod raportowanie

tworzyć cechy do modeli z wykorzystaniem Feature Engineering i AI

budować modele regresji, klasyfikacji, klasteryzacji, drzew decyzyjnych, Random Forest i XGBoost

rozumieć podstawy działania sieci neuronowych: gradient, funkcje aktywacyjne i propagację wsteczną

dobierać metryki, walidować modele i unikać typowych błędów ewaluacji

optymalizować modele oraz świadomie korzystać z AutoML

interpretować wyniki modeli z pomocą Explainable AI

wykorzystywać LLM, RAG i Hugging Face w pracy Data Scientisty

wdrożyć prosty model ML jako API

monitorować modele, rozumieć data drift i model drift

przekładać wyniki modeli na rekomendacje i decyzje biznesowe

korzystać z AI jako asystenta kodowania, debugowania, analizy i dokumentacji

Projekt kursowy: AI-powered Data Science Case Study

W trakcie kursu będziesz rozwijać własny projekt Data Science, przechodząc przez pełny workflow: od wyboru problemu i przygotowania danych, przez budowę modeli ML, aż po monitoring i rekomendacje biznesowe. Projekt będzie realizowany etapami między zajęciami, dzięki czemu po kolejnych modułach będziesz stopniowo dokładać konkretne artefakty: notebooki, modele, raporty, komponent GenAI oraz podsumowanie biznesowe.

Milestone 1: Mapa projektu Data Science – opis projektu zawierający problem biznesowy, wybrany dataset, cel analizy lub modelowania oraz wstępnie określoną zmienną targetową albo kierunek segmentacji.

Milestone 2: Pierwszy dataset gotowy do pracy – notebook z załadowanymi danymi, opisem źródła danych, podstawowym podglądem tabeli oraz listą najważniejszych problemów do sprawdzenia.

Milestone 3: Raport jakości danych i EDA – notebook z oczyszczonym datasetem, podstawowymi wizualizacjami, analizą braków, duplikatów, rozkładów oraz pierwszymi wnioskami pod tworzenie modelu.

Milestone 4: Dataset ML gotowy do pracy – gotowy dataset z utworzonymi cechami, opisem wykonanych transformacji oraz uzasadnieniem, które cechy mogą być przydatne dla modelu.

Milestone 5: Pierwszy działający model ML – działający model regresji, klasyfikacji albo klasteryzacji wraz z podstawowymi metrykami, interpretacją wyniku i opisem ograniczeń.

Milestone 6: Ranking modeli i wybór najlepszego podejścia – tabela porównująca kilka podejść, opis sposobu walidacji oraz decyzja, który model lub wariant jest najlepszym punktem wyjścia do dalszej pracy.

Milestone 7: Ulepszony model z warstwą GenAI – ulepszony model z interpretacją najważniejszych cech oraz prosty komponent GenAI, LLM, RAG lub Hugging Face wspierający analizę, opis wyników albo pracę ze źródłami.

Milestone 8: Rekomendacja biznesowa i plan działania z modelem – podsumowanie projektu, tj. checklista monitoringu modelu, najważniejsze ryzyka, ograniczenia oraz rekomendacje biznesowe wynikające z analizy i działania modelu.

Zobacz program kursu Data Science + AI

Rozwiń wszystkie

Moduł 1: Start pracy z AI-powered Data Science

omówienie workflow Data Science: dane, model, ewaluacja, wdrożenie, monitoring i decyzje biznesowe;
wprowadzenie do pracy w VS Code, notebookach Jupyter i repozytorium kursowym;
zasady wykorzystywania AI jako wsparcia w kodowaniu, analizie, debugowaniu i dokumentacji;
omówienie ryzyk pracy z AI: halucynacje, dane poufne, brak weryfikacji i błędne sugestie;
pierwszy prosty przykład pracy z danymi i modelem Machine Learning;
przygotowanie do pracy w formule ML-first, gdzie podstawy techniczne poznajesz w kontekście konkretnych zadań.

Moduł 2: Pozyskiwanie danych do modeli ML: pliki, API i web scraping

praca z plikami CSV i Excel jako podstawowymi źródłami danych;
pobieranie danych z prostego API i zapisanie ich do struktury tabelarycznej;
podstawy web scrapingu jako uzupełniającego sposobu pozyskiwania danych;
ocena jakości, kompletności i przydatności danych do modelowania;
użycie AI do zrozumienia struktury danych i wygenerowania pierwszych fragmentów kodu;
omówienie ograniczeń prawnych, technicznych i jakościowych przy pozyskiwaniu danych.

Moduł 3: AI-powered workflow ML end-to-end

przełożenie prostego problemu biznesowego na problem Machine Learning;
wybór zmiennej targetowej i podstawowych cech modelu;
przygotowanie danych do pierwszego eksperymentu ML;
trenowanie modelu, wykonanie predykcji i podstawową ocenę jakości;
użycie AI do wyjaśniania kodu, debugowania i interpretacji wyników;
przygotowanie krótkiego opisu modelu, jego ograniczeń i potencjalnego zastosowania.

Moduł 4: SQL pod przygotowanie datasetu ML

podstawy SQL: SELECT, WHERE, JOIN, GROUP BY i agregacje;
tworzenie datasetu z kilku tabel;
budowanie cech modelu na podstawie agregacji, np. liczby transakcji lub średniej wartości zamówienia;
rozpoznawanie błędów w zapytaniach, takich jak duplikaty, złe joiny i niepoprawne agregacje;
omówienie ryzyka data leakage przy tworzeniu datasetu z danych historycznych;
użycie AI do tłumaczenia, poprawiania i weryfikowania zapytań SQL.

Moduł 5: Data Cleaning pod modele Machine Learning

identyfikacja braków danych, duplikatów, błędnych typów i niespójnych wartości;
obsługa wartości odstających oraz ocenę ich wpływu na model;
porządkowanie kategorii, dat, wartości liczbowych i danych tekstowych;
dokumentowanie decyzji cleaningowych i ich konsekwencji dla modelowania;
wykorzystanie AI do proponowania reguł czyszczenia danych;
krytyczna weryfikacja sugestii AI, aby nie usuwać informacji istotnych dla modelu.

Moduł 6: EDA pod tworzenie modelu

analiza targetu i rozkładu zmiennej przewidywanej;
badanie zależności między cechami a targetem;
praca z korelacjami, rozkładami, segmentami i podstawowymi wizualizacjami;
rozpoznawanie sygnałów, które mogą poprawić model lub wprowadzić go w błąd;
identyfikacja potencjalnego data leakage już na etapie eksploracji danych;
użycie AI do generowania pytań analitycznych i interpretowania wyników EDA.

Moduł 7: Feature Engineering z AI

tworzenie cech liczbowych, kategorycznych, tekstowych i czasowych;
encoding, scaling i podstawowe transformacje danych;
tworzenie cech z agregacji historycznych i zachowań użytkowników;
ocena przydatności cech w kontekście konkretnego problemu ML;
wykorzystanie AI do generowania propozycji nowych cech;
wykrywanie cech ryzykownych, nadmiarowych lub powodujących data leakage.

Moduł 8: Statystyka praktyczna dla Machine Learning

średnia, mediana, wariancja, odchylenie standardowe i podstawowe rozkłady;
interpretacja korelacji i omówienie jej ograniczeń;
intuicyjne wprowadzenie do testowania hipotez i istotności statystycznej;
wykorzystanie statystyki do oceny danych, cech i wyników modelu;
przykłady błędnych interpretacji wyników statystycznych;
użycie AI do tłumaczenia pojęć statystycznych prostym językiem.

Moduł 9: Regresja i klasyfikacja jako modele bazowe

różnica między regresją a klasyfikacją;
regresja liniowa jako model bazowy dla predykcji wartości liczbowych;
regresja logistyczna jako model bazowy dla problemów klasyfikacyjnych;
podstawowe metryki regresji i klasyfikacji;
interpretacja błędów modelu i ograniczeń modeli bazowych;
użycie AI do wyjaśniania różnic między typami problemów i wynikami modeli.

Moduł 10: Klasteryzacja i segmentacja danych

wprowadzenie do uczenia nienadzorowanego;
K-means jako podstawowy algorytm klasteryzacji;
przygotowanie danych do segmentacji, w tym scaling i dobór cech;
ocena jakości klastrów i interpretację ich sensu biznesowego;
przykłady segmentacji klientów, produktów lub zachowań;
użycie AI do opisu segmentów i nadawania im interpretowalnych nazw.

Moduł 11: Drzewa decyzyjne i Random Forest

intuicja działania drzewa decyzyjnego;
omówienie podziałów, głębokości drzewa i kryteriów decyzyjnych;
overfitting w modelach drzewiastych i sposoby jego ograniczania;
Random Forest jako model zespołowy;
porównanie modeli liniowych, drzew i lasów losowych;
użycie AI do interpretacji decyzji modelu i analizy błędów.

Moduł 12: Gradient Boosting i XGBoost w praktyce

intuicja działania boostingu i uczenia kolejnych modeli na błędach poprzednich;
Gradient Boosting jako podejście do budowania silniejszych modeli;
praktyczne użycie XGBoost na danych tabelarycznych;
porównanie XGBoost z Random Forest i modelami bazowymi;
podstawowe parametry wpływające na jakość i stabilność modelu;
użycie AI do planowania eksperymentów i interpretowania różnic między modelami.

Moduł 13: Sieci neuronowe: intuicja, gradient i pierwszy model

wyjaśnienie pojęć: neuron, warstwy, wagi i funkcje aktywacyjne;
funkcja straty i proces minimalizacji błędu;
wyjaśnienie gradientu i propagacji wstecznej na poziomie koncepcyjnym;
budowa prostego modelu sieci neuronowej na danych tabelarycznych;
omówienie znaczenia skalowania danych i doboru parametrów;
połączenie podstaw sieci neuronowych ze współczesnymi modelami GenAI.

Moduł 14: Walidacja i porównywanie modeli ML

porównywanie różnych modeli na tych samych danych;
cross-validation i ocenę stabilności wyników;
train/test split, validation split i typowe błędy podziału danych;
identyfikacja data leakage i zbyt optymistycznych wyników;
ocena modeli nadzorowanych i nienadzorowanych w odpowiednim kontekście;
użycie AI jako reviewera procesu walidacji i interpretacji wyników.

Moduł 15: Optymalizacja modeli, AutoML i wybór najlepszego podejścia

overfitting, underfitting i kontrolę złożoności modelu;
dobór hiperparametrów z użyciem GridSearch i RandomizedSearch;
optymalizacja modeli klasycznych, boostingowych i klasteryzacyjnych;
AutoML jako wsparcie eksperymentowania i benchmarkowania;
porównanie modelu prostego, zaawansowanego, AutoML i segmentacji;
użycie AI do planowania eksperymentów i analizy wyników optymalizacji.

Moduł 16: Explainable AI i ryzyka modeli

feature importance i interpretację wpływu cech na wynik modelu;
praktyczne użycie metod Explainable AI, takich jak SHAP lub permutation importance;
identyfikacja biasu, ograniczeń danych i ryzyk błędnych decyzji;
omówienie fairness i odpowiedzialnego wykorzystania modeli;
przygotowanie model card jako dokumentacji działania i ograniczeń modelu;
użycie AI do opisu ryzyk, ograniczeń i wniosków z interpretacji modelu.

Moduł 17: Time Series w praktyce

różnice między danymi czasowymi a klasycznymi danymi tabelarycznymi;
trend, sezonowość, zmienność i podstawowe wzorce w czasie;
przygotowanie danych do prostej prognozy;
walidacja czasowa zamiast losowego podziału train/test;
przykład prognozy sprzedaży, popytu, ruchu lub aktywności;
użycie AI do interpretacji trendów, anomalii i ryzyk prognozowania.

Moduł 18: LLM, RAG i Hugging Face w pracy Data Scientisty

rola LLM w kodowaniu, analizie, dokumentacji i interpretacji wyników;
praca z LLM przez interfejs chatowy i API;
podstawy RAG: retrieval, embeddingi, wyszukiwanie semantyczne i odpowiedzi na podstawie źródeł;
wykorzystanie Hugging Face jako źródła modeli, datasetów i narzędzi;
omówienie ograniczeń GenAI: halucynacje, prompt injection, prywatność i jakość źródeł;
praktyczne przykłady wykorzystania LLM i RAG w pracy z danymi i dokumentacją modeli.

Moduł 19: Deployment modelu ML jako API

zapis i ponowne wykorzystanie wytrenowanego modelu;
przygotowanie prostego pipeline’u predykcyjnego;
refaktoryzacja kodu z notebooka do plików Python;
budowa prostego API do predykcji z użyciem FastAPI;
walidacja danych wejściowych i testowanie endpointu;
użycie AI do porządkowania kodu, debugowania API i tworzenia dokumentacji technicznej.

Moduł 20: Monitoring, MLOps basics i decyzje biznesowe

podstawy MLOps: eksperymenty, wersje, metryki i artefakty;
wykorzystanie MLflow do śledzenia eksperymentów i wyników modeli;
data drift, model drift i spadek jakości predykcji;
checklista monitoringu modelu po wdrożeniu;
przygotowanie rekomendacji biznesowej na podstawie wyników modelu;
omówienie, jak komunikować ograniczenia, ryzyka i wartość modelu interesariuszom.

Ile czasu zajmie Ci kurs?

Technologie i narzędzia, które opanujesz na kursie Data Science + AI

Visual Studio Code

Jupyter Notebook

Anaconda

Git

GitHub

Python

Pandas

NumPy

Matplotib

Seaborn

Plotly

scikit-learn

SQL

xgBoost

ChatGPT

DuckDB

Hugging Face

requests

BeautifulSoup

AutoML

SHAP

LLM API

RAG

MLflow

Opinie kursantów

Przeszkoliliśmy ponad 7 500 osób

Joanna Garwacka
Data Science

Kurs był świetny, jestem bardzo zadowolona. Nawet opcja nauki zdalnej (której się obawiałam) finalnie okazała się bardzo wygodna. Zakres merytoryczny bardzo obszerny, zajęcia prowadzone ciekawie, trenerzy cały czas służyli pomocą. Kurs otworzył mi oczy i też bardzo zainteresował tematyką Data Science (oraz programowaniem w SQL i Pythonie).
Dagmara Bromirska
Data Science

Uważam, że kurs był zdecydowanie wartościowy, acz intensywny. Bardzo mi odpowiadała możliwość sprawdzenia świeżo zdobytej wiedzy podczas dużej liczby zajęć praktycznych i projektów. Wzbogaciłam wachlarz swoich umiejętności technicznych i mam jeszcze więcej chęci do działania!
Kacper Jędrczak
Data Science

Kurs spełnił oczekiwania w pełni, wartościowych aspektów było bardzo dużo: zaczynając od solidnych podstaw z sqla, przez pythona, bardzo fajnie opracowaną statystykę, a na machine learningu i dość rozbudowanym deep learningu kończąc. Dużym plusem było przygotowanie merytoryczne i postawa trenerów – naprawdę przyjemnie się z Wami pracowało. Generalnie polecam, niezależnie od tego czy nie masz wiedzy w tym temacie w ogóle, czy też masz już podstawy i potrzebujesz je uporządkować i rozwinąć.
Bartosz Stasiak
Data Science

Kurs spełnił moje oczekiwania. Pozwolił rozwinąć zainteresowania i potwierdził, że warto zdobyć nieco umiejętności IT, bo ich potencjał jest ogromny. Dodatkowo kurs odnowił we mnie głód wiedzy i poznawania czegoś nowego 🙂 Jako dużą zaletę kursu w InfoShare traktuję fakt, że zajęcia prowadzili różni trenerzy. Uważam, że takie podejście pozwala docenić różnorodność metod nauczania, a także lepiej ocenić – i docenić – jakość poszczególnych trenerów. Osobiście, cieszę się, że zajęcia prowadzili profesjonaliści, którzy znają realia pracy z poznawanymi narzędziami i wiedzą jakie są realne wyzwania i problemy pojawiające się w pracy na stanowisku, do którego kurs przygotowuje. Polecam.

Najczęściej wybierane formy finansowania

Raty w Akademii

Płatność jednorazowa

Pozostałe formy płatności

Zapytaj o kurs

Agnieszka Frąckiewicz

Customer Success Coordinator

agnieszka.frackiewicz@infoshareacademy.com
(+48) 530 100 686

Najczęstsze pytania i odpowiedzi

Jak zapisać się na kurs?

Aby zapisać się na kurs możesz wypełnić formularz, wysłać maila bezpośrednio do opiekunki lub zadzwonić. W przypadku zgłoszenia się przez formularz otrzymasz od razu maila ze szczegółowym programem kursu oraz informacjami o kolejnych krokach.

W jakich godzinach odbywają się zajęcia?

Zajęcia zależnie od edycji odbywają się w soboty i niedziele w godz. 8:00 – 12:00 lub 15:00 – 19:00.

Czy muszę znać Pythona lub SQL przed kursem?

Nie wymagamy wcześniejszej znajomości Pythona ani SQL, ale kurs zakłada gotowość do pracy z kodem. Podstawy składni będą wprowadzane praktycznie, w kontekście zadań Data Science i Machine Learning, a narzędzia AI będą pomagały w wyjaśnianiu kodu, debugowaniu i utrwalaniu materiału.

Czy to jest kurs od zera?

To kurs dla osób, które chcą rozwijać się w Data Science i Machine Learning, ale nie jest klasycznym kursem programowania od zera. Startujemy od podstaw potrzebnych do pracy z danymi, jednak szybko przechodzimy do praktycznych problemów ML.

Czym ten kurs różni się od klasycznego kursu Data Science?

Kurs jest bardziej skoncentrowany na praktycznym workflow: pozyskanie danych, przygotowanie datasetu, budowa modeli, GenAI, RAG, deployment, monitoring i decyzje biznesowe. AI nie jest dodatkiem na końcu, ale wsparciem używanym na każdym etapie pracy.

Czy kurs przygotowuje do pracy jako Data Scientist?

Kurs daje realny upskill w stronę Data Science i Machine Learning, ale nie obiecuje automatycznej zmiany branży ani pełnej samodzielności eksperckiej po 80 godzinach. Po kursie będziesz rozumieć praktyczny workflow Data Science i umieć budować, oceniać oraz wdrażać proste modele ML z pomocą AI.

Jak AI będzie wykorzystywane na kursie?

AI będzie pełnić rolę asystenta nauki i pracy: pomoże wyjaśniać kod, debugować błędy, pisać zapytania SQL, generować pomysły na cechy, interpretować metryki, dokumentować modele i przygotowywać rekomendacje biznesowe. Kurs uczy też krytycznej weryfikacji odpowiedzi AI.

Czy na kursie będziemy budować aplikacje AI, RAG albo agentów?

Kurs obejmuje LLM, RAG i Hugging Face w kontekście pracy Data Scientisty, ale nie jest pełnym kursem AI/LLM Engineeringu. Celem jest pokazanie, jak GenAI wspiera workflow Data Science i Machine Learning.

Czy na kursie będzie Deep Learning?

Na kursie pojawią się podstawy sieci neuronowych: neuron, wagi, funkcje aktywacyjne, gradient, propagacja wsteczna i prosty model. Nie jest to jednak rozbudowany kurs Deep Learningu obejmujący szczegółowo CNN, RNN czy zaawansowane architektury transformerowe.

Czy po kursie otrzymam certyfikat?

Tak, po ukończeniu kursu otrzymasz certyfikat potwierdzający zdobycie wiedzy i praktycznych umiejętności z zakresu Python, SQL, EDA, Feature Engineering, statystyki, Machine Learning, GenAI, LLM, RAG, deploymentu modeli, MLOps i monitoringu.

Czy zajęcia są praktyczne?

Tak. Kurs ma formę warsztatową — większość pracy odbywa się w notebookach, na danych, modelach i ćwiczeniach. Teoria jest wprowadzana w krótkich fragmentach, a następnie od razu wykorzystywana w praktyce.

Czy będę pracować nad jednym projektem końcowym?

Kurs nie opiera się na jednym dużym projekcie końcowym. W trakcie zajęć tworzysz zestaw praktycznych artefaktów: notebooki, modele, zapytania SQL, pipeline’y przygotowania danych, integrację z LLM/RAG, API do predykcji i elementy monitoringu.