Kurs Data Science + AI
Program aktualizowany w 2026 r.
Dla kogo jest kurs Data Science + AI?
Jeśli pracujesz z danymi i chcesz wejść poziom wyżej — od raportowania i analizy do budowy modeli Machine Learning, pracy z GenAI oraz podstaw MLOps — ten kurs jest dla Ciebie. Nauczysz się praktycznego workflow Data Science: od pozyskania i przygotowania danych, przez tworzenie modeli ML, aż po ich wdrożenie, monitoring i przekładanie wyników na decyzje biznesowe.
Nie musisz znać Pythona ani SQL przed startem, ale kurs zakłada gotowość do pracy z kodem, notebookami i narzędziami AI. Podstawy techniczne będą wprowadzane w praktyce — dokładnie wtedy, gdy będą potrzebne do rozwiązania konkretnego problemu Data Science lub Machine Learning.
Podstawowe wymagania:
– sprawna obsługa komputera i swobodne poruszanie się w środowisku cyfrowym,
– podstawowa znajomość Excela, Google Sheets lub pracy z danymi tabelarycznymi,
– rozumienie podstawowej struktury danych: kolumn, wierszy, nagłówków i typów danych,
– zdolność analitycznego i logicznego myślenia,
– gotowość do pracy z kodem w notebookach, nawet bez wcześniejszego doświadczenia programistycznego,
– gotowość do korzystania z narzędzi AI jako wsparcia nauki i pracy z danymi,
– znajomość języka angielskiego pozwalająca korzystać z dokumentacji, komunikatów błędów i narzędzi technologicznych.
Ten kurs jest dla Ciebie, jeśli jesteś:
Co dostaniesz w ramach kursu?
Co będziesz potrafił(a) zrobić po kursie?
Projekt kursowy: AI-powered Data Science Case Study
W trakcie kursu będziesz rozwijać własny projekt Data Science, przechodząc przez pełny workflow: od wyboru problemu i przygotowania danych, przez budowę modeli ML, aż po monitoring i rekomendacje biznesowe. Projekt będzie realizowany etapami między zajęciami, dzięki czemu po kolejnych modułach będziesz stopniowo dokładać konkretne artefakty: notebooki, modele, raporty, komponent GenAI oraz podsumowanie biznesowe.
Zobacz program kursu Data Science + AI
Rozwiń wszystkie
- omówienie workflow Data Science: dane, model, ewaluacja, wdrożenie, monitoring i decyzje biznesowe;
- wprowadzenie do pracy w VS Code, notebookach Jupyter i repozytorium kursowym;
- zasady wykorzystywania AI jako wsparcia w kodowaniu, analizie, debugowaniu i dokumentacji;
- omówienie ryzyk pracy z AI: halucynacje, dane poufne, brak weryfikacji i błędne sugestie;
- pierwszy prosty przykład pracy z danymi i modelem Machine Learning;
- przygotowanie do pracy w formule ML-first, gdzie podstawy techniczne poznajesz w kontekście konkretnych zadań.
- praca z plikami CSV i Excel jako podstawowymi źródłami danych;
- pobieranie danych z prostego API i zapisanie ich do struktury tabelarycznej;
- podstawy web scrapingu jako uzupełniającego sposobu pozyskiwania danych;
- ocena jakości, kompletności i przydatności danych do modelowania;
- użycie AI do zrozumienia struktury danych i wygenerowania pierwszych fragmentów kodu;
- omówienie ograniczeń prawnych, technicznych i jakościowych przy pozyskiwaniu danych.
- przełożenie prostego problemu biznesowego na problem Machine Learning;
- wybór zmiennej targetowej i podstawowych cech modelu;
- przygotowanie danych do pierwszego eksperymentu ML;
- trenowanie modelu, wykonanie predykcji i podstawową ocenę jakości;
- użycie AI do wyjaśniania kodu, debugowania i interpretacji wyników;
- przygotowanie krótkiego opisu modelu, jego ograniczeń i potencjalnego zastosowania.
- podstawy SQL: SELECT, WHERE, JOIN, GROUP BY i agregacje;
- tworzenie datasetu z kilku tabel;
- budowanie cech modelu na podstawie agregacji, np. liczby transakcji lub średniej wartości zamówienia;
- rozpoznawanie błędów w zapytaniach, takich jak duplikaty, złe joiny i niepoprawne agregacje;
- omówienie ryzyka data leakage przy tworzeniu datasetu z danych historycznych;
- użycie AI do tłumaczenia, poprawiania i weryfikowania zapytań SQL.
- identyfikacja braków danych, duplikatów, błędnych typów i niespójnych wartości;
- obsługa wartości odstających oraz ocenę ich wpływu na model;
- porządkowanie kategorii, dat, wartości liczbowych i danych tekstowych;
- dokumentowanie decyzji cleaningowych i ich konsekwencji dla modelowania;
- wykorzystanie AI do proponowania reguł czyszczenia danych;
- krytyczna weryfikacja sugestii AI, aby nie usuwać informacji istotnych dla modelu.
- analiza targetu i rozkładu zmiennej przewidywanej;
- badanie zależności między cechami a targetem;
- praca z korelacjami, rozkładami, segmentami i podstawowymi wizualizacjami;
- rozpoznawanie sygnałów, które mogą poprawić model lub wprowadzić go w błąd;
- identyfikacja potencjalnego data leakage już na etapie eksploracji danych;
- użycie AI do generowania pytań analitycznych i interpretowania wyników EDA.
- tworzenie cech liczbowych, kategorycznych, tekstowych i czasowych;
- encoding, scaling i podstawowe transformacje danych;
- tworzenie cech z agregacji historycznych i zachowań użytkowników;
- ocena przydatności cech w kontekście konkretnego problemu ML;
- wykorzystanie AI do generowania propozycji nowych cech;
- wykrywanie cech ryzykownych, nadmiarowych lub powodujących data leakage.
- średnia, mediana, wariancja, odchylenie standardowe i podstawowe rozkłady;
- interpretacja korelacji i omówienie jej ograniczeń;
- intuicyjne wprowadzenie do testowania hipotez i istotności statystycznej;
- wykorzystanie statystyki do oceny danych, cech i wyników modelu;
- przykłady błędnych interpretacji wyników statystycznych;
- użycie AI do tłumaczenia pojęć statystycznych prostym językiem.
- różnica między regresją a klasyfikacją;
- regresja liniowa jako model bazowy dla predykcji wartości liczbowych;
- regresja logistyczna jako model bazowy dla problemów klasyfikacyjnych;
- podstawowe metryki regresji i klasyfikacji;
- interpretacja błędów modelu i ograniczeń modeli bazowych;
- użycie AI do wyjaśniania różnic między typami problemów i wynikami modeli.
- wprowadzenie do uczenia nienadzorowanego;
- K-means jako podstawowy algorytm klasteryzacji;
- przygotowanie danych do segmentacji, w tym scaling i dobór cech;
- ocena jakości klastrów i interpretację ich sensu biznesowego;
- przykłady segmentacji klientów, produktów lub zachowań;
- użycie AI do opisu segmentów i nadawania im interpretowalnych nazw.
- intuicja działania drzewa decyzyjnego;
- omówienie podziałów, głębokości drzewa i kryteriów decyzyjnych;
- overfitting w modelach drzewiastych i sposoby jego ograniczania;
- Random Forest jako model zespołowy;
- porównanie modeli liniowych, drzew i lasów losowych;
- użycie AI do interpretacji decyzji modelu i analizy błędów.
- intuicja działania boostingu i uczenia kolejnych modeli na błędach poprzednich;
- Gradient Boosting jako podejście do budowania silniejszych modeli;
- praktyczne użycie XGBoost na danych tabelarycznych;
- porównanie XGBoost z Random Forest i modelami bazowymi;
- podstawowe parametry wpływające na jakość i stabilność modelu;
- użycie AI do planowania eksperymentów i interpretowania różnic między modelami.
- wyjaśnienie pojęć: neuron, warstwy, wagi i funkcje aktywacyjne;
- funkcja straty i proces minimalizacji błędu;
- wyjaśnienie gradientu i propagacji wstecznej na poziomie koncepcyjnym;
- budowa prostego modelu sieci neuronowej na danych tabelarycznych;
- omówienie znaczenia skalowania danych i doboru parametrów;
- połączenie podstaw sieci neuronowych ze współczesnymi modelami GenAI.
- porównywanie różnych modeli na tych samych danych;
- cross-validation i ocenę stabilności wyników;
- train/test split, validation split i typowe błędy podziału danych;
- identyfikacja data leakage i zbyt optymistycznych wyników;
- ocena modeli nadzorowanych i nienadzorowanych w odpowiednim kontekście;
- użycie AI jako reviewera procesu walidacji i interpretacji wyników.
- overfitting, underfitting i kontrolę złożoności modelu;
- dobór hiperparametrów z użyciem GridSearch i RandomizedSearch;
- optymalizacja modeli klasycznych, boostingowych i klasteryzacyjnych;
- AutoML jako wsparcie eksperymentowania i benchmarkowania;
- porównanie modelu prostego, zaawansowanego, AutoML i segmentacji;
- użycie AI do planowania eksperymentów i analizy wyników optymalizacji.
- feature importance i interpretację wpływu cech na wynik modelu;
- praktyczne użycie metod Explainable AI, takich jak SHAP lub permutation importance;
- identyfikacja biasu, ograniczeń danych i ryzyk błędnych decyzji;
- omówienie fairness i odpowiedzialnego wykorzystania modeli;
- przygotowanie model card jako dokumentacji działania i ograniczeń modelu;
- użycie AI do opisu ryzyk, ograniczeń i wniosków z interpretacji modelu.
- różnice między danymi czasowymi a klasycznymi danymi tabelarycznymi;
- trend, sezonowość, zmienność i podstawowe wzorce w czasie;
- przygotowanie danych do prostej prognozy;
- walidacja czasowa zamiast losowego podziału train/test;
- przykład prognozy sprzedaży, popytu, ruchu lub aktywności;
- użycie AI do interpretacji trendów, anomalii i ryzyk prognozowania.
- rola LLM w kodowaniu, analizie, dokumentacji i interpretacji wyników;
- praca z LLM przez interfejs chatowy i API;
- podstawy RAG: retrieval, embeddingi, wyszukiwanie semantyczne i odpowiedzi na podstawie źródeł;
- wykorzystanie Hugging Face jako źródła modeli, datasetów i narzędzi;
- omówienie ograniczeń GenAI: halucynacje, prompt injection, prywatność i jakość źródeł;
- praktyczne przykłady wykorzystania LLM i RAG w pracy z danymi i dokumentacją modeli.
- zapis i ponowne wykorzystanie wytrenowanego modelu;
- przygotowanie prostego pipeline’u predykcyjnego;
- refaktoryzacja kodu z notebooka do plików Python;
- budowa prostego API do predykcji z użyciem FastAPI;
- walidacja danych wejściowych i testowanie endpointu;
- użycie AI do porządkowania kodu, debugowania API i tworzenia dokumentacji technicznej.
- podstawy MLOps: eksperymenty, wersje, metryki i artefakty;
- wykorzystanie MLflow do śledzenia eksperymentów i wyników modeli;
- data drift, model drift i spadek jakości predykcji;
- checklista monitoringu modelu po wdrożeniu;
- przygotowanie rekomendacji biznesowej na podstawie wyników modelu;
- omówienie, jak komunikować ograniczenia, ryzyka i wartość modelu interesariuszom.
Technologie i narzędzia, które opanujesz na kursie Data Science + AI
Visual Studio Code
Jupyter Notebook
Anaconda
Git
GitHub
Python
Pandas
NumPy
Matplotib
Seaborn
Plotly
scikit-learn
SQL
xgBoost
ChatGPT
DuckDB
Hugging Face
requests
BeautifulSoup
AutoML
SHAP
LLM API
RAG
MLflow
Opinie kursantów
Przeszkoliliśmy ponad 7 500 osób
Najczęściej wybierane formy finansowania
Zapytaj o kurs
Agnieszka Frąckiewicz
Customer Success Coordinator
agnieszka.frackiewicz@infoshareacademy.com(+48) 530 100 686
Najczęstsze pytania i odpowiedzi
Aby zapisać się na kurs możesz wypełnić formularz, wysłać maila bezpośrednio do opiekunki lub zadzwonić. W przypadku zgłoszenia się przez formularz otrzymasz od razu maila ze szczegółowym programem kursu oraz informacjami o kolejnych krokach.
Zajęcia zależnie od edycji odbywają się w soboty i niedziele w godz. 8:00 – 12:00 lub 15:00 – 19:00.
Nie wymagamy wcześniejszej znajomości Pythona ani SQL, ale kurs zakłada gotowość do pracy z kodem. Podstawy składni będą wprowadzane praktycznie, w kontekście zadań Data Science i Machine Learning, a narzędzia AI będą pomagały w wyjaśnianiu kodu, debugowaniu i utrwalaniu materiału.
To kurs dla osób, które chcą rozwijać się w Data Science i Machine Learning, ale nie jest klasycznym kursem programowania od zera. Startujemy od podstaw potrzebnych do pracy z danymi, jednak szybko przechodzimy do praktycznych problemów ML.
Kurs jest bardziej skoncentrowany na praktycznym workflow: pozyskanie danych, przygotowanie datasetu, budowa modeli, GenAI, RAG, deployment, monitoring i decyzje biznesowe. AI nie jest dodatkiem na końcu, ale wsparciem używanym na każdym etapie pracy.
Kurs daje realny upskill w stronę Data Science i Machine Learning, ale nie obiecuje automatycznej zmiany branży ani pełnej samodzielności eksperckiej po 80 godzinach. Po kursie będziesz rozumieć praktyczny workflow Data Science i umieć budować, oceniać oraz wdrażać proste modele ML z pomocą AI.
AI będzie pełnić rolę asystenta nauki i pracy: pomoże wyjaśniać kod, debugować błędy, pisać zapytania SQL, generować pomysły na cechy, interpretować metryki, dokumentować modele i przygotowywać rekomendacje biznesowe. Kurs uczy też krytycznej weryfikacji odpowiedzi AI.
Kurs obejmuje LLM, RAG i Hugging Face w kontekście pracy Data Scientisty, ale nie jest pełnym kursem AI/LLM Engineeringu. Celem jest pokazanie, jak GenAI wspiera workflow Data Science i Machine Learning.
Na kursie pojawią się podstawy sieci neuronowych: neuron, wagi, funkcje aktywacyjne, gradient, propagacja wsteczna i prosty model. Nie jest to jednak rozbudowany kurs Deep Learningu obejmujący szczegółowo CNN, RNN czy zaawansowane architektury transformerowe.
Tak, po ukończeniu kursu otrzymasz certyfikat potwierdzający zdobycie wiedzy i praktycznych umiejętności z zakresu Python, SQL, EDA, Feature Engineering, statystyki, Machine Learning, GenAI, LLM, RAG, deploymentu modeli, MLOps i monitoringu.
Tak. Kurs ma formę warsztatową — większość pracy odbywa się w notebookach, na danych, modelach i ćwiczeniach. Teoria jest wprowadzana w krótkich fragmentach, a następnie od razu wykorzystywana w praktyce.
Kurs nie opiera się na jednym dużym projekcie końcowym. W trakcie zajęć tworzysz zestaw praktycznych artefaktów: notebooki, modele, zapytania SQL, pipeline’y przygotowania danych, integrację z LLM/RAG, API do predykcji i elementy monitoringu.

