Szkolenie Analiza danych w Python
Poziom
ZaawansowanyCzas
16h / 2 dniTermin
IndywidualnieCena
IndywidualnieSzkolenie Analiza danych w Python
Mnogość modułów, wszechstronne wsparcie i łatwość w integracji z serwisami webowymi powoduje, że Python jest jednym z najpopularniejszych narzędzi w obszarze Data Science. Uczestnicy tego kursu będą mieli okazję poznać dwie najbardziej kluczowe biblioteki – NumPy i Pandas, oraz zobaczyć ich zastosowanie w pracy z różnorodnymi danymi. Szkolenie wymaga znajomości podstaw języka Python.
Dla kogo jest szkolenie z Analizy danych w Python?
Dla programistów Python chcących rozszerzyć swoje kompetencje w obszarze analizy danych (praca w notebooku, praca na tablicach i tabelach)
Dla osób rozwijających się w stronę pracy z uczeniem maszynowym i sztuczną inteligencją, które chcą uporządkować etap przygotowania danych
Dla analityków danych potrzebujących narzędzi do implementacji i automatyzacji własnych analiz oraz budowy powtarzalnych przepływów pracy na danych
Czego się nauczysz na szkoleniu Analizy danych z Python
- Przeprowadzisz kompletny proces pracy z danymi: wczytanie, kontrola jakości, przekształcenia, agregacje oraz przygotowanie wyników do udostępnienia
- Opanujesz pracę na wielowymiarowych tablicach NumPy (indeksowanie, operacje wektorowe, broadcast, podstawy wydajności)
- Zastosujesz Pandas do analizy danych tabelarycznych (selekcja, filtrowanie, łączenia, grupowanie, praca z brakami danych)
- Zintegrujesz dane z różnorodnych źródeł (pliki i bazy relacyjne) oraz zautomatyzujesz powtarzalne kroki analizy w czytelnych, odtwarzalnych procedurach
- Uporządkujesz kolejne kroki w kierunku uczenia maszynowego, z naciskiem na przygotowanie danych i ograniczenia wynikające z jakości oraz pochodzenia danych
Program szkolenia
Moduł 1: Narzędzia obliczeniowe i algorytmiczne – biblioteki NumPy oraz SciPy:
- Praca z danymi numerycznymi – wektoryzacja obliczeń, broadcasting, podstawy wydajności
- Charakterystyka tablic wielowymiarowych NumPy – indeksowanie, maski, typy danych, operacje na osiach
- Biblioteki obliczeń naukowych i inżynieryjnych SciPy – statystyka, optymalizacja, narzędzia wspierające analizę
Moduł 2: Integracja ze źródłami danych:
- Relacyjne bazy danych (MySQL, PostgreSQL) – połączenia, pobieranie danych, podstawy pracy z zapytaniami w kontekście analizy
- Arkusze Excel – import/eksport, praca na arkuszach i zakresach, kontrola typów i braków danych
Moduł 3: Podstawy pracy z danymi tabelarycznymi – biblioteka Pandas:
- Wczytywanie danych z różnych źródeł – CSV/Excel/bazy danych, kontrola typów i kodowania
- Struktura obiektu Pandas DataFrame – indeks, kolumny, typy, operacje wiersz/kolumna
- Metody typowych analiz – filtrowanie, sortowanie, agregacje, groupby, pivot, statystyki opisowe
- Operacje na danych i automatyzacja – czyszczenie, braki danych, łączenia, transformacje, walidacja wyników i powtarzalność kroków
- Wizualizacja danych przy pomocy Matplotlib i Seaborn – wykresy eksploracyjne, porównania, trendy, prezentacja wyników
- Eksport wyników i przegląd narzędzi raportowych – pliki, tabele, wykresy, przygotowanie danych do dalszego użycia
Moduł 4: Kierunki rozwoju w stronę Machine Learning:
- Proces czyszczenia i przekształcania danych – cechy, przygotowanie zbioru, podział danych, ryzyka błędnej walidacji
- Przegląd zastosowań powyższej wiedzy w pracy z bibliotekami Scikit-learn i Tensorflow/Keras
Pobierz program
Pobierz szczegółowy program w PDF, żeby dowiedzieć się więcej o godzinach i tematach zajęć.