Szkolenie Analiza danych w Python

Poziom

Zaawansowany

Czas

16h / 2 dni

Termin

Indywidualnie

Cena

Indywidualnie

Szkolenie Analiza danych w Python

Mnogość modułów, wszechstronne wsparcie i łatwość w integracji z serwisami webowymi powoduje, że Python jest jednym z najpopularniejszych narzędzi w obszarze Data Science. Uczestnicy tego kursu będą mieli okazję poznać dwie najbardziej kluczowe biblioteki – NumPy i Pandas, oraz zobaczyć ich zastosowanie w pracy z różnorodnymi danymi. Szkolenie wymaga znajomości podstaw języka Python.

Dla kogo jest szkolenie z Analizy danych w Python?
  • logo infoshare Dla programistów Python chcących rozszerzyć swoje kompetencje w obszarze analizy danych (praca w notebooku, praca na tablicach i tabelach)
  • logo infoshare Dla osób rozwijających się w stronę pracy z uczeniem maszynowym i sztuczną inteligencją, które chcą uporządkować etap przygotowania danych
  • logo infoshare Dla analityków danych potrzebujących narzędzi do implementacji i automatyzacji własnych analiz oraz budowy powtarzalnych przepływów pracy na danych

Czego się nauczysz na szkoleniu Analizy danych z Python

  • Przeprowadzisz kompletny proces pracy z danymi: wczytanie, kontrola jakości, przekształcenia, agregacje oraz przygotowanie wyników do udostępnienia
  • Opanujesz pracę na wielowymiarowych tablicach NumPy (indeksowanie, operacje wektorowe, broadcast, podstawy wydajności)
  • Zastosujesz Pandas do analizy danych tabelarycznych (selekcja, filtrowanie, łączenia, grupowanie, praca z brakami danych)
  • Zintegrujesz dane z różnorodnych źródeł (pliki i bazy relacyjne) oraz zautomatyzujesz powtarzalne kroki analizy w czytelnych, odtwarzalnych procedurach
  • Uporządkujesz kolejne kroki w kierunku uczenia maszynowego, z naciskiem na przygotowanie danych i ograniczenia wynikające z jakości oraz pochodzenia danych

Program szkolenia

Moduł 1: Narzędzia obliczeniowe i algorytmiczne – biblioteki NumPy oraz SciPy:

  • Praca z danymi numerycznymi – wektoryzacja obliczeń, broadcasting, podstawy wydajności
  • Charakterystyka tablic wielowymiarowych NumPy – indeksowanie, maski, typy danych, operacje na osiach
  • Biblioteki obliczeń naukowych i inżynieryjnych SciPy – statystyka, optymalizacja, narzędzia wspierające analizę

 

Moduł 2: Integracja ze źródłami danych:

  • Relacyjne bazy danych (MySQL, PostgreSQL) – połączenia, pobieranie danych, podstawy pracy z zapytaniami w kontekście analizy
  • Arkusze Excel – import/eksport, praca na arkuszach i zakresach, kontrola typów i braków danych

 

Moduł 3: Podstawy pracy z danymi tabelarycznymi – biblioteka Pandas:

  • Wczytywanie danych z różnych źródeł – CSV/Excel/bazy danych, kontrola typów i kodowania
  • Struktura obiektu Pandas DataFrame – indeks, kolumny, typy, operacje wiersz/kolumna
  • Metody typowych analiz – filtrowanie, sortowanie, agregacje, groupby, pivot, statystyki opisowe
  • Operacje na danych i automatyzacja – czyszczenie, braki danych, łączenia, transformacje, walidacja wyników i powtarzalność kroków
  • Wizualizacja danych przy pomocy Matplotlib i Seaborn – wykresy eksploracyjne, porównania, trendy, prezentacja wyników
  • Eksport wyników i przegląd narzędzi raportowych – pliki, tabele, wykresy, przygotowanie danych do dalszego użycia

 

Moduł 4: Kierunki rozwoju w stronę Machine Learning:

  • Proces czyszczenia i przekształcania danych – cechy, przygotowanie zbioru, podział danych, ryzyka błędnej walidacji
  • Przegląd zastosowań powyższej wiedzy w pracy z bibliotekami Scikit-learn i Tensorflow/Keras

Pobierz program

Pobierz szczegółowy program w PDF, żeby dowiedzieć się więcej o godzinach i tematach zajęć.

Skontaktuj sie z nami

zorganizujemy dla Ciebie szkolenie dopasowane do Twoich potrzeb

Przemysław Wołosz

Key Account Manager

przemyslaw.wolosz@infoShareAcademy.com

    Administratorem danych osobowych jest InfoShare Academy Sp. z o.o. z siedzibą w Gdańsku, al. Grunwaldzka 427B, 80-309 Gdańsk, KRS: 0000531749, NIP: 5842742213. Dane osobowe przetwarzane są zgodnie z klauzulą informacyjną.