< Wróć do szkoleń IT

Google BigQuery

calendar

TERMIN

Ustalamy indywidualnie

clocl

CZAS

16h / 2 dni

money

CENA

Ustalamy indywidualnie

photo

Google BigQuery jest hurtownią danych dostępną w usłudze Google Cloud. Zapewnia przechowywanie i zarządzanie dużą ilością danych. BigQuery cechuje duża skalowalność i to, że zarządzanie nie wymaga utrzymywania drogiej infrastruktury.

Dla kogo jest to szkolenie?

Szkolenie przeznaczone jest dla:

  • architektów rozwiązań i specjalistów w zakresie hurtowni danych

  • inżynierów danych odpowiedzialnych za tworzenie i utrzymanie infrastruktury

  • analityków danych i osób zajmujących się przetwarzaniem danych

  • dla osób, które znają podstawy języka SQL

pattern

pattern
pattern pattern

Czego nauczysz się na szkoleniu?

  • poznasz od podstaw działanie Google BigQuery - dynamicznie rozwijającej się hurtowni danych, będącej elementem chmury Google (Google Cloud Platform)

  • nauczysz się podstaw pracy w BigQuery - pisania zapytań, tworzenia i zarządzania zbiorami danych oraz tabelami, tworzenia i projektowania procesów ETL i ELT z wykorzystaniem narzędzi dostępnych w chmurze Google

  • dowiesz się, jak wizualizować dane zbierane w hurtowni danych w Looker Studio i Google Sheets, a także jak połączyć BigQuery z popularnymi narzędziami takimi jak PowerBI i Tableau

  • poznasz praktyczne zastosowania BigQuery w codziennej pracy w obszarze data science oraz dowiesz się, jak w prosty sposób rozpocząć przygodę z uczeniem maszynowym dzięki wykorzystaniu funkcjonalności BigQuery ML

Program szkolenia

  • Dzień: 1

    Moduł 1  – Wprowadzenie do Google Cloud Platform

    • Google BigQuery jako część platformy Google Cloud Platform (GCP)
    • komplementarne usługi GCP wykorzystywane razem z BigQuery (Google Cloud Storage, Cloud SQL, Cloud Functions, DataPrep i
      inne)
    • omówienie podstawowych komponentów GCP potrzebnych w pracy z BigQuery (projekt, konto rozliczeniowe, uprawnienia
      użytkowników)
    • wprowadzenie do hurtowni danych – idea działania, najważniejsze pojęcia i założenia

    Moduł 2  – Podstawy pracy z Google BigQuery

    • zbiory danych, tabele i zapytania – jak wygląda praca z danymi w BigQuery
    • edytor zapytań w interfejsie Google BigQuery
    • Cloud Shell – praca z danymi w środowisku CLI (command line)
    • pobieranie danych z wykorzystaniem podstawowych zapytań SELECT
    • manipulowanie wynikami zapytań z wykorzystaniem filtrowania (WHERE), sortowania (ORDER BY)
    • agregowanie danych (COUNT, SUM) z wykorzystaniem GROUP BY i HAVING

    Moduł 3 – Tworzenie i zarządzanie zbiorami danych i tabelami

    • tworzenie i ustawienia zbiorów danych
    • tworzenie tabeli w oparciu o schemat i zapytania CREATE OR REPLACE TABLE
    • podstawowe typy danych i tryby kolumn
    • praca z tablicami (arrays) i strukturami (structs) w BigQuery
    • partycjonowanie danych i zapytania do wielu tabel z wykorzystaniem sufiksów (wildcard tables)

    Moduł 4 – Ładowanie danych do Google BigQuery

    • wprowadzenie do procesów ETL i ELT na przykładzie hurtowni danych BigQuery
    • publiczne zbiory danych (BigQuery Public Datasets)
    • import danych z Google Cloud Storage do BigQuery
    • wczytywanie danych z zewnętrznych źródeł danych – MySQL, PostgreSQL
    • wczytywanie danych z Google Drive i Google Sheets
    • logowanie danych w BigQuery za pomocą BigQuery API
    • automatyzacja ładowania danych za pomocą Data Transfer Service i Scheduled Queries
  • Dzień: 2

    Moduł 5 – Pisanie zapytań SQL w BigQuery – ćwiczenia praktyczne

    • łączenie danych z wielu tabel z wykorzystaniem JOINs
    • Common Table Expressions z wykorzystaniem WITH w BigQuery
    • praca z tablicami danych z wykorzystaniem funkcji ARRAY_AGG i UNNEST
    • formatowanie daty i czasu – praca z danymi TIMESTAMP, DATETIME i DATE
    • Saved Queries – zapisywanie zapytań i współpraca w zespole

    Moduł 6 – Wizualizacja danych i raportowanie z wykorzystaniem BigQuery

    • eksport i analiza danych z BigQuery w Google Sheets
    • tworzenie dashboardów w Looker Studio w oparciu o dane z Google BigQuery
    • integracja BigQuery z innymi narzędziami do wizualizacji danych (PowerBI, Tableau)

    Moduł 7 – Praktyczne zastosowania BigQuery w codziennej pracy

    • BigQuery API i biblioteki Google Cloud Client Libraries w popularnych językach programowania
    • łączenie Google BigQuery z popularnymi narzędziami Data Science (Python, pandas, Jupyter)
    • tworzenie konta serwisowego (service account) i korzystanie z danych w BigQuery w zewnętrznych programach na przykładzie DataGrip
    • wprowadzenie i omówienie funkcjonalności uczenia maszynowego BigQuery ML – przykłady zastosowań w regresji liniowej i
      prognozy szeregów czasowych
pattern

Trener

Mateusz Muryjas

Web Analytics and Data Science Consultant

Pomaga firmom rozwiązywać problemy z danymi. Pracując jako konsultant data science wspiera organizacje w konfiguracji narzędzi, analizie danych i tworzeniu raportów. Odpowiada za rozwój produktu w re:silo - hurtowni danych dla e-commerce. Wie, jak w pełni wykorzystać Google Analytics, Tag Manager i rozwiązania Google Cloud Platform. Prelegent MeasureCamp, Data Science Summit czy I ♥ Ads & Analytics.

Przemysław Wołosz

Key Account Manager

Telefon

+48 730 830 801

Porozmawiajmy o szkoleniu

Wypełniając formularz zgadzasz się na przetwarzanie Twoich danych w celu udzielenia odpowiedzi na wysłaną przez Ciebie wiadomość
Administratorem danych osobowych jest infoShare Academy sp. z o.o., który dane osobowe przetwarza zgodnie z Klauzulą informacyjną.