Szkolenie Deep Learning natural language processing
Poziom
ZaawansowanyCzas
40h / 5 dniTermin
IndywidualnieCena
IndywidualnieSzkolenie Deep Learning natural language processing
Natural Language Processing (NLP) jest jednym z najgorętszych obszarów sztucznej inteligencji (AI) dzięki aplikacjom takim jak generatory tekstu, chatboty oraz programy do przetwarzania tekstu na obrazy. Ostatnie lata pokazały niesamowity rozwój zdolności komputerów do rozumienia ludzkich języków, języków programowania, a nawet sekwencji biologicznych i chemicznych, takich jak struktury DNA i białek, które przypominają język. Z NLP korzysta wiele firm, nawet tacy giganci jak Google, które wykorzystuje NLP do poprawy wyników wyszukiwania, czy Facebook, który używa NLP do wykrywania i filtrowania mowy nienawiści.
Dla kogo jest szkolenie Deep Learning natural language processing?
Dla programistów, data scientistów i analityków danych, którzy chcą budować i oceniać modele NLP oparte o deep learning (TensorFlow/Keras).
Dla osób z dobrą znajomością Pythona i podstawami ML, które chcą pogłębić kompetencje w pracy z danymi tekstowymi oraz modelami RNN i transformerami.
Czego nauczysz się na szkoleniu Deep Learning natural language processing?
- Jak przygotowywać i analizować dane tekstowe do uczenia maszynowego (m.in. budowa zbioru danych, tokenizacja, analiza statystyczna, podział train/val/test i unikanie data leakage)
- Jak tworzyć i trenować modele NLP z wykorzystaniem sieci rekurencyjnych w TensorFlow/Keras oraz prowadzić walidację i analizę błędów
- Jak wykorzystać transformery i transfer learning do klasyfikacji tekstu oraz porównywać podejścia pod kątem jakości i kosztu obliczeń
- Jak oceniać i ulepszać jakość modeli NLP poprzez dobór metryk, tuning oraz podstawowe praktyki odpowiedzialnego użycia (bias, prywatność danych, testy regresji jakości)
Szkolenie Deep Learning natural language processing
Wstęp i przetwarzanie danych tekstowych (8h)
- Dane tekstowe i reprezentacje (tokeny, embeddingi)
- Rodzaje modeli języka (n-gram, RNN, transformery)
- Pozyskanie i przegląd zbioru
- Budowa zbioru danych
- Tokenizacja i wektoryzacja
- Analiza statystyczna zbioru (długości, słownictwo, balans klas)
- Przygotowanie zbioru do modelowania (podział train/val/test, kontrola data leakage, ziarna losowości)
Klasyfikacja tekstu z sieciami rekurencyjnymi w tf.keras (8h)
- Teoria sieci rekurencyjnych
- Projekt architektury modelu
- Trening modelu i walidacja
- Analiza jakościowa modelu i błędów
- Strojenie modelu i regularyzacja
Transformery (8h)
- Teoria transformerów i self-attention
- Transfer learning z modelami pretrained
- Fine-tuning modelu transformerowego
- Porównanie modeli i metryk jakości