NLP - Przetwarzanie języka naturalnego
- Zajęcia 1 Elementy teorii języków formalnych
- Materiały
- Zadania
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Znać podstawowe pojęcia teorii języków formalnych.
- Zajęcia 2 FSM jako prosty chatbot
- Materiały
- Zadania
- Zaimplementować FSM dla wybranego "hasła".
- Alternatywnie: zaimplementować prostego chatbot-a.
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Jak wykorzystać FSM do prostego przetwarzania regularnych wyrażeń.
- Zajęcia 3 From words to numbers. Parsing, tokenization, extract information
- Materiały
- Zadania
- Zaimplementować prosty parser wykorzystując FSM.
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Czym jest tokenizacja.
- Metody "wektoryzacji" napisów.
- Zajęcia 4 Przyglądamy się stworzonym chatbotom (zadanie z zajęć 2)
- Materiały
- Zadania
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Zajęcia 5 Working with words frequencies
- Materiały
- Zadania
- Wykorzystaj TF-IDF do zaimplementowania ulepszonej wersji chatbot-a.
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Jak obliczamy wartości TF-IDF.
- Zajęcia 6 Math behind NLP (część I: do wektorów i wartości własnych włącznie)
- Materiały
- Zadania
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Zajęcia 7 Math behind NLP (część II: rozkład SVD)
- Materiały
- Zadania
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Zajęcia 8 Math behind NLP (część III: PCA - analiza głównych składowych)
- Materiały
- Zadania
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Czym jest PCA.
- Związek pomiędzy SVD a PCA.
- Jak można wykorzystać SVD i PCA w NLP.
- Zajęcia 9 Semantic analysis. In the search of meaning and context in words count: meaning
- Materiały
- Zadania
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Czym jest tzw. topic vector (DTM - document term matrix)? Jakie informacje zawiera, jak go interpretować?
- Linear Discriminant Analysis (LDA) - zasada działania oraz praktyczna umiejętność wykorzystania.
- Zajęcia 10 Semantic analysis. In the search of meaning and context in words count: kończymy LDA + context
- Materiały
- Zadania
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Latent Semantic Analysis (LSA) - zasada działania oraz praktyczna umiejętność wykorzystania.
- Co-occurrence matrix (COM)
- Zajęcia 11 Krótkie wprowadzenie do sztucznych sieci neuronowych, część I
- Zajęcia 12 Krótkie wprowadzenie do sztucznych sieci neuronowych, część II - przykłady
- Zajęcia 13 word2vec
- Zajęcia 14 Podsumowanie
Materiały