Zajęcia
Informacje o przebiegu zajęć

Wykład

Data Opis
2024-02-26 Wykład 1/6:
2024-03-11 Wykład 2/6:
  • Zagadnienia
    • N-gram language models
      • N-Grams
      • Evaluating language models
      • Sampling sentences from a language model
      • Generalization and zeros
      • Smoothing
      • Backoff and interpolation
  • Materiały
  • Zadania
  • Co po tych zajęciach powinno się znać / wiedzieć / umieć
    • Czym jest n-gram.
    • Wykorzystać bigam do przewidzenia kolejnego słowa.
    • Jak możemy oceniać wartość modelu jezykowego (wykorzystanie tzw. perplexity).
    • Generowanie tekstu na podstawie modelu językowego.
    • Problem generalizacji modelu i postępowania ze słowami nieobecnymi w zbiorze uczącym (generalization and zeros, smoothing, backoff, interpolation).
2024-03-25 Wykład 3/6:
  • Zagadnienia
    • Naive bayes and text classification
      • ...
  • Materiały
  • Zadania
  • Co po tych zajęciach powinno się znać / wiedzieć / umieć
    • Wyjaśnić czego dotyczy reguła Bayesa.
    • Wyjaśnić podstawowe założenia tzw. naiwnego Bayesa. Dlaczego przyjmujemy takie właśnie założenia?
    • Omów poszczególne kroki nauki i wykorzystania modelu opartego o tzw. naiwnego Bayesa.
    • Wyjaśnij czym jest tzw. confusion matrix.
    • Co opisują pojęcia accuracy, precision i recall.
    • Na czym polega sprawdzian krzyżowy (cross-validation).

Laboratorium informatyczne

Data Opis
2024-02-26 Laboratorium informatyczne 1/14:
  • Zagadnienia
    • Regular expressions
  • Materiały
  • Zadania
  • Co po tych zajęciach powinno się znać / wiedzieć / umieć
    • Podstawowa składnia wyrażeń regularnych.
2024-03-04 Laboratorium informatyczne 2/14:
  • Zagadnienia
    • Wyrażenia regularne w praktyce: przetwarzamy język reguł
  • Materiały
    • ...
  • Zadania
  • Co po tych zajęciach powinno się znać / wiedzieć / umieć
    • Praktyczna umiejętność posługiwania się wyrażeniami regularnymi.
2024-03-11 Laboratorium informatyczne 3/14:
  • Zagadnienia
    • Wyrażenia regularne w praktyce: przetwarzamy język reguł (omawiamy przykładową implementację)
  • Materiały
    • ...
  • Zadania
    • ...
  • Co po tych zajęciach powinno się znać / wiedzieć / umieć
    • Praktyczna umiejętność posługiwania się wyrażeniami regularnymi.
2024-03-18 Laboratorium informatyczne 4/14:
  • Zagadnienia
    • Pozyskiwanie dokumentów i ich "czyszczenie".
    • Normalizowanie dokumentów.
  • Materiały
    • ...
  • Zadania
    • ...
  • Co po tych zajęciach powinno się znać / wiedzieć / umieć
    • Pozyskiwać dokumenty z sieci i przygotowywać do dalszego przetwarzania.
    • Przeprowadzić proces normalizacji dokumentu i przygotowania danych na podstawie których zostanie stworzony model.
2024-03-25 Laboratorium informatyczne 5/14:
  • Zagadnienia
    • Dzielenie znormalizowanego dokumentu na n-gramy.
    • Budujemy model n-gramowy - praca samodzielna.
  • Materiały
    • ...
  • Zadania
  • Co po tych zajęciach powinno się znać / wiedzieć / umieć
    • Zbudować model n-gramowy.
2024-04-07 Laboratorium informatyczne 6/14:
  • Zagadnienia
    • Omawiamy przykładową implementację modelu n-gramowego.
    • Praca z modelem n-gramowym.
  • Co po tych zajęciach powinno się znać / wiedzieć / umieć
    • Zbudować model n-gramowy.