Zajęcia
Informacje o przebiegu zajęć

Wykład

Data Opis
2024-02-26 Wykład 1/6:
2024-03-11 Wykład 2/6:
 • Zagadnienia
  • N-gram language models
   • N-Grams
   • Evaluating language models
   • Sampling sentences from a language model
   • Generalization and zeros
   • Smoothing
   • Backoff and interpolation
 • Materiały
 • Zadania
 • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  • Czym jest n-gram.
  • Wykorzystać bigam do przewidzenia kolejnego słowa.
  • Jak możemy oceniać wartość modelu jezykowego (wykorzystanie tzw. perplexity).
  • Generowanie tekstu na podstawie modelu językowego.
  • Problem generalizacji modelu i postępowania ze słowami nieobecnymi w zbiorze uczącym (generalization and zeros, smoothing, backoff, interpolation).
2024-03-25 Wykład 3/6:
 • Zagadnienia
  • Naive bayes and text classification
   • ...
 • Materiały
 • Zadania
 • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  • Wyjaśnić czego dotyczy reguła Bayesa.
  • Wyjaśnić podstawowe założenia tzw. naiwnego Bayesa. Dlaczego przyjmujemy takie właśnie założenia?
  • Omów poszczególne kroki nauki i wykorzystania modelu opartego o tzw. naiwnego Bayesa.
  • Wyjaśnij czym jest tzw. confusion matrix.
  • Co opisują pojęcia accuracy, precision i recall.
  • Na czym polega sprawdzian krzyżowy (cross-validation).

Laboratorium informatyczne

Data Opis
2024-02-26 Laboratorium informatyczne 1/14:
 • Zagadnienia
  • Regular expressions
 • Materiały
 • Zadania
 • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  • Podstawowa składnia wyrażeń regularnych.
2024-03-04 Laboratorium informatyczne 2/14:
 • Zagadnienia
  • Wyrażenia regularne w praktyce: przetwarzamy język reguł
 • Materiały
  • ...
 • Zadania
 • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  • Praktyczna umiejętność posługiwania się wyrażeniami regularnymi.
2024-03-11 Laboratorium informatyczne 3/14:
 • Zagadnienia
  • Wyrażenia regularne w praktyce: przetwarzamy język reguł (omawiamy przykładową implementację)
 • Materiały
  • ...
 • Zadania
  • ...
 • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  • Praktyczna umiejętność posługiwania się wyrażeniami regularnymi.
2024-03-18 Laboratorium informatyczne 4/14:
 • Zagadnienia
  • Pozyskiwanie dokumentów i ich "czyszczenie".
  • Normalizowanie dokumentów.
 • Materiały
  • ...
 • Zadania
  • ...
 • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  • Pozyskiwać dokumenty z sieci i przygotowywać do dalszego przetwarzania.
  • Przeprowadzić proces normalizacji dokumentu i przygotowania danych na podstawie których zostanie stworzony model.
2024-03-25 Laboratorium informatyczne 5/14:
 • Zagadnienia
  • Dzielenie znormalizowanego dokumentu na n-gramy.
  • Budujemy model n-gramowy - praca samodzielna.
 • Materiały
  • ...
 • Zadania
 • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  • Zbudować model n-gramowy.
2024-04-07 Laboratorium informatyczne 6/14:
 • Zagadnienia
  • Omawiamy przykładową implementację modelu n-gramowego.
  • Praca z modelem n-gramowym.
 • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  • Zbudować model n-gramowy.