Zadania

Zadanie 1:

Napisać funkcje obliczające:
  • reprezentację one-hot vector dla dokumentu (getVectorOneHot(document));
  • reprezentację bag of words dla dokumentu (getVectorBagOfWords(document));
  • reprezentację TF-IDF dla korpusu dokumentów (getVectorTFIDF(corpus)).

Zadanie 2:

Napisać program, który łączy:
  • dwie reprezentacje one-hot vector (getVectorOneHot(doc1_OneHot, doc2_OneHot));
  • dwie reprezentacje bag of words (getVectorBagOfWords(doc1_BoW, doc2_BoW));
  • dwie reprezentacje TF-IDF (getVectorTFIDF(tfidf1, tfidf2)).