Przetwarzanie danych tekstowych

Skrócony opis

Na zajęciach będziemy mówić o przetwarzaniu danych w sensie angielskiego terminu "preprocessing" co oznacza przetwarzanie wstępne. Przetwarzanie takie opiera się na manipulowaniu tekstem bez wnikania w istotę tego co on reprezentuje. Jako dane tekstowe rozumieć będziemy wszelkie dane, które reprezentowane są w postaci ciągów znaków. Przetwarzanie wstępne ma na celu takie przygotowanie danych aby nadawały się jako strumien wejściowy dla docelowego narzędzia przetwarzającego. Najprostsze z tych zagadnień to łączenie/dzielenie plików, wybieranie określonych fragmentów z plików. Bardziej złożone wymagają stosowania wyrażeń regularnych oraz narzędzi typu sed czy awk. W skrajnym przypadku zachodzi konieczność tworzenia złożonych skryptów. W wielu przypadkach sprawne posługiwanie się językiem skryptowym czy wręcz linią poleceń pozwala wykonać w ciągu kilku sekund to co w przypadku kompilowanych języków programowania zajmuje minuty lub godziny.

Wymagania wstępne

Efekty kształcenia

Po zakończonym kursie student:

  1. w zakresie WIEDZY
    1. Zna podstawowe narzędzia pozwalające na przetwarzanie danych tekstowych.
    2. Zna w podstawowym zakresie co najmniej jeden język skryptowy.
  2. w zakresie UMIEJĘTNOŚCI
    1. Wykorzystuje podstawowe narzędzia pozwalające na przetwarzanie danych tekstowych.
    2. Umie dobrać rodzaj narzędzia w zależności od zadania.
    3. Umie wykorzystać co najmniej jeden język skryptowy.
    4. Rozwiązuje zadania przetwarzania danych tekstowych.
  3. w zakresie KOMPETENCJI
    1. Potrafi samodzielnie kształcić się w oparciu o źródła krajowe, ale przede wszystkim zagraniczne.
    2. Potrafi kreatywnie rozwiązywać postawione zadania i napotkane problemy.

Treści kształcenia

Zajęcia (14h) składają się z trzech części (12h) + kolokwium (2h):

  1. Wprowadzenie do podstawowych poleceń pozwalających na przetwarzanie danych tekstowych (6h)
  2. Podstawy pracy z językami skryptowymi (2h)
  3. Rozwiązywanie zadań związanych z przetwarzaniem tekstu (4h)

Metody i kryteria oceniania

Na ocenę ogólną z zajęć składa się:

Projekt sprawdza efekty kształcenia w zakresie wiedzy, umiejętności i kompetencji (efekty: xxx)


Literatura podstawowa

Literatura uzupełniająca