Przetwarzanie danych tekstowych
- Zajęcia 1 Program sed
- Materials
- Na zajęcia odbywające się w dniu 2018.12.10 proszę o opanowanie materiału związanego z programowaniem w Bash-u (linki w sekcji Materiały)
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Znać możliwości programu sed.
- Umieć korzystać z programu sed.
- Zajęcia 2 Program awk
Zajęcia zaplanowane na 2018.11.12, który wyjątkowo w tym roku okazuje się dniem wolnym od pracy. W związku z tym proszę o samodzielne zapoznanie się z materiałami, tym bardziej, że są one znacznie prostsze niż sed. Ze względu na dostępność materiałów i ich mały stopień złożoności, zajęcia te nie będą odrabiane. W razie problemów zapraszam na konsultacje.
- Materials
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Znać możliwości programu awk.
- Umieć korzystać z programu awk.
- Umieć opisać różnice pomiędzy sed a awk i podać obszary (nie)stosowalności kazdego z nich.
- Zajęcia 3 Małe programy ułatwiające życie
- Materials
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Zajęcia 4 Przetwarzanie danych ustrukturyzowanych (CSV, JSON, XML)
- Materials
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Zajęcia 5 Skrypty powłoki (Bash)
- Zajęcia 6 Zadanie praktyczne
- Materials
- Zadania
- Napisać skrypt, który na wszystkich plikach z zadanego katalogu wykonuje polecenie sort.
- Napisać skrypt, który łączy wszystkie pliki ze statystykami występowania słów z zadanego katalogu w jeden plik.
- Napisać skrypt zdolny do posortowania dużego pliku zawierającego statystykami występowania słów (większego niż wielkość dostępnej pamięci RAM na testowym komputerze), według częstotliwości występowania słów.
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
- Zajęcia 7 Zadanie praktyczne
- Materials
- Pliki z danymi
- data.htm Plik z danymi do przetworzenia
- data.csv Plik wynikowy (wynik przetwarzania)
- Materiały do grafiki
- Plots with R
- Plots with gnuplot
- Zadania
- Napisać skrypt, ciąg poleceń itd, który dla uzyskanych danych CSV utworzy wybrany wykres.
- Co po tych zajęciach powinno się znać / wiedzieć / umieć
Materiały
- Bash
- Maszyna wirtualna używna na zajęciach (VirtualBox, v. 5.2.20, rozmiar pliku: 2.6GiB) tdp.ova