Big Data
Inżynieria przetwarzania dużych zbiorów danych

Skrócony opis

Przetwarzanie dużej ilości danych, zwykle niemieszczących się na pojedynczym komputerze stanowią wyzwanie dla analityków danych. Celem przedmiotu jest zaznajomienie studentów z przygotowaniem i przetwarzaniem tego typu danych. Na zajęciach przedstawione zostaną różne problemy praktyczne wraz ze sposobami ich rozwiązania. Celem wykładu jest możliwie szerokie przedstawienie samej problematyk przetwarzania dużych zbiorów danych jak i dostępnych narzędzi, które w tym celu mogą być użyte. Laboratorium poświęcone będzie nabyciu praktycznych umiejętności posługiwania się narzędziami wykorzystywanymi przy przetwarzaniu dużych zbiorów danych, np. pracy z jedną wybraną rodziną produktów (np. HBase, Hadoop oraz Spark).

Wymagania wstępne

Swobodne programowanie w języku Python. Znajomość podstaw budowy aplikacji webowych.

Efekty kształcenia

Po zakończonym kursie student:

  1. w zakresie WIEDZY
  2. w zakresie UMIEJĘTNOŚCI
  3. w zakresie KOMPETENCJI
    1. Potrafi samodzielnie kształcić się w oparciu o źródła krajowe, ale przede wszystkim zagraniczne.
    2. Potrafi kreatywnie rozwiązywać postawione zadania i napotkane problemy.

Treści kształcenia

Wykład

Ćwiczenia

Głowny cel: pokazać przykłady wykrzystania różnych narzędzi/oprogramowania aby móc stworzyć prosty spójny system przetwarzania danych. Ćwiczenia można na przykład przeprowadzić w oparciu o poniższe zestawy oprogramowania:

Metody i kryteria oceniania

Na ocenę ogólną z zajęć składa się:

Projekt sprawdza efekty kształcenia w zakresie wiedzy, umiejętności i kompetencji (efekty: xxx)


Literatura podstawowa

Literatura uzupełniająca