Big Data
Inżynieria przetwarzania dużych zbiorów danych

    Wyniki pisemnej części zaliczenia

    314428 5.0
    332434 5.0
    332456 5.0
    332467 5.0
    336220 3.5
    336256 4.5
    336678 5.0
    338473 4.0
    344841 5.0
    344861 5.0
    344880 3.5
    352388 3.0
    359899 5.0
    359910 4.5
    359912 5.0
    359914 5.0
    359918 5.0
    359920 3.5
    359925 5.0
    359928 5.0
    360553 5.0
    360555 5.0
    360560 5.0
    360565 5.0
    360571 3.0
    360746 5.0
    360747 4.0
    361302 2.0
    361303 5.0
    362478 5.0
    370789 5.0
    	
    	
  1. Zajęcia 1 Big Data concepts and terminology
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
      • Czym jest Big Data? Zdefiniuj to pojęcie.
      • Opisz czynniki charakteryzujące Big Data (volume, velocity, variety, veracity, value).
      • Czym różnią się dane jakościowe od danych ilościowych? Podaj przykłady danych należących do każdego z typów.
      • Opisz związki jakie zachodzą pomiędzy danymi, informacją, wiedzą i mądrością. Czym się one różnią między sobą?
      • Czym różni się analiza danych od analityki danych? Wymień rodzaje analityki danych (descriptive, diagnostic, predictive , prescriptive).
  2. Zajęcia 2 Big Data paradigm
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
      • O czym mówi prawo Amdahl'a? Scharakteryzuj skalowanie pionowe i poziome (vertical scaling, hor­izontal scaling).
      • Wymień i opisz cechy, których oczekjemy od systemów Big Data.
  3. Zajęcia 3 Processing concepts for Big Data
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
      • Wyjaśnij pojęcia: przetwarzanie równoległe, przetwarzanie rozproszone, klaster, metoda dziel i zwyciężaj. Jaki widzisz związek pomiędzy tymi pojęciami?
      • Czym różni się przetwarzanie wsadowe (batch) od przetwarzania w czasie rzeczywistym (realtime)?
      • Porównaj ze sobą divide and conquere i mapreduce.
      • Opisz czego dotyczy zasada SVC (Speed, Consistency and Volume (SCV) principle).
  4. Zajęcia 4 From hindsight to foresight
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
      • Uzasadnij dlaczego Big Data może być atrakcyjne dla firm? Co może im zaoferować?
  5. Zajęcia 5 Big Data adoption issues and considerations
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
      • Wymień i opisz czynniki, jakie należy brać pod uwagę chcąc wykorzystać Big Data (m.in. Prerequisites for organization, Data sources considerations, Data tracking, Data provenance, Privacy, Security, Performance)
  6. Zajęcia 6 Big Data adoption issues and considerations
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
      • Opisz pożądane cechy danych. W wykładzie jest taki fragment: Because of this I want to focus now on most wanted and versatile set of properties. Whatever we think one is true: we don't want lose our date; we want it to be true now and in the future; we want to be able to get back with all changes we made on it. More technically we want it to be raw, immutable and eternally true. Dlaczego wymienione cechy (raw, immutable, eternally true) uznajemy za tak istotne?
  7. Zajęcia 7 Data storage for Big Data
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
      • Wymień wady i zalety składowania danych: bezpośrednio w: (rozproszonym) systemie plików, relacyjnej bazie danych, bazie typu NoSQL, w pamięci (in-memory storage devices) w tym: • In-Memory Data Grid (IMDG), In-Memory Database (IMDB).

  1. Zajęcia 8 Virtual machine and Anaconda installation and configuration
  2. Zajęcia 9 Virtual machine and Anaconda installation and configuration
  3. Zajęcia 10 pandas
  4. Zajęcia 11 Talend - zapoznanie
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  5. Zajęcia 12 Talend - ćwiczenia praktyczne
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  6. Zajęcia 13 Braca ze zbiorami danych
    • Materials
    • Co po tych zajęciach powinno się znać / wiedzieć / umieć
  7. Zajęcia 14 Braca ze zbiorami danych. Omówienie projektów zaliczeniowych.

Materiały