logo
Karta przedmiotu
logo

Wielowymiarowa analiza danych

Podstawowe informacje o zajęciach

Cykl kształcenia: 2022/2023

Nazwa jednostki prowadzącej studia: Wydział Matematyki i Fizyki Stosowanej (p.prakt)

Nazwa kierunku studiów: Inżynieria i analiza danych

Obszar kształcenia: nauki ścisłe

Profil studiów: praktyczny

Poziom studiów: pierwszego stopnia

Forma studiów: stacjonarne

Specjalności na kierunku: inżynieria i analiza danych

Tytuł otrzymywany po ukończeniu studiów: inżynier

Nazwa jednostki prowadzącej zajęcia: Zakład Systemów Złożonych

Kod zajęć: 12535

Status zajęć: obowiązkowy dla programu inżynieria i analiza danych

Układ zajęć w planie studiów: sem: 6 / W15 L15 P15 / 3 ECTS / Z

Język wykładowy: polski

Imię i nazwisko koordynatora: dr inż. Paweł Dymora

Terminy konsultacji koordynatora: https://pdymora.v.prz.edu.pl/konsultacje

semestr 6: mgr inż. Paweł Kuraś , termin konsultacji https://pkuras.v.prz.edu.pl/konsultacje

Cel kształcenia i wykaz literatury

Główny cel kształcenia: Zasadniczym celem kształcenia na module jest prezentacja wybranych zagadnień z zakresu hurtowni danych i wielowymiarowej analizy danych z wykorzystaniem kostek OLAP oraz elementów wybranych narzędzi analitycznych lub programistycznych.

Ogólne informacje o zajęciach: Podczas zajęć studenci poznają podstawy wielowymiarowej analizy danych oraz wybrane algorytmy w wybranych środowiskach bazodanowych oraz programistycznych.

Materiały dydaktyczne: http://v.prz.edu.pl/pawel.dymora

Wykaz literatury, wymaganej do zaliczenia zajęć
Literatura wykorzystywana podczas zajęć wykładowych
1 Adam Pelikant Hurtownie danych. Od przetwarzania analitycznego do raportowania. Wydanie II Helion SA. 2021
2 Gil Raviv Power Query w Excelu i Power BI. Zbieranie i przekształcanie danych Helion SA. 2020
3 Hadley Wickham, Garrett Grolemund Język R. Kompletny zestaw narzędzi dla analityków danych Helion. 2018
4 Robert Layton Learning Data Mining with Python . 2017
5 Osowski Stanisław Metody i narzędzia eksploracji danych BTC. 2017
6 Chodkowska-Gyurics Agnieszka Hurtownie danych Teoria i praktyka PWN. 2014
Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych
1 Adam Pelikant , Hurtownie danych. Od przetwarzania analitycznego do raportowania. Wydanie II Helion SA. 2021
2 Osowski Stanisław Metody i narzędzia eksploracji danych BTC. 2017
3 Chodkowska-Gyurics Agnieszka Hurtownie danych Teoria i praktyka PWN. 2014
4 Bill Jelen, Rob Collie Power Pivot dla Excela. Zaawansowane możliwości Helion SA. 2014

Wymagania wstępne w kategorii wiedzy/umiejętności/kompetencji społecznych

Wymagania formalne: Ukończony kurs podstaw baz danych oraz programowania w wybranym języku programowania. Znajomość SQL. Student spełnia wymagania określone w regulaminie studiów.

Wymagania wstępne w kategorii Wiedzy: Student powinien znać podstawowe zagadnienia z zakresu relacyjnych baz danych, algorytmiki, języka SQL i podstaw programowania.

Wymagania wstępne w kategorii Umiejętności: Potrafi eksplorować zbiory danych, pisać skrypty, manipulować danymi.

Wymagania wstępne w kategorii Kompetencji społecznych: Praca w grupie, komunikatywność.

Efekty kształcenia dla zajęć

MEK Student, który zaliczył zajęcia Formy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształcenia Metody weryfikacji każdego z wymienionych efektów kształcenia Związki z KEK Związki z PRK
01 Posiada podstawową wiedzę nt. organizacji hurtowni i potrafi wskazać korzyści z wdrożenia hurtowni danych. wykład , laboratorium, projekt zaliczenie, obserwacja wykonawstwa K_W05+
K_W06++
K_W07++
K_U05+
K_U06++
K_U07++
K_U08+++
K_U15+
K_U18++
K_U23+
K_K01+
K_K03+
P6S_KK
P6S_KO
P6S_KR
P6S_UK
P6S_UW
P6S_WG
02 Zna pojęcie i rozumie znaczenie kostki OLAP oraz potrafi wykonywać zaawansowane operacje na kostce danych. wykład , laboratorium, projekt zaliczenie, obserwacja wykonawstwa K_W05+
K_W06++
K_W07++
K_U05++
K_U06++
K_U07++
K_U08+++
K_U15+
K_U18++
K_U23+
K_K01+
K_K03+
P6S_KK
P6S_KO
P6S_KR
P6S_UK
P6S_UW
P6S_WG
03 Potrafi zaprojektować efektywny model danych hurtowni i zbudować kostkę OLAP w wybranym narzędziu hurtowni danych oraz zaprojektować procesy ETL. wykład , laboratorium, projekt zaliczenie, obserwacja wykonawstwa K_W05+
K_W06++
K_W07++
K_U05++
K_U06+++
K_U07++
K_U08+++
K_U15++
K_U18+++
K_U23+
K_K01+
K_K03++
P6S_KK
P6S_KO
P6S_KR
P6S_UK
P6S_UW
P6S_WG
04 Potrafi wykorzystać język SQL/MDX oraz wybrane implementacje pakietów i algorytmów data mining w wybranych środowiskach programistycznych i analitycznych do eksplorowania wielowymiarowych danych. wykład , laboratorium, projekt zaliczenie, obserwacja wykonawstwa K_W05+
K_W06++
K_W07++
K_U05+++
K_U06+++
K_U07+++
K_U08+++
K_U15+
K_U18+++
K_U23+
K_K01+
K_K03++
P6S_KK
P6S_KO
P6S_KR
P6S_UK
P6S_UW
P6S_WG

Uwaga: W zależności od sytuacji epidemicznej, jeżeli nie będzie możliwości weryfikacji osiągniętych efektów uczenia się określonych w programie studiów w sposób stacjonarny w szczególności zaliczenia i egzaminy kończące określone zajęcia będą mogły się odbywać przy użyciu środków komunikacji elektronicznej (w sposób zdalny).

Treści kształcenia dla zajęć

Sem. TK Treści kształcenia Realizowane na MEK
6 TK01 Zajęcia organizacyjne. Ustalenie formy zaliczenia i zakresu materiału. Zapoznanie z regulaminem pracy w laboratorium. W01, L01
6 TK02 Geneza hurtowni danych (HD) (ang. Data Warehouse) i systemów eksploracji danych (SED) (ang. Data Mining Systems). W01, W02, L01, L02, P01 MEK01 MEK02
6 TK03 Modelowanie danych i przetwarzania (model relacyjny a wielowymiarowy, modele przetwarzania analitycznego w trybie on-line (OLAP), wielowymiarowe operacje i schematy danych, klasy i architektury OLAP – analiza porównawcza). Procesy ekstrakcji danych (ETL) (projektowanie i modelowa-nie ekstrakcji danych, specjalizowane i uniwersalne systemy ETL). Wybrane środowiska: MS SQL Server 2019, Oracle Analytics Desktop. W03, W04, L02, L03, P02, P03 MEK01 MEK02 MEK03
6 TK04 Tworzenie hurtowni danych w wybranych środowiskach i zastosowaniach. Użycie kreatorów: kostki OLAP, wymiaru wirtualnego, projektowania magazynu, optymalizacji na podstawie użytkowania, analizy na podstawie użytkowania, wymiaru i wirtualnej kostki. Użycie edytora kostki i edytora wymiaru. Zgłębianie danych. Tworzenie wymiarów strukturalnych i informacyjnych. Tworzenie miar kalkulowanych i wymiarów kategorii. W04, W05, L04, P04 MEK02 MEK03
6 TK05 Przetwarzanie analityczne i jego optymalizacja: perspektywy zmaterializowane (przepisywanie zapytań, wybór zbioru perspektyw, anomalie odświeżania), optymalizacja GRUP BY, kompresja, przetwarzanie równoległe, partycjonowanie. Wykorzystywanie języka zapytań SQL do eksploracji danych: projektowanie i wykonanie zapytań. Język SQL/MDX. W05, W06, L05, P05 MEK03 MEK04
6 TK06 Implementacja wybranych modeli data mining (np. drzewo decyzyjne, asocjaceje, klasteryzacja, inne) w wybranym środowisku analitycznym/programistycznym. W07, L06, L07, P06, P07 MEK03 MEK04

Nakład pracy studenta

Forma zajęć Praca przed zajęciami Udział w zajęciach Praca po zajęciach
Wykład (sem. 6) Godziny kontaktowe: 15.00 godz./sem.
Studiowanie zalecanej literatury: 3.00 godz./sem.
Laboratorium (sem. 6) Przygotowanie do laboratorium: 6.00 godz./sem.
Przygotowanie do kolokwium: 3.00 godz./sem.
Godziny kontaktowe: 15.00 godz./sem.
Dokończenia/wykonanie sprawozdania: 6.00 godz./sem.
Projekt/Seminarium (sem. 6) Godziny kontaktowe: 15.00 godz./sem..
Konsultacje (sem. 6) Przygotowanie do konsultacji: 2.00 godz./sem.
Udział w konsultacjach: 3.00 godz./sem.
Zaliczenie (sem. 6) Przygotowanie do zaliczenia: 5.00 godz./sem.
Zaliczenie pisemne: 2.00 godz./sem.

Sposób wystawiania ocen składowych zajęć i oceny końcowej

Forma zajęć Sposób wystawiania oceny podsumowującej
Wykład Wykład kończy się pisemnym zaliczeniem. Warunkiem dopuszczenia do zaliczenia wykładu jest uzyskanie pozytywnej oceny końcowej z laboratorium i pozytywna ocena z realizacji samodzielnego projektu. W szczególnych przypadkach, na podstawie obserwacji realizacji zajęć praktycznych (laboratorium, projekt) potwierdzonej wysokimi ocenami ze sprawozdań, projektu, aktywności oraz stwierdzonej znajomości tematyki zajęć, koordynator modułu może zwolnić wybranych studentów, z najwyższą średnią ocen, z konieczności zaliczenia wykładu/egzaminu. W przypadku zwolnionych osób, ocena z zaliczenia wykładu (egzaminu) będzie odpowiadała ww. średniej ważonej pozytywnych ocen.
Laboratorium 1) Na zajęciach laboratoryjnych obecność jest obowiązkowa. 2) W przypadku nieobecności należy dostarczyć dokument usprawiedliwiający nieobecność (np. zwolnienie lekarskie) oraz odrobić zajęcia w najbliższym terminie. 3) Laboratorium należy wykonać samodzielnie i oddać sprawozdanie z jego przebiegu. 4) Postępy w pracach na laboratorium są oceniane w skali od 2 - 5. 5) Na zakończenie zajęć student samodzielnie przygotowuje przerobione zadania np. w formie zdjęć/zrzutów ekranu i przesyła je drogą elektroniczną w postaci spakowanego archiwum na adres e-mail prowadzącego zajęcia. Dopuszcza się za zgodą prowadzącego przesyłanie archiwum na kanał grupy w MS Teams. 6) Student samodzielnie przygotowuje sprawozdanie bazujące na wykonanych podczas laboratorium zadaniach. Student ma czas na przesłanie sprawozdania do tygodnia kalendarzowego od rozpoczęcia zajęć. Sprawozdanie należy wykonać w szablonie przygotowanym przez prowadzącego (doc lub latex). Zrobione sprawozdanie należy wysłać na adres prowadzącego w podanym przez niego nagłówku wiadomości. Jest to warunek uczestnictwa w kolejnym laboratorium. Dopuszcza się za zgodą prowadzącego przesyłanie sprawozdania na kanał grupy w MS Teams. 7) Za sprawozdanie można uzyskać ocenę od 2 do 5. 8) Warunkami zaliczenia zajęć laboratoryjnych są: - obecność na wszystkich zajęciach; - oddanie wszystkich sprawozdań; - otrzymanie z każdych sprawozdań oceny pozytywnej; - otrzymanie na każdych zajęciach oceny pozytywnej z aktywności (postępów zajęć); - zaliczenie na ocenę pozytywną kolokwium końcowego (test pisemny lub zadanie przy komputerze). Należy spełnić wszystkie warunki w celu uzyskania pozytywnej oceny. Ocena końcowa z laboratorium jest średnią oceną z postępów w zajęciach, kolokwium oraz sprawozdań.
Projekt/Seminarium Celem zajęć projektowych będzie samodzielna (dopuszczalna również zespołowa) realizacja projektu informatycznego, którego efektem ma być udokumentowana implementacja wybranych zagadnień wielowymiarowej analizy danych w tym algorytmów data mining.
Ocena końcowa Ocena końcowa wystawiana jest jako średnia ważona pozytywnych oceny z laboratorium, oceny z projektu i oceny z wykładu.

Przykładowe zadania

Wymagane podczas egzaminu/zaliczenia
(-)

Realizowane podczas zajęć ćwiczeniowych/laboratoryjnych/projektowych
(-)

Inne
(-)

Czy podczas egzaminu/zaliczenia student ma możliwość korzystania z materiałów pomocniczych : nie

Treści zajęć powiazane są z prowadzonymi badaniami naukowymi: nie