logo PRZ
Karta przedmiotu
logo WYDZ

Eksploracja danych


Podstawowe informacje o zajęciach

Cykl kształcenia:
2020/2021
Nazwa jednostki prowadzącej studia:
Wydział Elektrotechniki i Informatyki
Nazwa kierunku studiów:
Informatyka
Obszar kształcenia:
nauki techniczne
Profil studiów:
ogólnoakademicki
Poziom studiów:
drugiego stopnia
Forma studiów:
stacjonarne
Specjalności na kierunku:
EFA-DU - inżynieria systemów informatycznych, EFC-DU - systemy informatyki przemysłowej, EFS-DU - Systemy i sieci komputerowe
Tytuł otrzymywany po ukończeniu studiów:
magister inżynier
Nazwa jednostki prowadzącej zajęcia:
Katedra Informatyki i Automatyki
Kod zajęć:
1426
Status zajęć:
obowiązkowy dla specjalności EFA-DU - inżynieria systemów informatycznych
Układ zajęć w planie studiów:
sem: 1 / W30 L20 / 4 ECTS / Z
Język wykładowy:
polski
Imię i nazwisko koordynatora:
dr inż. Krzysztof Świder
Terminy konsultacji koordynatora:
informacja na stronie KIiA: https://office.kia.prz.edu.pl
semestr 1:
dr inż. Bartosz Jędrzejec , termin konsultacji informacja na stronie KIiA: https://office.kia.prz.edu.pl
semestr 1:
dr hab. inż. prof. PRz Mariusz Oszust , termin konsultacji informacja na stronie KIiA: https://office.kia.prz.edu.pl

Cel kształcenia i wykaz literatury

Główny cel kształcenia:
Zdobycie wiedzy i umiejętności w zakresie funkcjonowania, projektowania oraz użytkowania systemów analizy dużych zbiorów danych wykorzystujących hurtownie danych oraz metody eksploracji danych.

Ogólne informacje o zajęciach:
W ramach przedmiotu omawiane są pojęcia, algorytmy, techniki oraz systemy wykorzystujące hurtownie danych oraz metody eksploracji danych, w tym: (1) wstępna obróbka danych, (2) projektowanie i implementacja systemów hurtowni danych i aplikacji OLAP, (3) technologia kostek danych, (4) odkrywanie częstych wzorców i asocjacji, (5) klasyfikacja oraz (6) analiza skupień (klastrów). Student powinien postrzegać eksplorację danych jako proces obejmujący fazy: rozpoznania danych, wstępnego przetwarzania, modelowania, oceny uzyskanych wzorców oraz wdrożenia wyników eksploracji.

Materiały dydaktyczne:
http://prz-rzeszow.pl/~kswider/ekd

Wykaz literatury, wymaganej do zaliczenia zajęć
Literatura wykorzystywana podczas zajęć wykładowych
1 D.T. Larose Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych Wydawnictwo Naukowe PWN. 2006
2 A. Zagdański, A. Suchwałko Analiza i prognozowanie szeregów czasowych Wydawnictwo Naukowe PWN. 2016
3 J. Han, M. Kamber, J. Pei Data Mining: Concepts and Techniques, 3rd ed. Morgan Kaufman, 2011 (można wykorzystać także wczesniejsze wydania). -
Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych
1 D.T. Larose Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych Wydawnictwo Naukowe PWN. 2006
2 A. Zagdański, A. Suchwałko Analiza i prognozowanie szeregów czasowych Wydawnictwo Naukowe PWN. 2016
3 J. Han, M. Kamber, J. Pei Data Mining: Concepts and Techniques 3rd ed. Morgan Kaufman, 2011 (można wykorzystać także poprzednie wydania). -

Wymagania wstępne w kategorii wiedzy / umiejętności / kompetencji społecznych

Wymagania formalne:
Zaliczenie 1-semestrowego przedmiotu w zakresie podstaw informatyki

Wymagania wstępne w kategorii Wiedzy:
Podstawy struktur danych i programowania

Wymagania wstępne w kategorii Umiejętności:
Pożądana znajomość podstaw technologii baz danych

Wymagania wstępne w kategorii Kompetencji społecznych:
Znajomość i przestrzeganie obowiązków studenta oraz podstawowych zasad etyki

Efekty kształcenia dla zajęć

MEK Student, który zaliczył zajęcia Formy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształcenia Metody weryfikacji każdego z wymienionych efektów kształcenia Związki z KEK Związki z PRK
MEK01 Rozumie potrzebę wstępnego przetwarzania danych a także ma podstawową wiedzę z zakresu: technik oczyszczania danych, integracji i transformacji danych oraz redukcji danych. wykład, laboratorium kolokwium, egzamin końcowy K-W01++
K-U01+
K-U07+
P7S-UW
P7S-WG
MEK02 Ma podstawową wiedzę na temat hurtowni danych i związanych z nimi modeli wielowymiarowych oraz jest w stanie przeprowadzać proste analizy OLAP na kostce danych. wykład, laboratorium kolokwium, egzamin końcowy K-W05++
K-U03+
P7S-UU
P7S-WG
MEK03 Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy asocjacji, korelacji a także analizy częstych wzorców. wykład, laboratorium kolokwium, egzamin końcowy K-W03+
K-U08+
K-U09+
P7S-UW
P7S-WG
MEK04 Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy metodą klasyfikacji, w tym indukcji drzew decyzyjnych. wykład, laboratorium kolokwium, egzamin końcowy K-U08+
P7S-UW
MEK05 Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy metodą klasteryzacji, w tym klasteryzacji metodą k-średnich. wykład, laboratorium kolokwium, egzamin końcowy K-U08+
P7S-UW
MEK06 Ma podstawową wiedzę na temat wybranych metod przeglądowej analizy danych. wykład, laboratorium kolokwium, egzamin końcowy K-W01+
K-U01++
K-U07+
P7S-UW
P7S-WG

Treści kształcenia dla zajęć

Sem. TK Treści kształcenia Realizowane na MEK
1 TK01 Wprowadzenie do odkrywania wiedzy z danych. W01-W02 MEK01 MEK02 MEK03 MEK04 MEK05
1 TK02 Problem wstępnego przetwarzania i metody czyszczenia danych W03-W04 MEK01
1 TK03 Integracja, transformacja i redukcja danych W05-W06 MEK01
1 TK04 Pojęcie i architektura hurtowni danych W07-W08 MEK01
1 TK05 Wielowymiarowy model danych. Operacje OLAP W09-W10 MEK02
1 TK06 Podstawowe pojęcia z zakresu częstych wzorców i analizy asocjacji W11-W12 MEK02
1 TK07 Metody odkrywania częstych wzorców W13-W14 MEK03
1 TK08 Przykłady zastosowań reguł asocjacyjnych W15-W16 MEK03
1 TK09 Kolokwium 1 W17-W18 MEK03
1 TK10 Podstawowe pojęcia oraz ocena modeli klasyfikacji W19-W20 MEK04
1 TK11 Indukcja drzew i reguł decyzyjnych W21-W22 MEK04
1 TK12 Podstawowe pojęcia i metody przeglądowej analizy danych W23-W24 MEK06
1 TK13 Pojęcie klasteryzacji i typy danych w kontekście wyznaczania odrębności W25-26 MEK05
1 TK14 Wybrane metody klasteryzacji W27-W28 MEK05
1 TK15 Kolokwium 2 W29-W30 MEK05
1 TK16 (i) Nauka użytkowania systemów eksploracji danych przez pracę z wybranym oprogramowaniem wspomagającym zarządzanie hurtownią danych, analizę OLAP i eksplorację danych (np. MS SQL Server Analysis Services); (ii) Realizacja wybranych funkcji eksploracji danych, jak: analiza przeglądowa, generowanie asocjacji, klasyfikacja oraz klasteryzacja przy pomocy jednego lub kilku systemów/języków udostępnianych na zasadach niekomercyjnych (np. R lub Python); (iii) Wykorzystanie przykładowych ogólnodostępnych zbiorów danych. L01-L20 MEK01 MEK02 MEK03 MEK04 MEK05

Nakład pracy studenta

Forma zajęć Praca przed zajęciami Udział w zajęciach Praca po zajęciach
Wykład (sem. 1) Przygotowanie do kolokwium: 2.00 godz./sem.
Godziny kontaktowe: 30.00 godz./sem.
Uzupełnienie/studiowanie notatek: 5.00 godz./sem.
Studiowanie zalecanej literatury: 10.00 godz./sem.
Laboratorium (sem. 1) Przygotowanie do laboratorium: 5.00 godz./sem.
Przygotowanie do kolokwium: 3.00 godz./sem.
Godziny kontaktowe: 20.00 godz./sem.
Dokończenia/wykonanie sprawozdania: 5.00 godz./sem.
Konsultacje (sem. 1) Udział w konsultacjach: 15.00 godz./sem.
Zaliczenie (sem. 1) Przygotowanie do zaliczenia: 3.00 godz./sem.
Zaliczenie pisemne: 2.00 godz./sem.

Sposób wystawiania ocen składowych zajęć i oceny końcowej

Forma zajęć Sposób wystawiania oceny podsumowującej
Wykład ocena z egzaminu końcowego
Laboratorium ocena z wykonanych prac
Ocena końcowa

Przykładowe zadania

Wymagane podczas egzaminu/zaliczenia
EKD_PrzZad.pdf

Realizowane podczas zajęć ćwiczeniowych/laboratoryjnych/projektowych
EKD_LabZad.pdf

Inne
(-)

Czy podczas egzaminu/zaliczenia student ma możliwość korzystania z materiałów pomocniczych : nie

Treści zajęć powiazane są z prowadzonymi badaniami naukowymi: tak