logo
Karta przedmiotu
logo

Eksploracja danych

Podstawowe informacje o zajęciach

Cykl kształcenia: 2020/2021

Nazwa jednostki prowadzącej studia: Wydział Elektrotechniki i Informatyki

Nazwa kierunku studiów: Informatyka

Obszar kształcenia: nauki techniczne

Profil studiów: ogólnoakademicki

Poziom studiów: drugiego stopnia

Forma studiów: stacjonarne

Specjalności na kierunku: EFA-DU - inżynieria systemów informatycznych, EFC-DU - systemy informatyki przemysłowej, EFS-DU - Systemy i sieci komputerowe

Tytuł otrzymywany po ukończeniu studiów: magister inżynier

Nazwa jednostki prowadzącej zajęcia: Katedra Informatyki i Automatyki

Kod zajęć: 1426

Status zajęć: obowiązkowy dla specjalności EFA-DU - inżynieria systemów informatycznych

Układ zajęć w planie studiów: sem: 1 / W30 L20 / 4 ECTS / Z

Język wykładowy: polski

Imię i nazwisko koordynatora: dr inż. Krzysztof Świder

Terminy konsultacji koordynatora: informacja na stronie KIiA: https://office.kia.prz.edu.pl

semestr 1: dr inż. Bartosz Jędrzejec , termin konsultacji informacja na stronie KIiA: https://office.kia.prz.edu.pl

semestr 1: dr hab. inż. prof. PRz Mariusz Oszust , termin konsultacji informacja na stronie KIiA: https://office.kia.prz.edu.pl

Cel kształcenia i wykaz literatury

Główny cel kształcenia: Zdobycie wiedzy i umiejętności w zakresie funkcjonowania, projektowania oraz użytkowania systemów analizy dużych zbiorów danych wykorzystujących hurtownie danych oraz metody eksploracji danych.

Ogólne informacje o zajęciach: W ramach przedmiotu omawiane są pojęcia, algorytmy, techniki oraz systemy wykorzystujące hurtownie danych oraz metody eksploracji danych, w tym: (1) wstępna obróbka danych, (2) projektowanie i implementacja systemów hurtowni danych i aplikacji OLAP, (3) technologia kostek danych, (4) odkrywanie częstych wzorców i asocjacji, (5) klasyfikacja oraz (6) analiza skupień (klastrów). Student powinien postrzegać eksplorację danych jako proces obejmujący fazy: rozpoznania danych, wstępnego przetwarzania, modelowania, oceny uzyskanych wzorców oraz wdrożenia wyników eksploracji.

Materiały dydaktyczne: http://prz-rzeszow.pl/~kswider/ekd

Wykaz literatury, wymaganej do zaliczenia zajęć
Literatura wykorzystywana podczas zajęć wykładowych
1 D.T. Larose Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych Wydawnictwo Naukowe PWN. 2006
2 A. Zagdański, A. Suchwałko Analiza i prognozowanie szeregów czasowych Wydawnictwo Naukowe PWN. 2016
3 J. Han, M. Kamber, J. Pei Data Mining: Concepts and Techniques, 3rd ed. Morgan Kaufman, 2011 (można wykorzystać także wczesniejsze wydania).
Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych
1 D.T. Larose Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych Wydawnictwo Naukowe PWN. 2006
2 A. Zagdański, A. Suchwałko Analiza i prognozowanie szeregów czasowych Wydawnictwo Naukowe PWN. 2016
3 J. Han, M. Kamber, J. Pei Data Mining: Concepts and Techniques 3rd ed. Morgan Kaufman, 2011 (można wykorzystać także poprzednie wydania).

Wymagania wstępne w kategorii wiedzy/umiejętności/kompetencji społecznych

Wymagania formalne: Zaliczenie 1-semestrowego przedmiotu w zakresie podstaw informatyki

Wymagania wstępne w kategorii Wiedzy: Podstawy struktur danych i programowania

Wymagania wstępne w kategorii Umiejętności: Pożądana znajomość podstaw technologii baz danych

Wymagania wstępne w kategorii Kompetencji społecznych: Znajomość i przestrzeganie obowiązków studenta oraz podstawowych zasad etyki

Efekty kształcenia dla zajęć

MEK Student, który zaliczył zajęcia Formy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształcenia Metody weryfikacji każdego z wymienionych efektów kształcenia Związki z KEK Związki z PRK
01 Rozumie potrzebę wstępnego przetwarzania danych a także ma podstawową wiedzę z zakresu: technik oczyszczania danych, integracji i transformacji danych oraz redukcji danych. wykład, laboratorium kolokwium, egzamin końcowy K_W01++
K_U01+
K_U07+
P7S_UW
P7S_WG
02 Ma podstawową wiedzę na temat hurtowni danych i związanych z nimi modeli wielowymiarowych oraz jest w stanie przeprowadzać proste analizy OLAP na kostce danych. wykład, laboratorium kolokwium, egzamin końcowy K_W05++
K_U03+
P7S_UU
P7S_WG
03 Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy asocjacji, korelacji a także analizy częstych wzorców. wykład, laboratorium kolokwium, egzamin końcowy K_W03+
K_U08+
K_U09+
P7S_UW
P7S_WG
04 Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy metodą klasyfikacji, w tym indukcji drzew decyzyjnych. wykład, laboratorium kolokwium, egzamin końcowy K_U08+
P7S_UW
05 Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy metodą klasteryzacji, w tym klasteryzacji metodą k-średnich. wykład, laboratorium kolokwium, egzamin końcowy K_U08+
P7S_UW
06 Ma podstawową wiedzę na temat wybranych metod przeglądowej analizy danych. wykład, laboratorium kolokwium, egzamin końcowy K_W01+
K_U01++
K_U07+
P7S_UW
P7S_WG

Uwaga: W zależności od sytuacji epidemicznej, jeżeli nie będzie możliwości weryfikacji osiągniętych efektów uczenia się określonych w programie studiów w sposób stacjonarny w szczególności zaliczenia i egzaminy kończące określone zajęcia będą mogły się odbywać przy użyciu środków komunikacji elektronicznej (w sposób zdalny).

Treści kształcenia dla zajęć

Sem. TK Treści kształcenia Realizowane na MEK
1 TK01 Wprowadzenie do odkrywania wiedzy z danych. W01-W02 MEK01 MEK02 MEK03 MEK04 MEK05
1 TK02 Problem wstępnego przetwarzania i metody czyszczenia danych W03-W04 MEK01
1 TK03 Integracja, transformacja i redukcja danych W05-W06 MEK01
1 TK04 Pojęcie i architektura hurtowni danych W07-W08 MEK01
1 TK05 Wielowymiarowy model danych. Operacje OLAP W09-W10 MEK02
1 TK06 Podstawowe pojęcia z zakresu częstych wzorców i analizy asocjacji W11-W12 MEK02
1 TK07 Metody odkrywania częstych wzorców W13-W14 MEK03
1 TK08 Przykłady zastosowań reguł asocjacyjnych W15-W16 MEK03
1 TK09 Kolokwium 1 W17-W18 MEK03
1 TK10 Podstawowe pojęcia oraz ocena modeli klasyfikacji W19-W20 MEK04
1 TK11 Indukcja drzew i reguł decyzyjnych W21-W22 MEK04
1 TK12 Podstawowe pojęcia i metody przeglądowej analizy danych W23-W24 MEK06
1 TK13 Pojęcie klasteryzacji i typy danych w kontekście wyznaczania odrębności W25-26 MEK05
1 TK14 Wybrane metody klasteryzacji W27-W28 MEK05
1 TK15 Kolokwium 2 W29-W30 MEK05
1 TK16 (i) Nauka użytkowania systemów eksploracji danych przez pracę z wybranym oprogramowaniem wspomagającym zarządzanie hurtownią danych, analizę OLAP i eksplorację danych (np. MS SQL Server Analysis Services); (ii) Realizacja wybranych funkcji eksploracji danych, jak: analiza przeglądowa, generowanie asocjacji, klasyfikacja oraz klasteryzacja przy pomocy jednego lub kilku systemów/języków udostępnianych na zasadach niekomercyjnych (np. R lub Python); (iii) Wykorzystanie przykładowych ogólnodostępnych zbiorów danych. L01-L20 MEK01 MEK02 MEK03 MEK04 MEK05

Nakład pracy studenta

Forma zajęć Praca przed zajęciami Udział w zajęciach Praca po zajęciach
Wykład (sem. 1) Przygotowanie do kolokwium: 2.00 godz./sem.
Godziny kontaktowe: 30.00 godz./sem.
Uzupełnienie/studiowanie notatek: 5.00 godz./sem.
Studiowanie zalecanej literatury: 10.00 godz./sem.
Laboratorium (sem. 1) Przygotowanie do laboratorium: 5.00 godz./sem.
Przygotowanie do kolokwium: 3.00 godz./sem.
Godziny kontaktowe: 20.00 godz./sem.
Dokończenia/wykonanie sprawozdania: 5.00 godz./sem.
Konsultacje (sem. 1) Udział w konsultacjach: 15.00 godz./sem.
Zaliczenie (sem. 1) Przygotowanie do zaliczenia: 3.00 godz./sem.
Zaliczenie pisemne: 2.00 godz./sem.

Sposób wystawiania ocen składowych zajęć i oceny końcowej

Forma zajęć Sposób wystawiania oceny podsumowującej
Wykład ocena z egzaminu końcowego
Laboratorium ocena z wykonanych prac
Ocena końcowa średnia ważona ocen z: kolokwium, egzaminu końcowego oraz z wykonanych prac

Przykładowe zadania

Wymagane podczas egzaminu/zaliczenia
EKD_PrzZad.pdf

Realizowane podczas zajęć ćwiczeniowych/laboratoryjnych/projektowych
EKD_LabZad.pdf

Inne
(-)

Czy podczas egzaminu/zaliczenia student ma możliwość korzystania z materiałów pomocniczych : nie

Treści zajęć powiazane są z prowadzonymi badaniami naukowymi: tak