logo
Karta przedmiotu
logo

Wielowymiarowa analiza danych

Podstawowe informacje o zajęciach

Cykl kształcenia: 2019/2020

Nazwa jednostki prowadzącej studia: Wydział Budowy Maszyn i Lotnictwa

Nazwa kierunku studiów: Zarządzanie i inżynieria produkcji

Obszar kształcenia: nauki techniczne

Profil studiów: ogólnoakademicki

Poziom studiów: drugiego stopnia

Forma studiów: niestacjonarne

Specjalności na kierunku: Automatyzacja produkcji, Ekologia produkcji, Nowoczesne metody zarządzania produkcją, Nowoczesne technologie informacyjno-komunikacyjne w przedsiębiorstwie

Tytuł otrzymywany po ukończeniu studiów: magister inżynier

Nazwa jednostki prowadzącej zajęcia: Zakład Informatyki

Kod zajęć: 6323

Status zajęć: obowiązkowy dla specjalności Nowoczesne technologie informacyjno-komunikacyjne w przedsiębiorstwie

Układ zajęć w planie studiów: sem: 3 / W15 L20 / 4 ECTS / E

Język wykładowy: polski

Imię i nazwisko koordynatora: dr hab. inż. prof. PRz Galina Setlak

Cel kształcenia i wykaz literatury

Główny cel kształcenia: Celem kształcenia jest przekazanie studentom wiedzy z zakresu podstaw teoretycznych wybranych metod wielowymiarowej analizy oraz wykształcenie umiejętności zastosowania poznanych metod do rozwiązywania praktycznych problemów w tym zakresie. Poza tym celem jest poznanie przez studentów metod i technik tworzenia hurtowni danych (HD) jako środowisko do wielowymiarowej analizy oraz analitycznego przetwarzanie danych na bieżąco OLAP (On-line Analitical Processing).

Ogólne informacje o zajęciach: Przedmiot jest obowiązkowy na specjalności "Nowoczesne technologie informacyjno-komunikacyjne"

Materiały dydaktyczne: Na stronach WWW molech.sd.prz.edu.pl

Wykaz literatury, wymaganej do zaliczenia zajęć
Literatura wykorzystywana podczas zajęć wykładowych
1 D.Medrala, M. Szeliga Microsoft SQL Server. Modelowanie i eksploracja danych Helion, Gliwice. 2012
2 Patrick LeBlanc Microsoft SQL Server 2012. Krok po kroku APN Promise, Warszawa . 2013
3 Foster Provost, Tom Fawcett Analiza danych w biznesie. Sztuka podejmowania skutechnych decyzji Helion S.A., Gliwice. 2015
4 Doug Harts Microsoft Office 2007 Business Intelligence. Raporty, analizy i pomiary APN PROMISE, Warszawa. 2008
Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych
1 Alexander M., Decker J., B. Wehbe Analizy Business Intelligence. Zaawansowane wykorzystywanie Excela Helion, Gliwice. 2014
2 Marco Russo, A. Ferrari, C. Webb Microsoft SQL Server 2012. Analysis Services APN Promise, Warszawa. 2012
3 Stacia Misner Microsoft SQL Server 2012. Reporting Services APN Promise, Warszawa. 2013
Literatura do samodzielnego studiowania
1 Morzy T. Eksploracja danych. Metody i algorytmy Wydawnictwo anukowe PWN. 2013

Wymagania wstępne w kategorii wiedzy/umiejętności/kompetencji społecznych

Wymagania formalne: Student musi być zarejestrowany na drugi semestr studiów magisterskich

Wymagania wstępne w kategorii Wiedzy: Student powinien posiadać wiedzę w zakresie Informatyki, baz danych oraz Podstaw sztucznej inteligencji.

Wymagania wstępne w kategorii Umiejętności: Wymagane jest posiadanie umiejętności obsługi oprogramowania takiego, jak MS Excel, MATLAB oraz MS Office.

Wymagania wstępne w kategorii Kompetencji społecznych: Umiejętność samodzielnego poszerzania swojej wiedzy i doskonalenia umiejętności zawodowych

Efekty kształcenia dla zajęć

MEK Student, który zaliczył zajęcia Formy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształcenia Metody weryfikacji każdego z wymienionych efektów kształcenia Związki z KEK Związki z PRK
01 Posiada uporządkowaną wiedzę z zakresu metod wielowymiarowej analizy danych i zna ich zalety i ograniczenia, sytuacje, w których mogą być stosowane oraz możliwe alternatywy, ponadto potrafi dobrać właściwą analizę wielowymiarową do rozważanego problemu, weryfikując spełnienie koniecznych założeń oraz posiada umiejętność poprawnego wnioskowania na podstawie przeprowadzonych analiz. wykład, laboratorium, laboratorium problemowe, zaliczenie cz. praktyczna, egzamin cz. pisemna K_W04+
K_U09+++
P7S_UW
P7S_WG
02 Potrafi na podstawie wykonanych analiz danych opracować odpowiednie wnioski i raporty w celu wspomagania decyzji menedżerskich wykład, laboratorium zaliczenie cz. pisemna, egzamin cz. pisemna K_W04++
K_U09+++
P7S_UW
P7S_WG
03 Zna podstawowe metody wielowymiarowych analiz danych, technologie OLAP, niezbędne do analiz danych biznesowych i produkcyjnych oraz potrafi je wykorzystywać do rozwiązywania zadań wykład, laboratorium zaliczenie cz. praktyczna, egzamin cz. pisemna, egzamin cz. praktyczna K_W01+
K_U09++
P7S_UW
P7S_WG
04 Uzyskanie wiedzy z zakresu podstaw teoretycznych wybranych metod analizy wielowymiarowej oraz wykształcenie umiejętności zastosowania poznanych metod do rozwiązywania praktycznych problemów w tym zakresie. wykład, laboratorium, laboratorium problemowe zaliczenie cz. praktyczna, egzamin cz. pisemna K_W04++
K_U09+++
P7S_UW
P7S_WG
05 Potrafi właściwie interpretować uzyskane wyniki w ramach analiz wielowymiarowych oraz zastosować odpowiednie metody analizy wielowymiarowej w odniesieniu do określonych problemów ekonomicznych. wykład, laboratorium egzamin cz. pisemna, zaliczenie cz. praktyczna, zaliczenie cz. pisemna, egzamin cz. praktyczna K_W04+
K_U09++
P7S_UW
P7S_WG

Uwaga: W zależności od sytuacji epidemicznej, jeżeli nie będzie możliwości weryfikacji osiągniętych efektów uczenia się określonych w programie studiów w sposób stacjonarny w szczególności zaliczenia i egzaminy kończące określone zajęcia będą mogły się odbywać przy użyciu środków komunikacji elektronicznej (w sposób zdalny).

Treści kształcenia dla zajęć

Sem. TK Treści kształcenia Realizowane na MEK
3 TK01 Współczesne narzędzia do wielowymiarowej analizy danych i raportowania. Hurtownia danych jako środowisko do wielowymiarowej analizy i eksploracji danych. Pojęcia podstawowe: wielowymiarowy model danych, tabele faktów, wymiarów, miary, kostki wielowymiarowe, agregacje, metadane. WO1 MEK01 MEK04
3 TK02 Architektura hurtowni danych. Źródła danych i ich rodzaje. Moduły HD. Modele danych w hurtowni. Narzędzia programowe umożliwiające integrację BD. Zarządzanie i optymalizacja pamięci w HD.. Wielowymiarowe, relacyjne i hybrydowe modele danych stosowane w hurtowni. Techniki ETL (Extraction, Transformation and Loading). Administrowanie hurtownią danych. Planowanie i projektowanie systemu analitycznego przedsiębiorstwa. W02 MEK01 MEK03
3 TK03 Usługi analityczne. Aspekty teoretyczne i praktyczne przetwarzania danych: OLTP (Online Transaction Processing) i Online Analytical Processing - OLAP. Analityczne przetwarzanie na bieżąco OLAP. Projektowanie systemu OLAP. W03 MEK03 MEK04
3 TK04 Wielowymiarowe kostki OLAP. Integracja HD z arkuszem kalkulacyjnym. Wybór źródła danych, tworzenie interfejsu użytkownika. Prezentacja graficzna wyników. Architektura MS SQL Server Analysis Services. Wielowymiarowa analiza OLAP w MS SQL Server 2008 R2. W04 MEK03 MEK05
3 TK05 Wielowymiarowe analizy statystyczne: Wieloczynnikowa analiza wariancji.Analiza kowariancji. Analiza kanoniczna. Analiza dyskryminacji. Analiza składowych głównych i analiza czynnikowa. W05 MEK01 MEK02
3 TK06 Analiza skupień. Podstawowe pojęcia odległości taksonomicznej, miary i odległości. Techniki grupowania: aglomeracyjne i podziałowe. Metody skupiania: metoda K-średnich, medianowa, metoda minimalnej wariancji. Rozmyta metoda analizy skupień. W06, W07 MEK01 MEK02 MEK04 MEK05
3 TK07 Model relacyjny a model wielowymiarowy. Model płatka gwiazdy, płatka śniegu i konstelacji faktów. Problemy wydzielania, transformacji i ładowania. Główne problemy hurtowni danych. Selekcja. Oczyszczanie. Wzbogacanie. Kodowanie (transformacja). Raportowanie. LO1 MEK01 MEK04
3 TK08 Instalacja serwera bazodanowego "MS SQL Server 2008 R2 Enterprise". Podstawowe elementy serwera bazodanowego. Wstępna analiza wymagań dotyczących instalacji serwera bazodanowego. Instalacja serwera. Podstawowe funkcjonalności MS SQL Sever 2008 R2: "SQL Server Configuration Manager" , "SQL Server Management Studio (SSMS)" , "SQL server Reporting Services (SSRS)" , "SQL Server Analysis Services (SSAS)". (tworzenie konta usługi dla serwera, instalacja i konfiguracja serwera, instalacja przykładowych baz danych.) L02, L03, MEK01 MEK03
3 TK09 Podstawy obsługi SQL Server 2008 R2 z wykorzystaniem "SQL Server Management Studio": Wprowadzenie do pakietu SSMS - interfejs graficzny aplikacji, systemowe bazy danych 2. Zarządzanie bazami danych za pomocą SSMS: a. tworzenie nowej bazy danych b. modyfikacja ustawień baz danych, tworzenie kopii zapasowej bazy danych c. usuwanie bazy danych, przywracanie bazy danych z kopii zapasowej 3. Podstawy języka t- SQL a. operacje selekcji i projekcji b. zarządzanie tabelami c. modyfikowanie danych. LO5, L06 MEK01 MEK03 MEK04
3 TK10 Analysis Services in Microsoft SQL Server 2008 R2 Instalacja i konfiguracja usługi "Analysis Services" , Instalacja przykładowej bazy danych. Tworzenie projektu rozwiązania BI: definicja nowego projektu, definicja źródeł danych, tworzenie i przeglądanie widoku źródeł danych, modyfikowanie widoku źródła danych (dodawanie kluczy podstawowych i relacji, tworzenie obszaru diagramu tematycznego, dodawanie nazwanych obliczeń, tworzenie nazwanego zapytania.) Podstawy projektowania rozwiązania BI: tworzenie wymiarów, tworzenie i modyfikowanie kostki. L07, L08 MEK01 MEK03 MEK05
3 TK11 Reporting Services in Microsoft SQL Server 2008 R2 : Usługa raportowania w MS SQL Server 2008 R2. Instalacja i konfiguracja usługi. Instalacja. przykładowych raportów na serwerze bazodanowym. Przegląd przykładowego raportu opublikowanego na serwerze. Tworzenie i publikowanie raportów z wykorzystaniem pakietu "Report Builder 3.0". Kolokwium zaliczeniowe L09, L10 MEK02 MEK05

Nakład pracy studenta

Forma zajęć Praca przed zajęciami Udział w zajęciach Praca po zajęciach
Wykład (sem. 3) Przygotowanie do kolokwium: 15.00 godz./sem.
Godziny kontaktowe: 15.00 godz./sem.
Uzupełnienie/studiowanie notatek: 10.00 godz./sem.
Studiowanie zalecanej literatury: 5.00 godz./sem.
Laboratorium (sem. 3) Przygotowanie do laboratorium: 10.00 godz./sem.
Przygotowanie do kolokwium: 5.00 godz./sem.
Godziny kontaktowe: 20.00 godz./sem.
Dokończenia/wykonanie sprawozdania: 5.00 godz./sem.
Konsultacje (sem. 3) Udział w konsultacjach: 2.00 godz./sem.
Egzamin (sem. 3) Przygotowanie do egzaminu: 10.00 godz./sem.
Egzamin pisemny: 2.00 godz./sem.
Inne: 1.00 godz./sem.

Sposób wystawiania ocen składowych zajęć i oceny końcowej

Forma zajęć Sposób wystawiania oceny podsumowującej
Wykład Kolokwium pisemne polega na udzieleniu odpowiedzi na trzy pytania dotyczące treści prezentowanych na zajęciach wykładowych. Poprawna odpowiedź na pytanie pozwala uzyskać 3 punkty. Częściowo poprawna lub niepełna odpowiedź pozwala uzyskać proporcjonalnie mniejszą liczbę punktów. Zdobyta przez studenta liczba punktów jest dzielona przez 9 i przekształcana na wartość procentową. Przyjęto następującą skalę ocen: ndst - do 50%, dst - 51% - 60%, dst+ - 61% - 70%, db - 71% - 80%, db+ - 81% - 90%, bdb - powyżej 90%
Laboratorium Kolokwium zaliczeniowe realizowane jest przy komputerze i polega na rozwiązaniu trzech zadań dotyczących wykorzystania języka SQL w pakiecie Microsoft Sql Server. Poprawna odpowiedź na pytanie pozwala uzyskać 4 punkty. Częściowo poprawna lub niepełna odpowiedź pozwala uzyskać proporcjonalnie mniejszą liczbę punktów. Zdobyta przez studenta liczba punktów jest dzielona przez 12 i przekształcana na wartość procentową. Przyjęto następującą skalę ocen: ndst - do 50%, dst - 51% - 60%, dst+ - 61% - 70%, db - 71% - 80%, db+ - 81% - 90%, bdb - powyżej 90%
Ocena końcowa Ocena końcowa z przedmiotu wyliczana jest jako średnia arytmetyczna oceny uzyskanej z zaliczenia części wykładowej oraz laboratoryjnej.

Przykładowe zadania

Wymagane podczas egzaminu/zaliczenia
WAD_K_Lab.pdf

Realizowane podczas zajęć ćwiczeniowych/laboratoryjnych/projektowych
(-)

Inne
(-)

Czy podczas egzaminu/zaliczenia student ma możliwość korzystania z materiałów pomocniczych : nie

Treści zajęć powiazane są z prowadzonymi badaniami naukowymi: tak

1 Ł. Paśko; G. Setlak Random Forests in a Glassworks: Knowledge Discovery from Industrial Data 2020
2 Ł. Paśko; M. Piróg; G. Setlak Pozyskiwanie wiedzy z danych przemysłowych do wspomagania decyzji w procesie produkcyjnym 2019