logo
Karta przedmiotu
logo

Data science

Podstawowe informacje o zajęciach

Cykl kształcenia: 2024/2025

Nazwa jednostki prowadzącej studia: Wydział Elektrotechniki i Informatyki

Nazwa kierunku studiów: Automatyka i robotyka

Obszar kształcenia: nauki techniczne

Profil studiów: praktyczny

Poziom studiów: drugiego stopnia

Forma studiów: stacjonarne

Specjalności na kierunku: Przemysłowe systemy sterowania

Tytuł otrzymywany po ukończeniu studiów: magister inżynier

Nazwa jednostki prowadzącej zajęcia: Katedra Informatyki i Automatyki

Kod zajęć: 12154

Status zajęć: obowiązkowy dla programu Przemysłowe systemy sterowania

Układ zajęć w planie studiów: sem: 3 / W30 L15 / 3 ECTS / E

Język wykładowy: polski

Imię i nazwisko koordynatora 1: dr inż. Krzysztof Świder

Imię i nazwisko koordynatora 2: dr inż. Bartosz Jędrzejec

Cel kształcenia i wykaz literatury

Główny cel kształcenia: Zdobycie wiedzy i umiejętności w zakresie użytkowania i projektowania nowoczesnych systemów informacyjnych z wykorzystaniem metod uczenia maszynowego do analizy dużych zbiorów danych.

Ogólne informacje o zajęciach: W ramach przedmiotu omawiane są pojęcia, algorytmy i systemy z zakresu przetwarzania, wizualizacji i analizy dużych zbiorów danych z wykorzystaniem metod uczenia maszynowego. Student który zaliczył przedmiot powinien postrzegać data science (badanie danych) jako proces obejmujący zgromadzenie, poznanie i przygotowanie danych, a także ich analizę oraz ocenę i wdrożenie uzyskanych wyników.

Materiały dydaktyczne: http://prz-rzeszow.pl/~kswider/ekd

Wykaz literatury, wymaganej do zaliczenia zajęć
Literatura wykorzystywana podczas zajęć wykładowych
1 J. Han, M. Kamber, J. Pei Data Mining: Concepts and Techniques, 3rd ed. Morgan Kaufman, 2011 (można wykorzystać także wczesniejsze wydania).
2 B. Lantz Machine Learning with R. Second Edition Packt Publishing Ltd.. 2015
3 D.T. Larose Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych Wydawnictwo Naukowe PWN. 2006
Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych
1 B. Lantz Machine Learning with R. Second Edition Packt Publishing Ltd.. 2015
2 Adam Pelikant Hurtownie danych. Od przetwarzania analitycznego do raportowania Helion. 2012
3 Scott L Cameron Microsoft SQL Server 2008 Analysis Services Krok po kroku Promise. 2016

Wymagania wstępne w kategorii wiedzy/umiejętności/kompetencji społecznych

Wymagania formalne: Zaliczenie 1-semestrowego przedmiotu w zakresie podstaw informatyki

Wymagania wstępne w kategorii Wiedzy: Wymagana znajomość wybranych zagadnień matematyki w tym podstaw statystyki.

Wymagania wstępne w kategorii Umiejętności: Pożądana znajomość podstaw technologii baz danych i programowania.

Wymagania wstępne w kategorii Kompetencji społecznych: Znajomość i przestrzeganie obowiązków studenta oraz podstawowych zasad etyki

Efekty kształcenia dla zajęć

MEK Student, który zaliczył zajęcia Formy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształcenia Metody weryfikacji każdego z wymienionych efektów kształcenia Związki z KEK Związki z PRK
01 Zdobył podstawową wiedzę dotyczącą ewolucji nowoczesnych technologii gromadzenia i zarządzania informacją oraz rozumie ideę wspomagania decyzji na podstawie analizy danych. wykład test pisemny K_W04+
K_K01++
K_K06+
P7S_KK
P7S_KR
P7S_WG
02 Poznał istotę i metody, analizy przeglądowej oraz możliwości praktycznego wykorzystania wybranych miar statystyki opisowej w poznawaniu danych. wykład, laboratorium kolokwium, test pisemny K_W06++
K_U06+
P7S_UW
P7S_WG
03 Poznał wybrane techniki wstępnej obróbki danych umożliwiające: oczyszczanie, integrację, transformacje oraz redukcję danych. wykład, laboratorium kolokwium, test pisemny K_W06++
K_U06+
P7S_UW
P7S_WG
04 Ma podstawową wiedzę na temat hurtowni danych i związanych z nimi modeli wielowymiarowych oraz jest w stanie przeprowadzać proste analizy OLAP. wykład, laboratorium kolokwium, test pisemny K_W06++
K_U06+
P7S_UW
P7S_WG
05 Ma podstawową wiedzę na temat pojęć i technik z zakresu regresji i klasyfikacji, w tym indukcji drzew decyzyjnych. wykład, laboratorium kolokwium, test pisemny K_U06++
P7S_UW
06 Ma podstawową wiedzę na temat pojęć i technik grupowania, w tym klasteryzacji metodą k-średnich. wykład, laboratorium kolokwium, test pisemny K_W06++
K_U06+
P7S_UW
P7S_WG
07 Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy asocjacji, w tym generowania częstych wzorców. wykład, laboratorium kolokwium, test pisemny K_W06++
K_U06+
P7S_UW
P7S_WG
08 Ma podstawową wiedzę na temat możliwości praktycznego zastosowania wybranych metod uczenia maszynowego w systemach wytwarzania. wykład, laboratorium kolokwium, test pisemny K_W03+
K_U04+
K_U05+
K_U06++
P7S_UW
P7S_WG

Uwaga: W zależności od sytuacji epidemicznej, jeżeli nie będzie możliwości weryfikacji osiągniętych efektów uczenia się określonych w programie studiów w sposób stacjonarny w szczególności zaliczenia i egzaminy kończące określone zajęcia będą mogły się odbywać przy użyciu środków komunikacji elektronicznej (w sposób zdalny).

Treści kształcenia dla zajęć

Sem. TK Treści kształcenia Realizowane na MEK
3 TK01 Analiza danych i systemy wspomagania decyzji w działalności przedsiębiorstw. Ewolucja systemów zarządzania dużymi zbiorami danych. Techniki analizowania danych. Czym jest nauka o danych (Data Science)? W01-W03 MEK01
3 TK02 Analiza przeglądowa i poznawanie danych. Wybrane elementy środowiska obliczeniowego R. Podstawowe struktury danych. Praca z plikami. Poznawanie zmiennych numerycznych i wybrane miary statystyki opisowej. Wykresy pudełkowe i histogramy. Poznawanie zmiennych kategorialnych. W04-W10 MEK02
3 TK03 Wstępne przetwarzanie danych. Podstawowe czynniki mające wpływ na jakość analizowanych danych: dokładność, kompletność, spójność, punktualność, wiarygodność i przejrzystość. Wybrane techniki wstępnej obróbki: czyszczenie, integracja, transformacja i redukcja danych. W11-W12 MEK03
3 TK04 Praca z danymi pochodzącymi ze źródeł zewnętrznych. Czytanie oraz zapisywanie danych do arkuszy MS Excel i innych źródeł komercyjnych. Dane pochodzące z baz SQL. Praca z danymi w formatach XML i JSON. Analiza i wizualizacja struktur sieciowych. W13-W14 MEK01
3 TK05 Bazy danych i hurtownie danych. Model wielowymiarowy: hierarchie i miary. Operacje OLAP. Ogólny schemat architektury hurtowni danych. Etapy opracowania hurtowni danych. Narzędzia klasy Business Intelligence. W15-W16 MEK04
3 TK06 Projektowanie hurtowni danych. Modelowanie konceptualne i logiczne. Operowanie na danych wielowymiarowych przy pomocy języka MDX. Implementacja i wdrożenie hurtowni danych. Ekstrakcja, transformacja i ładowanie danych. W17-W18 MEK04
3 TK07 Odkrywanie częstych wzorców i analiza asocjacji. Pojęcia podstawowe. Odkrywanie wzorców zachowań na przykładzie analizy koszyka zakupów z wykorzystaniem reguł asocjacyjnych. Definicja reguły asocjacyjnej. Miary atrakcyjności reguł - wsparcie i zaufanie. Prezentacja przykładu. W19-W20 MEK07
3 TK08 Prognozowanie danych numerycznych - metody regresji. Budowanie modeli na podstawie danych. Pojęcie regresji. Prosty model regresji liniowej. Omówienie przykładu zastosowania wielokrotnej regresji liniowej. Poznawanie i przygotowanie danych. Uczenie modelu. Ocena i poprawa jakości modelu. W21-W24 MEK05
3 TK09 Podstawowe pojęcia i metody klasyfikacji. Indukcja drzew decyzyjnych. Prezentacja przykładu pokazującego działanie algorytmu CART do generowania zrównoważonych binarnych drzew decyzyjnych na przykładzie niewielkiego zbioru danych uczących. W25-W26 MEK05
3 TK10 Klasteryzacja - wyodrębnianie charakterystycznych grup. Wyznaczanie odrębności i uczenie nienadzorowane. Algorytm klasteryzacji metodą k-średnich. Wykorzystanie odległości do wyznaczania i korekty klastrów. Problem wyboru odpowiedniej ilości klastrów. Prezentacja przykładu. W27-W28 MEK06
3 TK11 Zastosowanie metod uczenia maszynowego w zarządzaniu produkcją. Korzyści i wyzwania.Techniki i algorytmy. Obszary zastosowań uczenia nadzorowanego w systemach wytwarzania. W29-W30 MEK08
3 TK12 Nauka użytkowania nowoczesnych systemów zarządzania, analizy i wizualizacji danych, tym: (i) Praca z wybranym oprogramowaniem wspomagającym zarządzanie hurtownią danych, analizę OLAP (np. MS SQL Server Analysis Services); (ii) Realizacja wybranych funkcji eksploracji danych, jak: generowanie asocjacji, klasyfikacja oraz klasteryzacja przy pomocy jednego lub kilku systemów/języków udostępnianych na zasadach niekomercyjnych (np. R lub Python); (iii) Wykorzystanie przykładowych ogólnodostępnych zbiorów danych. L01-L15 MEK02 MEK04 MEK05 MEK06 MEK07

Nakład pracy studenta

Forma zajęć Praca przed zajęciami Udział w zajęciach Praca po zajęciach
Wykład (sem. 3) Przygotowanie do kolokwium: 4.00 godz./sem.
Godziny kontaktowe: 30.00 godz./sem.
Uzupełnienie/studiowanie notatek: 5.00 godz./sem.
Studiowanie zalecanej literatury: 10.00 godz./sem.
Laboratorium (sem. 3) Przygotowanie do laboratorium: 10.00 godz./sem.
Przygotowanie do kolokwium: 3.00 godz./sem.
Godziny kontaktowe: 15.00 godz./sem.
Dokończenia/wykonanie sprawozdania: 10.00 godz./sem.
Konsultacje (sem. 3) Przygotowanie do konsultacji: 1.00 godz./sem.
Udział w konsultacjach: 1.00 godz./sem.
Egzamin (sem. 3)

Sposób wystawiania ocen składowych zajęć i oceny końcowej

Forma zajęć Sposób wystawiania oceny podsumowującej
Wykład ocena z testu pisemnego
Laboratorium ocena z kolokwium i wykonanych prac
Ocena końcowa średnia ważona ocen z: kolokwium, testu pisemnego oraz z wykonanych prac.

Przykładowe zadania

Wymagane podczas egzaminu/zaliczenia
EKD_PrzZad.pdf

Realizowane podczas zajęć ćwiczeniowych/laboratoryjnych/projektowych
EKD_LabZad.pdf

Inne
(-)

Czy podczas egzaminu/zaliczenia student ma możliwość korzystania z materiałów pomocniczych : nie

Treści zajęć powiazane są z prowadzonymi badaniami naukowymi: tak