logo
Karta przedmiotu
logo

Analiza danych biznesowych

Podstawowe informacje o zajęciach

Cykl kształcenia: 2024/2025

Nazwa jednostki prowadzącej studia: Wydział Elektrotechniki i Informatyki

Nazwa kierunku studiów: Informatyka

Obszar kształcenia: nauki techniczne

Profil studiów: ogólnoakademicki

Poziom studiów: pierwszego stopnia

Forma studiów: niestacjonarne

Specjalności na kierunku: AA - inżynieria systemów informatycznych, AI - Sztuczna inteligencja, TT - informatyka w przedsiębiorstwie, Z - inżynieria systemów złożonych

Tytuł otrzymywany po ukończeniu studiów: inżynier

Nazwa jednostki prowadzącej zajęcia: Katedra Elektrotechniki i Podstaw Informatyki

Kod zajęć: 12608

Status zajęć: obowiązkowy dla specjalności AI - Sztuczna inteligencja, TT - informatyka w przedsiębiorstwie

Układ zajęć w planie studiów: sem: 7 / W15 L10 P10 / 4 ECTS / Z

Język wykładowy: polski

Imię i nazwisko koordynatora: dr inż. Grzegorz Drałus

Terminy konsultacji koordynatora: http://pei.prz.edu.pl

Cel kształcenia i wykaz literatury

Główny cel kształcenia: Przekazanie studentowi umiejętności doboru i zastosowania właściwych metod analizy danych biznesowych

Ogólne informacje o zajęciach: Nauka eksploracyjnej analizy danych biznesowych przy pomocy wybranych narzędzi. Zapoznanie studentów z wybranymi możliwościami środowiska R w zakresie przetwarzania i analizy danych.

Wykaz literatury, wymaganej do zaliczenia zajęć
Literatura wykorzystywana podczas zajęć wykładowych
1 Provost F., Fawcett T. Analiza danych w biznesie Helion. 2016
2 Lander Jared P. Język R dla każdego. Zaawansowane analizy i grafika statystyczna APN Promise. 2018
3 Larose Daniel T. Metody i modele eksploracji danych PWN. 2012
4 Górecki Tomasz Podstawy statystyki z przykładami w R btc. 2011
Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych
1 Gillespie Colin, Lovelace Robin Wydajne programowanie w R. Praktyczny przewodnik po lepszym programowaniu Promise. 2018
2 Wickham Hadley, Grolemund Garrett Język R. Kompletny zestaw narzędzi dla analityków danych, Helion, 2017 Helion. 2017
3 Gągolewski. Marek Programowanie w języku R : analiza danych, obliczenia, symulacje PWN. 2016
Literatura do samodzielnego studiowania
1 Albright S.Ch., Winston W.L. Business Analytics: Data Analysis & Decision Making Cengage Learning. 2018
2 Kabacoff Rob R in Action Manning. 2010
3 Hodeghatta U.R., Nayak U. Business Analytics Using R - A Practical Approach Apress. 2017

Wymagania wstępne w kategorii wiedzy/umiejętności/kompetencji społecznych

Wymagania formalne: Podstawy statystyki matematycznej

Wymagania wstępne w kategorii Wiedzy: Wymagana jest podstawowa wiedza w dziedzinie informatyki i narzędzi informatycznych oraz statystyki matematycznej

Wymagania wstępne w kategorii Umiejętności: Umiejętność racjonalnego myślenia.

Wymagania wstępne w kategorii Kompetencji społecznych: Ma świadomość odpowiedzialności za własną pracę.

Efekty kształcenia dla zajęć

MEK Student, który zaliczył zajęcia Formy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształcenia Metody weryfikacji każdego z wymienionych efektów kształcenia Związki z KEK Związki z PRK
01 Przyswoił składnię i mechanizmy języka R. Zna charakterystykę oraz mocne i słabe słabe strony języka R. Zna podstawowe pakiety do analizy danych w języku R. Student zna możliwości środowiska R w zakresie przetwarzania i analizy danych. wykład, laboratorium, projekt zaliczenie cz. pisemna K_W04++
K_U06++
K_K01++
P6S_KK
P6S_UU
P6S_UW
P6S_WG
02 Student potrafi zastosować środowisko R do tworzenia różnorodnych analiz w zakresie metod i modeli statystycznych. Potrafi wykorzystać dostępne biblioteki. Potrafi zaprezentować wyniki w postaci graficznej i raportów. wykład, laboratorium, projekt zaliczenie cz. pisemna, zadania na laboratorium, realizacja zadania projektowego K_U08++
K_K02++
P6S_KK
P6S_KO
P6S_UU
P6S_UW
03 Zna w sposób pogłębiony metody i narzędzia, w tym techniki pozyskiwania, przetwarzania i analizy danych, prezentacji danych i raportowania, pozwalające opisywać i analizować podmioty i procesy biznesowe. wykład, laboratorium, projekt zaliczenie cz. pisemna, zadania na laboratorium, realizacja zadań projektowych K_U08++
K_K01++
P6S_KK
P6S_UU
P6S_UW
04 Potrafi właściwie dobierać i używać metody i narzędzia analizy danych biznesowych. Potrafi analizować przyczyny i przebieg konkretnych procesów. Potrafi prawidłowo ocenia jakość informacji uzyskanych w wyniku modelowania, potrafi ocenić jakość zbudowanego modelu. wykład, laboratorium, prijekt zaliczenie cz. pisemna, zaliczenie cz. praktyczna, wykonanie zadań projektowych K_U06++
K_U08+
K_K02+
P6S_KK
P6S_KO
P6S_UU
P6S_UW

Uwaga: W zależności od sytuacji epidemicznej, jeżeli nie będzie możliwości weryfikacji osiągniętych efektów uczenia się określonych w programie studiów w sposób stacjonarny w szczególności zaliczenia i egzaminy kończące określone zajęcia będą mogły się odbywać przy użyciu środków komunikacji elektronicznej (w sposób zdalny).

Treści kształcenia dla zajęć

Sem. TK Treści kształcenia Realizowane na MEK
7 TK01 Środowisko R i program RStudio. Syntaktyka i semantyka języka R. Podstawowe operacje. Import danych z różnych formatów. Skale pomiarowe a typy danych w R, operatory, zmienne, instrukcje warunkowe, pętle, funkcje. W01, L01 MEK01
7 TK02 Podstawowe komendy - statystyka opisowa i matematyczna. Podstawowe przetwarzanie danych (nowe zmienne, filtry, łączenie ramek). Metody uzupełniania dla brakujących danych. Anomalie w dane – brakujące obserwacje; duplikaty; obserwacje odstające; błędy w formatach. Czyszczenie danych z wykorzystaniem Dplyr oraz Tidyr. W02, L01 MEK01 MEK02
7 TK03 Dane typu tibble z użyciem pakietu tibble; Importowanie danych za pomocą pakietu readr; Transformacje i dyskretyzacja zmiennych. Źródła danych: pobieranie danych z baz (sqlite); web scraping; pobieranie danych do R (Google Trends, Eurostat etc.). Redukcja wymiarów z wykorzystaniem analizy głównych składowych (PCA), W03, L02 MEK01 MEK02
7 TK04 Wprowadzenie do pakietów ggplot2 i eksploracyjnej analizy danych, Grafika w R – podstawowa oraz zaawansowana prezentacja graficzna danych. Publikowanie raportów wprost z R – wprowadzenie do R-Markdown (notebook; prezentacje – R oraz HTML slidy; PDF etc.). Dane relacyjne z wykorzystaniem pakietu dplyr; Przetwarzanie napisów za pomocą pakietu stringr. Wprowadzenie do metod eksploracyjnych analiz danych; Obszary zastosowań; Stosowane narzędzia; Omówienie skal pomiarowych. Zadania analizy danych. Wstępna graficzna analiza danych. W04, L03 MEK01 MEK02 MEK03
7 TK05 Wprowadzenie do biznesowych systemów analitycznych, stosowane narzędzia analityczne, zarządzanie analitycznymi bazami danych. Metody przygotowania danych do analizy. Miary statystyki opisowej. Badanie zależności między zmiennymi liczbowymi, miary współzależności, współczynniki kowariancji i korelacji. W05 MEK03
7 TK06 Metody regresyjne. Ocena wiarygodności modelu regresji. Liniowa regresja wysokowymiarowa,: metody Lasso, Selekcja cech. Nieliniowa regresja parametryczna. Niskowymiarowe metody nieparametryczne estymacji regresji, Metody wysokowymiarowe estymacji regresji. Analiza danych jakościowych. Test chi-2 - wykorzystanie do testowania zgodności rozkładów, W05, W06, L04 MEK03 MEK04
7 TK07 Analiza wariancji ANOVA jako podstawowa metoda identyfikacji czynników; Idea, cel i zastosowania analizy wariancji; algorytm obliczeniowy. (Jednoczynnikowa i wieloczynnikowa analiza wariancji). Problemy klasyfikacyjne: klasyfikacja obiektów i cech; Analiza skupień: cel, istota, algorytm wyznaczania z przykładami i zastosowaniem; Metody klasyfikacji: naiwny klasyfikator Bayesa, k-NN. W06, W07, L05 MEK03 MEK04
7 TK08 Wprowadzenie do analiz czynnikowych (FA); Algorytmy obliczeniowe w korelacji i regresji; Wyznaczanie korelacji cząstkowych. Model Składowych Głównych (PCA); Algorytmy identyfikacji modelu analizy składowych głównych; Implementacje numeryczne; Przykłady zastosowań w przedsiębiorstwie. Model PCA w funkcji prognozy ostrzegawczej; Różnice w analizie czynnikowej i składowych głównych; Istota rozwiązania. W08, L05 MEK03 MEK04

Nakład pracy studenta

Forma zajęć Praca przed zajęciami Udział w zajęciach Praca po zajęciach
Wykład (sem. 7) Przygotowanie do kolokwium: 5.00 godz./sem.
Godziny kontaktowe: 15.00 godz./sem.
Uzupełnienie/studiowanie notatek: 10.00 godz./sem.
Studiowanie zalecanej literatury: 10.00 godz./sem.
Laboratorium (sem. 7) Przygotowanie do laboratorium: 10.00 godz./sem.
Godziny kontaktowe: 10.00 godz./sem.
Dokończenia/wykonanie sprawozdania: 10.00 godz./sem.
Projekt/Seminarium (sem. 7) Przygotowanie do zajęć projektowych/seminaryjnych: 5.00 godz./sem.
Godziny kontaktowe: 10.00 godz./sem..
Wykonanie projektu/dokumentacji/raportu: 12.00 godz./sem.
Przygotowanie do prezentacji: 2.00 godz./sem.
Konsultacje (sem. 7) Przygotowanie do konsultacji: 1.00 godz./sem.
Udział w konsultacjach: 1.00 godz./sem.
Zaliczenie (sem. 7) Przygotowanie do zaliczenia: 7.00 godz./sem.
Zaliczenie pisemne: 2.00 godz./sem.

Sposób wystawiania ocen składowych zajęć i oceny końcowej

Forma zajęć Sposób wystawiania oceny podsumowującej
Wykład Zaliczenie pisemne w formie testu.
Laboratorium Oceny ze sprawozdań. Ocena końcowa to średnia z uzyskanych ocen.
Projekt/Seminarium Oceny z wykonanych zadań projektowych.
Ocena końcowa Ocena końcowa z przedmiotu obliczana według wzoru: 0.3 oceny z wykładu + 0.35 oceny z laboratorium = 0.35 oceny z projektu

Przykładowe zadania

Wymagane podczas egzaminu/zaliczenia
(-)

Realizowane podczas zajęć ćwiczeniowych/laboratoryjnych/projektowych
(-)

Inne
(-)

Czy podczas egzaminu/zaliczenia student ma możliwość korzystania z materiałów pomocniczych : nie

Treści zajęć powiazane są z prowadzonymi badaniami naukowymi: tak

1 G. Drałus; G. Karnas; G. Masłowski Identification of cloud-to-ground lightning and intra-cloud lightning based on their radiated electric field signatures using different types of neural networks and machine learning classifiers 2024
2 G. Drałus Metody śledzenia punktu MPP modułu fotowoltaicznego 2023
3 G. Drałus; J. Drałus; J. Kusznier; D. Mazur Application of Artificial Intelligence Algorithms in Multilayer Perceptron and Elman Networks to Predict Photovoltaic Power Plant Generation 2023
4 A. Czmil; G. Drałus; D. Mazur Automatic Detection and Counting of Blood Cells in Smear Images Using RetinaNet 2021
5 G. Dec; G. Drałus; B. Kwiatkowski; D. Mazur Forecasting Models of Daily Energy Generation by PV Panels Using Fuzzy Logic 2021
6 G. Drałus; T. Rak Prognozowanie w horyzoncie jednej godziny produkcji energii przez panel fotowoltaiczny 2020
7 G. Drałus; T. Rak Programowanie równoległe w hybrydowym środowisku MPI i OpenMP na klastrze serwerów 2020