logo
Karta przedmiotu
logo

Analiza danych biznesowych

Podstawowe informacje o zajęciach

Cykl kształcenia: 2024/2025

Nazwa jednostki prowadzącej studia: Wydział Elektrotechniki i Informatyki

Nazwa kierunku studiów: Informatyka

Obszar kształcenia: nauki techniczne

Profil studiów: ogólnoakademicki

Poziom studiów: pierwszego stopnia

Forma studiów: stacjonarne

Specjalności na kierunku: AA - inżynieria systemów informatycznych, AI - Sztuczna inteligencja, TT - informatyka w przedsiębiorstwie, Z - inżynieria systemów złożonych

Tytuł otrzymywany po ukończeniu studiów: inżynier

Nazwa jednostki prowadzącej zajęcia: Katedra Elektrotechniki i Podstaw Informatyki

Kod zajęć: 15861

Status zajęć: obowiązkowy dla specjalności TT - informatyka w przedsiębiorstwie

Układ zajęć w planie studiów: sem: 6 / W25 L15 P15 / 4 ECTS / Z

Język wykładowy: polski

Imię i nazwisko koordynatora: dr inż. Grzegorz Drałus

Cel kształcenia i wykaz literatury

Główny cel kształcenia: Przekazanie studentowi umiejętności doboru i zastosowania właściwych metod analizy danych biznesowych

Ogólne informacje o zajęciach: Nauka eksploracyjnej analizy danych biznesowych przy pomocy wybranych narzędzi. Zapoznanie studentów z wybranymi możliwościami środowiska R w zakresie przetwarzania i analizy danych.

Wykaz literatury, wymaganej do zaliczenia zajęć
Literatura wykorzystywana podczas zajęć wykładowych
1 Foreman John W. Mistrz analizy danych. Od danych do wiedzy Helion. 2023
2 F. Provost, T. Fawcett Analiza danych w biznesie Helion. 2016
3 Lander Jared P. Język R dla każdego. Zaawansowane analizy i grafika statystyczna APN Promise. 2018
4 Górecki Tomasz Podstawy statystyki z przykładami w R Wydawnictwo btc. 2011
Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych
1 Gillespie Colin, Lovelace Robin Wydajne programowanie w R. Praktyczny przewodnik po lepszym programowaniu Promise. 2018
2 Wickham Hadley, Grolemund Garrett Język R. Kompletny zestaw narzędzi dla analityków danych Helion. 2017
3 Gągolewski. Marek Programowanie w języku R : analiza danych, obliczenia, symulacje PWN. 2016
Literatura do samodzielnego studiowania
1 Christian Albright S.Ch., Winston W.L. Business Analytics: Data Analysis & Decision Making Cengage Learning. 2018
2 Hodeghatta U.R., Nayak U. Business Analytics Using R - A Practical Approach Apress. 2017

Wymagania wstępne w kategorii wiedzy/umiejętności/kompetencji społecznych

Wymagania formalne: Podstawy statystyki matematycznej

Wymagania wstępne w kategorii Wiedzy: Wymagana jest podstawowa wiedza w dziedzinie informatyki i narzędzi informatycznych oraz statystyki matematycznej

Wymagania wstępne w kategorii Umiejętności: Umiejętność programowania i racjonalnego myślenia.

Wymagania wstępne w kategorii Kompetencji społecznych: Znajomość i przestrzeganie obowiązków studenta oraz podstawowych zasad etyki.

Efekty kształcenia dla zajęć

MEK Student, który zaliczył zajęcia Formy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształcenia Metody weryfikacji każdego z wymienionych efektów kształcenia Związki z KEK Związki z PRK
01 Przyswoił składnię i mechanizmy języka R. Zna charakterystykę oraz mocne i słabe słabe strony języka R. Zna podstawowe pakiety do analizy danych w języku R. Student zna możliwości środowiska R w zakresie przetwarzania i analizy danych. wykład, laboratorium, projekt zaliczenie cz. pisemna, K_W01++
K_W04+
K_K01+
P6S_KK
P6S_UU
P6S_WG
02 Student potrafi zastosować środowisko R do tworzenia różnorodnych analiz w zakresie metod i modeli statystycznych. Potrafi wykorzystać dostępne biblioteki. Potrafi zaprezentować wyniki w postaci graficznej i raportów. wykład, laboratorium, projekt zaliczenie cz. pisemna, zadania na laboratorium, realizacja zadania projektowego K_U01+++
K_U06++
K_K05++
P6S_KO
P6S_UK
P6S_UW
03 Zna w sposób pogłębiony metody i narzędzia, w tym techniki pozyskiwania, przetwarzania i analizy danych, prezentacji danych i raportowania, pozwalające opisywać i analizować podmioty i procesy biznesowe. wykład, laboratorium, projekt zaliczenie cz. pisemna, zadania na laboratorium, realizacja zadań projektowych K_W01++
K_W04+
K_K01+
P6S_KK
P6S_UU
P6S_WG
04 Potrafi właściwie dobierać i używać metody i narzędzia analizy danych biznesowych. Potrafi analizować przyczyny i przebieg konkretnych procesów. Potrafi prawidłowo ocenia jakość informacji uzyskanych w wyniku modelowania, potrafi ocenić jakość zbudowanego modelu. wykład, laboratorium, projekt zaliczenie cz. pisemna, zaliczenie cz. praktyczna, wykonanie zadań projektowych K_U01+++
K_U06++
K_K05++
P6S_KO
P6S_UK
P6S_UW

Uwaga: W zależności od sytuacji epidemicznej, jeżeli nie będzie możliwości weryfikacji osiągniętych efektów uczenia się określonych w programie studiów w sposób stacjonarny w szczególności zaliczenia i egzaminy kończące określone zajęcia będą mogły się odbywać przy użyciu środków komunikacji elektronicznej (w sposób zdalny).

Treści kształcenia dla zajęć

Sem. TK Treści kształcenia Realizowane na MEK
6 TK01 Środowisko R i program RStudio. Syntaktyka i semantyka języka R. Podstawowe operacje. Import danych z różnych formatów. Skale pomiarowe a typy danych w R, operatory, zmienne, instrukcje warunkowe, pętle, funkcje. W01, L01 MEK01
6 TK02 Podstawowe komendy - statystyka opisowa i matematyczna. Podstawowe przetwarzanie danych (nowe zmienne, filtry, łączenie ramek). Metody uzupełniania dla brakujących danych. Anomalie w dane – brakujące obserwacje; duplikaty; obserwacje odstające; błędy w formatach. Czyszczenie danych z wykorzystaniem Dplyr oraz Tidyr. W02, L01 MEK01 MEK02
6 TK03 Dane typu tibble z użyciem pakietu tibble; Importowanie danych za pomocą pakietu readr; Transformacje i dyskretyzacja zmiennych. Źródła danych: pobieranie danych z baz (sqlite); web scraping; pobieranie danych do R (Google Trends, Eurostat etc.). Redukcja wymiarów z wykorzystaniem analizy głównych składowych (PCA), W03, L02 MEK01 MEK02
6 TK04 Wprowadzenie do pakietów ggplot2 i eksploracyjnej analizy danych, Grafika w R – podstawowa oraz zaawansowana prezentacja graficzna danych. W04, L03 MEK01 MEK02
6 TK05 Publikowanie raportów wprost z R – wprowadzenie do R-Markdown (notebook; prezentacje – R oraz HTML slidy; PDF etc.). Dane relacyjne z wykorzystaniem pakietu dplyr; Przetwarzanie napisów za pomocą pakietu stringr. W05, L03 MEK01 MEK02
6 TK06 Wprowadzenie do metod eksploracyjnych analiz danych; Obszary zastosowań; Stosowane narzędzia; Omówienie skal pomiarowych. Zadania analizy danych. Tworzenie szeregów rozdzielczych oraz histogramów. Wstępna graficzna analiza danych. W06, L04 MEK03 MEK04
6 TK07 Wprowadzenie do biznesowych systemów analitycznych, stosowane narzędzia analityczne, zarządzanie analitycznymi bazami danych. Metody przygotowania danych do analizy. Miary statystyki opisowej. Badanie zależności między zmiennymi liczbowymi, miary współzależności, współczynniki kowariancji i korelacji. W07, L04 MEK02 MEK03 MEK04
6 TK08 Metody regresyjne. Ocena wiarygodności modelu regresji. Liniowa regresja wysokowymiarowa: metody Lasso, Selekcja cech. Nieliniowa regresja parametryczna. W08, L05 MEK02 MEK03 MEK04
6 TK09 Niskowymiarowe metody nieparametryczne estymacji regresji, Metody wysokowymiarowe estymacji regresji. Analiza danych jakościowych. Test chi-2 - wykorzystanie do testowania zgodności rozkładów, W09, L05 MEK03 MEK04
6 TK10 Analiza wariancji ANOVA jako podstawowa metoda identyfikacji czynników; Idea, cel i zastosowania analizy wariancji; algorytm obliczeniowy. (Jednoczynnikowa i wieloczynnikowa analiza wariancji). W10, L06 MEK03 MEK04
6 TK11 Problemy klasyfikacyjne: klasyfikacja obiektów i cech; Analiza skupień: cel, istota, algorytm wyznaczania z przykładami i zastosowaniem; Metody klasyfikacji: naiwny klasyfikator Bayesa, k-NN. W11, L06 MEK03 MEK04
6 TK12 Wprowadzenie do analiz czynnikowych (FA); Algorytmy obliczeniowe w korelacji i regresji; Wyznaczanie korelacji cząstkowych. Model Składowych Głównych (PCA); Algorytmy identyfikacji modelu analizy składowych głównych; Implementacje numeryczne; Przykłady zastosowań w przedsiębiorstwie. W12, L07 MEK03 MEK04
6 TK13 Model PCA w funkcji prognozy ostrzegawczej; Różnice w analizie czynnikowej i składowych głównych; Istota rozwiązania. W13, L07 MEK03 MEK04

Nakład pracy studenta

Forma zajęć Praca przed zajęciami Udział w zajęciach Praca po zajęciach
Wykład (sem. 6) Przygotowanie do kolokwium: 5.00 godz./sem.
Godziny kontaktowe: 25.00 godz./sem.
Uzupełnienie/studiowanie notatek: 5.00 godz./sem.
Studiowanie zalecanej literatury: 10.00 godz./sem.
Laboratorium (sem. 6) Przygotowanie do laboratorium: 5.00 godz./sem.
Godziny kontaktowe: 15.00 godz./sem.
Dokończenia/wykonanie sprawozdania: 10.00 godz./sem.
Projekt/Seminarium (sem. 6) Godziny kontaktowe: 15.00 godz./sem..
Wykonanie projektu/dokumentacji/raportu: 13.00 godz./sem.
Przygotowanie do prezentacji: 2.00 godz./sem.
Konsultacje (sem. 6) Przygotowanie do konsultacji: 1.00 godz./sem.
Udział w konsultacjach: 2.00 godz./sem.
Zaliczenie (sem. 6) Przygotowanie do zaliczenia: 4.00 godz./sem.
Zaliczenie pisemne: 2.00 godz./sem.

Sposób wystawiania ocen składowych zajęć i oceny końcowej

Forma zajęć Sposób wystawiania oceny podsumowującej
Wykład Testy po wykładach, zaliczenie pisemne.
Laboratorium Oceny ze sprawozdań oraz zadań.
Projekt/Seminarium Oceny z wykonanych zadań projektowych.
Ocena końcowa Ocena końcowa z przedmiotu obliczana według wzoru: 0.3 oceny z wykładu + 0.35 oceny z laboratorium = 0.35 oceny z projektu

Przykładowe zadania

Wymagane podczas egzaminu/zaliczenia
(-)

Realizowane podczas zajęć ćwiczeniowych/laboratoryjnych/projektowych
(-)

Inne
(-)

Czy podczas egzaminu/zaliczenia student ma możliwość korzystania z materiałów pomocniczych : nie

Treści zajęć powiazane są z prowadzonymi badaniami naukowymi: tak

1 G. Drałus Metody śledzenia punktu MPP modułu fotowoltaicznego 2023
2 G. Drałus; J. Drałus; J. Kusznier; D. Mazur Application of Artificial Intelligence Algorithms in Multilayer Perceptron and Elman Networks to Predict Photovoltaic Power Plant Generation 2023
3 A. Czmil; G. Drałus; D. Mazur Automatic Detection and Counting of Blood Cells in Smear Images Using RetinaNet 2021
4 G. Dec; G. Drałus; B. Kwiatkowski; D. Mazur Forecasting Models of Daily Energy Generation by PV Panels Using Fuzzy Logic 2021
5 G. Drałus; T. Rak Prognozowanie w horyzoncie jednej godziny produkcji energii przez panel fotowoltaiczny 2020
6 G. Drałus; T. Rak Programowanie równoległe w hybrydowym środowisku MPI i OpenMP na klastrze serwerów 2020