logo
Karta przedmiotu
logo

Uczenie się ze wzmocnieniem

Podstawowe informacje o zajęciach

Cykl kształcenia: 2024/2025

Nazwa jednostki prowadzącej studia: Wydział Elektrotechniki i Informatyki

Nazwa kierunku studiów: Informatyka

Obszar kształcenia: nauki techniczne

Profil studiów: ogólnoakademicki

Poziom studiów: pierwszego stopnia

Forma studiów: stacjonarne

Specjalności na kierunku: AA - inżynieria systemów informatycznych, AI - Sztuczna inteligencja, TT - informatyka w przedsiębiorstwie, Z - inżynieria systemów złożonych

Tytuł otrzymywany po ukończeniu studiów: inżynier

Nazwa jednostki prowadzącej zajęcia: Katedra Informatyki i Automatyki

Kod zajęć: 17920

Status zajęć: obowiązkowy dla specjalności

Układ zajęć w planie studiów: sem: 5 / W15 L15 P15 / 2 ECTS / Z

Język wykładowy: polski

Imię i nazwisko koordynatora 1: mgr inż. Dawid Kalandyk

Terminy konsultacji koordynatora: Informacja na stronie KIiA: https://office.kia.prz.edu.pl

Imię i nazwisko koordynatora 2: dr hab. inż. prof. PRz Roman Zajdel

Terminy konsultacji koordynatora: Informacja na stronie KIiA: https://office.kia.prz.edu.pl

Cel kształcenia i wykaz literatury

Główny cel kształcenia: Poznanie podstawowych zagadnień z związanych z paradygmatem uczenia się ze wzmocnieniem oraz jego zastosowania do podejmowania decyzji i zadań sterowania.

Ogólne informacje o zajęciach:

Materiały dydaktyczne: http://materialy.prz-rzeszow.pl/

Wykaz literatury, wymaganej do zaliczenia zajęć
Literatura wykorzystywana podczas zajęć wykładowych
1 Roman Zajdel Uczenie się ze wzmocnieniem w trybie epokowo inkrementacyjnym Oficyna Wydawnicza Politechniki Rzeszowskiej. 2015
2 Paweł Cichosz Systemy uczące się Wydawnictwa Naukowo-Techniczne (ISBN 83-204-2544-1). 2000
3 Richard S. Sutton and Andrew G. Barto Reinforcement Learning: An Introduction The MIT Press Cambridge, Massachusetts London, England. 2018
4 Volodymyr Mnih et al. Human-level control through deep reinforcement learning doi:10.1038/nature14236. 2015
5 Dawid Kalandyk and Tomasz Kapuściński Temporal Signed Gestures Segmentation in an Image Sequence Using Deep Reinforcement Learning Engineering Applications of Artificial Intelligence (https://doi.org/10.1016/j.engappai.2024.107879). 2024
6 Dawid Kalandyk, Bogdan Kwiatkowski and Damian Mazur CNC Machine Control Using Deep Reinforcement Learning Bulletin Of The Polish Academy Of Sciences Technical Sciences (DOI: 10.24425/bpasts.2024.148940). 2024
Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych
1 https://unity.com/products/unity-engine .
2 https://realpython.com/python-raspberry-pi/ .
3 https://www.raspberrypi.com/documentation/ .

Wymagania wstępne w kategorii wiedzy/umiejętności/kompetencji społecznych

Wymagania formalne: Student wpisany na 5 semestr studiów inżynierskich.

Wymagania wstępne w kategorii Wiedzy: Student zna podstawy obiektowego pisania programów.

Wymagania wstępne w kategorii Umiejętności: Student potrafi programować w języku Python lub Matlab, ma podstawową wiedzę w zakresie metod przetwarzania obrazu oraz algorytmiki.

Wymagania wstępne w kategorii Kompetencji społecznych: Student powinien posiadać umiejętność pracy w zespole oraz potrafić poddać krytycznej analizie na forum grupy rozwiązania proponowane przez zespół.

Efekty kształcenia dla zajęć

MEK Student, który zaliczył zajęcia Formy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształcenia Metody weryfikacji każdego z wymienionych efektów kształcenia Związki z KEK Związki z PRK
01 Zna paradygmat uczenia się ze wzmocnieniem, podstawowe pojęcia z nim związane oraz rozumie proces nauki agenta w różnego rodzaju środowiskach. wykład, laboratorium, projekt zespołowy zaliczenie cz. pisemna, zaliczenie cz. praktyczna K_W04++
K_U01+
P6S_UW
P6S_WG
02 Dla konkretnego zadania potrafi zaprojektować proces nauki wraz ze wstępnym doborem parametrów. wykład, laboratorium, projekt zespołowy zaliczenie cz. pisemna, zaliczenie cz. praktyczna K_W04++
K_W06+
K_U01+++
K_U02++
K_K07+++
P6S_KO
P6S_UW
P6S_WG
P6S_WK
03 Potrafi projektować własne rozwiązania zadań sterowania w oparciu o paradygmat uczenia się ze wzmocnieniem. Potrafi planować oraz realizować eksperymenty symulacyjne oraz rzetelnie weryfikować i analizować ich wyniki. wykład, laboratorium, projekt zespołowy sprawozdanie z projektu, prezentacja projektu K_W04++
K_U01+
K_U02+++
K_U06+++
K_K01+
K_K07+++
P6S_KK
P6S_KO
P6S_UU
P6S_UW
P6S_WG

Uwaga: W zależności od sytuacji epidemicznej, jeżeli nie będzie możliwości weryfikacji osiągniętych efektów uczenia się określonych w programie studiów w sposób stacjonarny w szczególności zaliczenia i egzaminy kończące określone zajęcia będą mogły się odbywać przy użyciu środków komunikacji elektronicznej (w sposób zdalny).

Treści kształcenia dla zajęć

Sem. TK Treści kształcenia Realizowane na MEK
5 TK01 Paradygmat uczenia się ze wzmocnieniem, wyjaśnienie podstawowych pojęć W01 MEK01
5 TK02 Algorytmy klasy TD(0) W02 MEK01 MEK02
5 TK03 Algorytm klasy TD(λ) W02 MEK01 MEK02
5 TK04 Środowisko gridowe vs. środowisko o ciągłych zmiennych stanu W03 MEK01 MEK02
5 TK05 Typy sygnału wzmocnienia, jego kształtowanie oraz wpływ na proces nauki W03 MEK01 MEK02
5 TK06 Metody aproksymacji funkcji wartości oraz funkcji wartości akcji W04, L06 MEK01 MEK02
5 TK07 Eksplorowanie środowiska vs. eksploatowanie zdobytej wiedzy W04 MEK01 MEK02
5 TK08 Analiza przykładu zastosowania algorytmu uczenia się ze wzmocnieniem do nauki poruszania się agenta w środowisku gridowym W05 MEK02 MEK03
5 TK09 Analiza przykładu zastosowania algorytmu uczenia się ze wzmocnieniem do nauki strategi wygrywającej w prostej grze 2D W05 MEK02 MEK03
5 TK10 Analiza przykładu zastosowania algorytmu uczenia się ze wzmocnieniem do nauki optymalizacji pracy maszyny CNC W06 MEK02 MEK03
5 TK11 Analiza przykładu niestandardowego podejścia – zastosowania algorytmu głębokiego uczenia się ze wzmocnieniem do zadania czasowej segmentacji ciągłego strumienia danych (sekwencja zdjęć RGB) przedstawiającego gesty Polskiego Języka Migowego W06 MEK02 MEK03
5 TK12 Analiza przykładu niestandardowego podejścia – zastosowania algorytmu głębokiego uczenia się ze wzmocnieniem do zadania autonomicznego planowania trasy łazika marsjańskiego realizującego wybrane zadania W07 MEK02 MEK03
5 TK13 Analiza działania różnych wersji algorytmu uczenia się ze wzmocnieniem (AHC, Sarsa, Q-Learning) L01, L02 MEK01 MEK02
5 TK14 Zadania "do sukcesu" oraz "do porażki" L03 MEK01 MEK02
5 TK15 Sposoby parametryzacji oraz optymalizacji procesu nauki L04 MEK01 MEK02
5 TK16 Opis stanu: dyskretny vs. ciągły L05 MEK01 MEK02
5 TK17 Realizacja wybranego przez studentów zadania sterowania robotem lub agentem w grze komputerowej zgodnie z własnym projektem w ramach dostępnych elementów i oprogramowania. P01, P02, P03, P04, P05, P06 MEK01 MEK02 MEK03

Nakład pracy studenta

Forma zajęć Praca przed zajęciami Udział w zajęciach Praca po zajęciach
Wykład (sem. 5) Godziny kontaktowe: 15.00 godz./sem.
Uzupełnienie/studiowanie notatek: 1.00 godz./sem.
Studiowanie zalecanej literatury: 3.00 godz./sem.
Laboratorium (sem. 5) Przygotowanie do laboratorium: 3.00 godz./sem.
Godziny kontaktowe: 15.00 godz./sem.
Projekt/Seminarium (sem. 5) Przygotowanie do zajęć projektowych/seminaryjnych: 3.00 godz./sem.
Godziny kontaktowe: 15.00 godz./sem..
Wykonanie projektu/dokumentacji/raportu: 3.00 godz./sem.
Konsultacje (sem. 5)
Zaliczenie (sem. 5) Przygotowanie do zaliczenia: 2.00 godz./sem.

Sposób wystawiania ocen składowych zajęć i oceny końcowej

Forma zajęć Sposób wystawiania oceny podsumowującej
Wykład Suma zdobytych punktów. (max. 20)
Laboratorium Suma zdobytych punktów. (max. 30)
Projekt/Seminarium Suma zdobytych punktów. (max. 50)
Ocena końcowa Na podstawie łącznej sumy punktów z poszczególnych modułów.

Przykładowe zadania

Wymagane podczas egzaminu/zaliczenia
(-)

Realizowane podczas zajęć ćwiczeniowych/laboratoryjnych/projektowych
(-)

Inne
(-)

Czy podczas egzaminu/zaliczenia student ma możliwość korzystania z materiałów pomocniczych : nie

Treści zajęć powiazane są z prowadzonymi badaniami naukowymi: tak

1 M. Kusy; R. Zajdel New data reduction algorithms based on the fusion of instance and feature selection 2024
2 M. Kusy; R. Zajdel A weighted wrapper approach to feature selection 2021
3 J. Kluska; M. Kusy; R. Zajdel; T. Żabiński Fusion of Feature Selection Methods for Improving Model Accuracy in the Milling Process Data Classification Problem 2020
4 J. Kluska; M. Kusy; R. Zajdel; T. Żabiński Weighted Feature Selection Method for Improving Decisions in Milling Process Diagnosis 2020