Faculty of Technical Sciences

Subject: Principi dubokog učenja (22.EAI002)

General information:
 
Category Theoretical-methodological
Scientific or art field Telecommunications and Signal Processing
ECTS 6

Cilj predmeta je da student razume principe funkcionisanja dubokih neuronskih mreža i da se osposobi za njihovu efikasnu implementaciju pri rešavanju velikog broja praktičnih problema mašinskog učenja.

Studenti koji uspešno savladaju gradivo na predmetu umeju da samostalno: - kreiraju, obuče i primene duboke neuronske mreže različitih arhitektura nad raznorodnim podacima; - evaluiraju i analiziraju performanse modela; - modifikuju hiperparametre tako da se dobije tačniji i robustniji model; - jasno definišu, interpretiraju i diskutuju postojeće algoritme; - efikasno prate nove naučne radove i razumeju nova rešenja u oblasti dubokog učenja.

Teorijska nastava Model duboke neuronske mreže: elementi (neuron i aktivacione funkcije, parametri mreže), ciljne funkcije (kvadratno rastojanje i unakrsna entropija). Optimizacija za obuku dubokih modela: određivanje parametara mreže, algoritam propagacije unazad, algoritam gradijentnog opadanja (batch, stohastički, mini-batch), momentum, Nestorov ubrzani gradijent, Adagrad, Adadelta, RMSProp, Ada, AdaMaks, Adam, Nadam, AMSGrad. Regularizacija za duboko učenje: L1, L2 regularizaicija, dropout i razlike između njih. Konvolucione neuronske mreže: konvolucija i pomeranje po ulaznim podacima, dodavanje nula, agregacija informacija i rad s više kanala. Upoznavanje sa arhitektura koje se koriste u praksi (AlexNet, VGG (Visual Geometry Group), NiN (Network in Network), GoogLeNet, ResNet, DenseNet). Modelovanje vremenskih sekvenci: rekurentne mreže i statistički pristup preko Markovljevih modela. Obuka s povratkom u vremenu i načini efikasnog preslikavanja sekvence u sekvencu (pohlepna pretraga, iscrpna pretraga, beam search). Poređenje arhitektura savremenih rekurentnih neuronskih mreža: Gated Recurrent Units (GRU), Long Short Term Memory (LSTM) i Bidirectional Recurrent Neural Networks (BRNN). Mehanizmi pažnje u dubokom učenju odnosno matematičkom modelovanju. Neuronske mreže na grafu: podaci organizovani u graf, reprezentacija čvorova, klasifikacija čvorova, predikcije nad grafom ili delovima grafa, učenje novih veza i sl. Autoenkoderi: procena mogućnosti reprezentacije modela u zavisnosti od veličine neuronske mreže, kao i mogućnosti učenja retke reprezentacije ulaznih podataka ili uklanjanja šuma. Duboki generativni modeli: modeli za učenje raspodele višedimenzionalnih ulaznih podataka, (varijacioni i generativni autoenkoderi VAE, GAN). Metode za interpretaciju odluka (explainable AI) kao što su: interpretabilni lokalni surogati, analiza okluzija, integrirani gradijenti i propagacije relevantnosti po slojevima mreže. Praktični metodološki saveti s primerima primene: saveti za implementaciju modela i prednostima pojedinih arhitektura neuronskih mreža. Za svaku nastavnu jedinicu će se utvrditi predznanje i prilagoditi nivo i obim predavanja. Praktična nastava Cilj računarskih vežbi je da osposobe studenata za samostalnu implementaciju naučenih metoda. Biće demonstrirani svi relevantni praktični aspekti dubokog učenja – inicijalizacija, regularizacija, normalizacija, podešavanje hiperparametara, optimizacioni postupci, evaluacija. Domaći zadaci imaju za cilj da ohrabre studente da samostalno realizuju naučene metode i tako uoče potencijalne propuste u svom znanju, dok u izradi projekta treba da se primeni sinteza stečenih znanja za rešavanje izabranog realnog problema. Projekti mogu da se realizuju i kroz saradnju s privrednim subjektima, u smislu mogućnosti izbora teme, tj. konkretnog problema koji će biti rešavan.

Predavanja, računarske vežbe u odgovarajućem softveru (Python, PyTorch/TensorFlow/Keras) u cilju implementacije usvojenih teorijskih osnova, domaći zadaci kao jednostavniji problemi za samostalno rešavanje uz implementaciju, konsultacije sa predavačima, aktivno učenje kroz projekat, istraživanje i analizu novijih naučnih publikacija. Gostujuća predavanja stručnjaka iz privrede.

Authors Title Year Publisher Language
I. Goodfellow, Y. Bengio, A. Courville Deep Learning 2017 MIT Press, Cambridge English
A. Zhang, Z. Lipton, M. Li, A. Smola Dive into Deep Learning 2020 (online) English
K. Murphy Machine Learning: A Probabilistic Perspective 2012 MIT Press English
Course activity Pre-examination Obligations Number of points
Project Yes Yes 40.00
Written part of the exam - tasks and theory No Yes 30.00
Homework Yes Yes 5.00
Homework Yes Yes 5.00
Homework Yes Yes 5.00
Test Yes Yes 10.00
Homework Yes Yes 5.00
API Image

Assoc. Prof. Jakovljević Nikša

Associate Professor

Lectures
API Image

Prof. Lončar-Turukalo Tatjana

Full Professor

Lectures
API Image

Senior Science Associate Popović Branislav

viši naučni saradnik

Lectures
API Image

Asistent sa doktoratom Nosek Tijana

Assistant with PhD

Computational classes

Assistant - Master Lazić Ivan

Assistant - Master

Computational classes

Assistant - Master Šobot Srđan

Assistant - Master

Computational classes

Faculty of Technical Sciences

© 2024. Faculty of Technical Sciences.

Contact:

Address: Trg Dositeja Obradovića 6, 21102 Novi Sad

Phone:  (+381) 21 450 810
(+381) 21 6350 413

Fax : (+381) 21 458 133
Emejl: ftndean@uns.ac.rs

© 2024. Faculty of Technical Sciences.