• Ђорђе Марјановић
Ključne reči: дубоко учење условљавањем, аутономна возила, DDPG


У овом раду описан је систем у којем се дубоко учење условљавањем примењује на аутономно возилоу симулираном окружењу. Агент је трениран помоћу Deep deterministic policy gradient (DDPG) алгоритма, а окружење представља 3D тркачка видео иград TORCS. Након више од 200 епизода обучавања агент је успео да заврши цео круг без скретања ван стазе. DDPG алгоритам се показао веома успешно у окружењима са континуалним акцијама.


Elektrotehničko i računarsko inženjerstvo