POREĐENJE PERFORMANSI UPRAVLJAČKOG ALGORITMA REGULATORA PO STANJIMA SA ALGORITMOM ZASNOVANIM NA UČENJU SA POTKREPLJENJEM

  • Bojan Jorgovanović
Ključne reči: Regulator po stanjima, Mašinsko učenje, Učenje sa potkrepljenjem, dvostruko matematičko klatno

Apstrakt

U ovom radu prikazan je jedan način primene učenja sa potkrepljenjem za upravljanje mehaničkim sistemom. Izvršeno je modelovanje dvostrukog matematičkog klatna i obuka agenta koji pomoću pomenutog algoritma dovodi klatno u željeni položaj. Zatim su rezultati ovog algoritma upoređeni sa rezultatima dobijenim primenom konvencionalne regulacije po stanjima. Na kraju su izmenjeni parametri modela sa kojim je agent obučen i za koji je regulator po stanjima projektovan i upoređeni su rezultati oba upravljačka algoritma primenjena na takav model.

Reference

[1] R. Hafner / M. Riedmiller, „Reinforcement learning in feedback control,“ Machine Learning, 2011.
[2] M. Riedmiller, T. Gabel, R. Hafner / S. Lange, „Reinforcement learning for robot soccer,“ Autonomous Robots, 2009.
[3] R. S. Sutton / A. G. Barto, Reinforcement Learning: An Introduction, Cambridge, MA: MIT Press, 2018.
[4] C. Watkins / P. Dayan, „Q-Learning,“ Machine Learning, t. 8, 1992.
[5] A. Elbori, „Simulation of Double Pendulum,“ Quest Journals, Journal of Software Engineering and Simulation, 2017.
[6] W. L. Brogan, Modern Control Theory, New Jersey: Prentice Hall, 1991.
[7] H. K. Khalil, Nonlinear Systems, New Jersey: Prentice Hall, 2002.
[8] A. Kuhnle, J.-P. Kaiser, F. Theiß, N. Stricker / G. Lanza, „Designing an adaptive production control system using reinforcement learning,“ Journal of Intelligent Manufacturing, 2020.
Objavljeno
2022-11-05
Sekcija
Elektrotehničko i računarsko inženjerstvo