Навчання з підкріпленням під час проходження 2D-платформера в Unity з використанням бібліотеки MLAngents
Abstract
Розглядається задача навчання моделі здатності проходження рівнів в комп’ютерній грі жанру 2D-платформер. Основні дії в таких іграх полягають у стрибках по платформах, пересуванні сходами, збиранні предметів, поєдинках з ворогами та завершені рівня (рис. 1). В гравця є можливість ходити в на право або на ліво та стрибати. Карта стаціонарна. Рівень вважається пройденим тоді, коли гравець доходить до спеціального маркеру – домівки. За критерій навченості моделі обрано час, який потрібен для проходження рівня. Модель реалізовано нейронною мережею.
References
Сайт Unity– [Електронний ресурс]. Режим доступу: https://unity.com/
Graesser, Keng. Foundations of Deep Reinforcement Learning Theory and Practice in Python. «Основи теорії та практики навчання з глибоким підкріпленням у Python».
Сайт бібліотеки ML-Agents – [Електронний ресурс]. Режим доступу: https://unity.com/ru/products/machine-learning-agents
Сайт документації бібліотеки ML-Agents – [Електронний ресурс]. Режим доступу: https://docs.unity3d.com/Packages/com.unity.mlagents@2.0/api/Unity.MLAgents.Agent.html