Подробное описание документа
Величко Н. А.
Distributed Multiagent Reinforcement Learning Based on DDPG / Величко Н. А. // Наука, технологии и бизнес : материалы 6-ой Межвузовской конференции аспирантов, соискателей и молодых учёных, Москва, 16-18 апреля 2024 года / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - М., 2024. -
Предложен алгоритм распределенного мультиагентного обучения с подкреплением на основе DDPG. Представлены обучение с подкреплением и особенности мультиагентного обучения с подкреплением. Рассмотрено распределенное обучение подкреплением. Приведены существующие алгоритмы распределенного обучения с подкреплением. Описаны компоненты обучения в распределенном обучении с подкреплением. Рассмотрены преимущества и недостатки существующих алгоритмов. Предложен новый алгоритм распределенного мультиагентного обучения с подкреплением. Для проведения тестирования выбрана среда SMAC способная проверить все необходимые аспекты. Выбраны цели для тестирования и поставлен результат для их достижения. Продемонстрированы результаты тестирования, по итогам которых определены успешность работы алгоритма, достижение успехов в обучении и взаимодействия агентов со средой. Проделанная работа является доказательством успешности распределенного обучения с подкреплением в мультиагентных средах. Сеть на базе глубокого детерминированного градиента стратегий отлично подходит для внедрения в распределенное обучение с подкреплением и улучшает работу алгоритма, а также уменьшает время на обучение.
Ключевые слова: нейронные сети, мультиагентное обучение с подкреплением, распределенное обучение с подкреплением
004.8 Искусственный интеллект