Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья

Большаков В. Э., Сакулин С. А., Алфимцев А. Н.
   Мультиагентное обучение с подкреплением с использованием коллективной внутренней мотивации / Большаков В. Э., Сакулин С. А., Алфимцев А. Н. - DOI 10.18698/0236-3933-2023-4-61-84 // Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - 2023. - № 4. - С. 61-84.

Скачать документ
Полнотекстовый документ
DOI 10.18698/0236-3933-2023-4-61-84
vestnikprib.bmstu.ru/catalog/icec/msoft/1311.html

Одной из серьезных проблем в обучении с подкреплением являются редкие вознаграждения от среды. Для решения этой задачи необходимы эффективные методы исследования среды. При создании таких методов исследования используются модели внутренней мотивации. Большинство задач реального мира характеризуются наличием только редких вознаграждений, однако помимо этого существуют мультиагентные среды, в которых обычные методы внутренней мотивации не дают удовлетворительных результатов. В настоящее время востребованы прикладные задачи на стыке этих двух проблем — мультиагентные среды с редкими вознаграждениями. Для решения подобных задач предложен метод CIMA, комбинирующий в себе алгоритмы мультиагентного обучения с моделями внутренней мотивации, использующий как внешнее вознаграждение от среды, так и внутреннее коллективное вознаграждение кооперативной мультиагентной системы. При этом в методе CIMA в качестве базового алгоритма обучения с подкреплением может быть использован любой нейросетевой алгоритм мультиагентного обучения. Эксперименты проведены в специально подготовленной мультиагентной среде с редкими вознаграждениям на базе SMAC, а эффективность предложенного метода обоснована в результате сравнительного анализа с современными методами мультиагентной внутренней мотивации Исследования, выполненные Сакулиным С.А. и Алфимцевым А.Н., поддержаны грантом РНФ (№ 22-21-00711) Просьба ссылаться на эту статью следующим образом: Большаков В.Э., Сакулин С.А., Алфимцев А.Н. Мультиагентное обучение с подкреплением с использованием коллективной внутренней мотивации. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение, 2023, № 4 (145), с. 61–84. DOI: https://doi.org/10.18698/0236-3933-2023-4-61-84

004.855 Обучение и индуктивный вывод

Статья опубликована в следующих изданиях

с. 61-84
   Журнал
   Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - ISSN 0236-3933 (print). - ISSN 2687-0614 (web).
   № 4. - 2023.