Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Аналитическое описание

Морозов К. А., Алфимцев А. Н.
   Трансфер знаний для LLM-ориентированных алгоритмов машинного обучения в мультиагентных системах / Морозов К. А., Алфимцев А. Н. // Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - 2026. - № 1. - С. 80-95.

Способность больших языковых моделей справляться с интеллектуальными задачами является крайне важным навыком в различных средах, для которых требуется принимать решения на основе общедоступной информации. В обучении с подкреплением, особенно в мультиагентном, независимо от сложности среды, крайне важно на основе простых действий достигать значимых результатов, которые с точки зрения ретроспективы могли казаться невыполнимыми. Рассмотрена возможность использования большой языковой модели Mistral-7B Instruct-v0.3 для применения в задаче мультиагентного обучения с подкреплением. Разработан метод взаимодействия с Large Language Model (LLM) для использования рассуждения большой языковой модели для задачи планирования и распределения действий. Проведена оценка рефлексии большой языковой модели в результате действий, которые обозначены как необходимые для достижения поставленной в среде цели. Реализуемый трансфер знаний из LLM позволяет использовать успешные подходы для задач мультиагентного обучения с подкреплением в среде мира-сетки. Выполнено экспериментальное сравнение алгоритмов машинного обучения, которые могут эффективно взаимодействовать с предоставляемой им информацией, полученной в результате взаимодействия с большой языковой моделью. Предлагаемый метод позволяет встроить в обучение мультиагентной системы структуру рассуждения LLM
Ключевые слова мультиагентное обучение с подкреплением, большие языковые модели, машинное обучение, рассуждение

004.4 Программные средства

Статья опубликована в следующих изданиях

с. 80-95
   Журнал
   Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - ISSN 0236-3933 (print). - ISSN 2687-0614 (web).
   № 1. - 2026.