Подробное описание документа

Аналитическое описание

Морозов К. А., Алфимцев А. Н.
Трансфер знаний для LLM-ориентированных алгоритмов машинного обучения в мультиагентных системах / Морозов К. А., Алфимцев А. Н. // Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - 2026. - № 1. - С. 80-95.

Читать онлайн

Скачать документ

Полнотекстовый документ

vestnikprib.bmstu.ru/catalog/icec/msoft/1384.html

https://vestnikprib.bmstu.ru/catalog/ice…

Аннотация

Способность больших языковых моделей справляться с интеллектуальными задачами является крайне важным навыком в различных средах, для которых требуется принимать решения на основе общедоступной информации. В обучении с подкреплением, особенно в мультиагентном, независимо от сложности среды, крайне важно на основе простых действий достигать значимых результатов, которые с точки зрения ретроспективы могли казаться невыполнимыми. Рассмотрена возможность использования большой языковой модели Mistral-7B Instruct-v0.3 для применения в задаче мультиагентного обучения с подкреплением. Разработан метод взаимодействия с Large Language Model (LLM) для использования рассуждения большой языковой модели для задачи планирования и распределения действий. Проведена оценка рефлексии большой языковой модели в результате действий, которые обозначены как необходимые для достижения поставленной в среде цели. Реализуемый трансфер знаний из LLM позволяет использовать успешные подходы для задач мультиагентного обучения с подкреплением в среде мира-сетки. Выполнено экспериментальное сравнение алгоритмов машинного обучения, которые могут эффективно взаимодействовать с предоставляемой им информацией, полученной в результате взаимодействия с большой языковой моделью. Предлагаемый метод позволяет встроить в обучение мультиагентной системы структуру рассуждения LLM
Ключевые слова мультиагентное обучение с подкреплением, большие языковые модели, машинное обучение, рассуждение

УДК
004.4 Программные средства

Авторы МГТУ

Морозов Кирилл Андреевич

Алфимцев Александр Николаевич

Статья опубликована в следующих изданиях

с. 80-95

Журнал

Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - ISSN 0236-3933 (print). - ISSN 2687-0614 (web).
№ 1. - 2026.

подробнее