Подробное описание документа
Чжу Хан
Совместное планирование траекторий динамических объектов на основе обучения с подкреплением / Чжу Хан, Пэн Сыкунь, Селезнева М. С. // Авиакосмическое приборостроение. - 2025. - № 8. -
В данной работе разработана визуальная среда для обучения с подкреплением на основе алгоритма SAC (Soft Actor-Critic), направленная на эффективное совместное планирование траектории беспилотных летательных судов (БЛС) и беспилотных автомобилей. Экспериментальные результаты подтверждают, что обученная система успешно планирует маршрут к целевому пункту, эффективно избегая препятствий на пути. Алгоритм SAC демонстрирует высокую гибкость, адаптируясь к различному числу БЛС, и превосходит по эффективности случайную стратегию и алгоритм MADDPG (Multi-Agent Deep Deterministic Policy Gradient), что обеспечивает синергию в действиях агентов.
Ключевые слова БЛС, беспилотный автомобиль, обучение с подкреплением, планирование траекторий, гетерогенная система, процесс Маркова
656.025 Перевозки пассажиров и грузов