Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья в журнале

Валишин А. А., Запривода А. В., Цухло С. С.
   Повышение эффективности обучения нейронных сетей для сегментации изображений / Валишин А. А., Запривода А. В., Цухло С. С. - DOI 10.18698/2309-3684-2025-3-103116. - URL: https://mmcm.bmstu.ru/articles/385/ (дата обращения: 23.04.2026) // Математическое моделирование и численные методы. - 2025. - № 3. - С. 103-116.

Скачать документ
Полнотекстовый документ
DOI 10.18698/2309-3684-2025-3-103116
mmcm.bmstu.ru/articles/385/

В данной статье критически анализируются современные подходы к повыше-нию эффективности обучения нейронных сетей для сегментации изображений. Под эффективностью обучения понимаются два взаимосвязанных аспекта: вычислительная эффективность и точность сегментации обученной модели. Особое внимание уделено трём способам повышения эффективности обуче-ния: 1. применение методов аугментации. Аугментация – это процесс искус-ственного генерирования новых данных на основе существующих для обучения новых моделей. Этот метод позволяет увеличить размер и разнообразие набо-ра данных, что важно для улучшения обобщающей способности модели. В дан-ном случае аугментация включала в себя повороты изображения, наложение гауссовского шума, коррекция цветовой гаммы, 2. оптимизация архитектур нейронных сетей посредством интеграции эффективных энкодеров на базе EfficientNet, 3. применение методов активного обучения для выбора наиболее информативных обучающих примеров на основе вычисления энтропии выходных данных. Модели обучались с использованием оптимизатора Adam на задаче OpenEarthMap, где выборка составляла 20 % от исходного объёма, изображения уменьшались до разрешения 512×512 пикселей и дополнительно разбивались на 4 части размером 256×256 пикселей. Обучение проводилось на 9212 изображениях обучающей выборки и 1536 изображениях валидационной выборки в течение 100 циклов обучения. Результаты экспериментов показывают, что аугментация увеличивает точность сегментации модели UNet (IoU) с 36 % до 38,7 %, оптимизация архитектуры с использованием EfficientNet-b0 и b4 повышает IoU до 44,6 % и 45,3 % соответственно, а активное обучение, основанное на вычислении энтропии, демонстрирует потенциал выравнивания IoU по классам, хотя стабильность метрик остаётся проблематичной. Данная работа подчёркивает необходимость и перспективность комплексного подхода к оптимизации нейросетевых моделей для сегментации изображений и указывает направления для дальнейших исследований в области машинного обучения и повышения вычислительной эффективности.

Статья опубликована в следующих изданиях

с. 103-116
   Журнал
   Математическое моделирование и численные методы. - ISSN 2309-3684.
   № 3. - 2025.