Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья

Левин А. О.
   Анализ проблемных аспектов диффузионных моделей в сфере генерации изображений по текстовым описаниям / Левин А. О. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 2. - С. 155-158.

Рассмотрены проблемные аспекты генерации изображений по текстовым описаниям с использованием диффузионных моделей, с фокусом на качестве воспроизведения пальцев рук и кистей. Представлен анализ факторов, влияющих на возникновение данной проблемы, включая сложность анатомии, ограничения обучающих данных, разрешения изображений и особенности алгоритмов. Делается вывод о необходимости улучшения генерации деталей рук. Предложены подходы для решения проблемы, включая использование дополнительных данных, более сложных моделей, увеличение разрешения изображений и применение методов постобработки.
Ключевые слова: генерация изображений, текстовые описания, диффузионные модели, нейронные сети

004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, основанные на использовании знаний

Статья опубликована в следующих изданиях

с. 155-158
   Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - М. : Изд-во МГТУ им. Н. Э. Баумана, 2025. - ISBN 978-5-7038-6513-2.
   Т. 2. - 2025. - 457 с. : ил. - Библиогр. в конце статей. - ISBN 978-5-7038-6514-9.