Подробное описание документа
Левин А. О.
Анализ проблемных аспектов диффузионных моделей в сфере генерации изображений по текстовым описаниям / Левин А. О. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 2. -
Рассмотрены проблемные аспекты генерации изображений по текстовым описаниям с использованием диффузионных моделей, с фокусом на качестве воспроизведения пальцев рук и кистей. Представлен анализ факторов, влияющих на возникновение данной проблемы, включая сложность анатомии, ограничения обучающих данных, разрешения изображений и особенности алгоритмов. Делается вывод о необходимости улучшения генерации деталей рук. Предложены подходы для решения проблемы, включая использование дополнительных данных, более сложных моделей, увеличение разрешения изображений и применение методов постобработки.
Ключевые слова: генерация изображений, текстовые описания, диффузионные модели, нейронные сети
004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, основанные на использовании знаний
Статья опубликована в следующих изданиях
Т. 2. - 2025. - 457 с. : ил. - Библиогр.