Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья

Захаров Е. А., Белов Ю. С.
   Генерация фильмов с помощью искусственного интеллекта / Захаров Е. А., Белов Ю. С. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 2. - С. 126-128.

Мультимодальные модели сталкиваются с трудностями в понимании длинных видео из-за сложности и разнообразия данных. MovieLLM предлагает новую структуру, которая использует модели преобразования текста в изображение и GPT-4 для создания высококачественных синтетических данных для длинных видеороликов. Предоставляя подробные сценарии и визуальные эффекты, этот подход помогает улучшить производительность мультимодальных моделей, преодолевая проблему предвзятости и нехватки существующих наборов данных.
Ключевые слова: искусственный интеллект, GPT, визуализация текста, машинное обучение, мультимодальные модели

004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, основанные на использовании знаний

Статья опубликована в следующих изданиях

с. 126-128
   Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - М. : Изд-во МГТУ им. Н. Э. Баумана, 2025. - ISBN 978-5-7038-6513-2.
   Т. 2. - 2025. - 457 с. : ил. - Библиогр. в конце статей. - ISBN 978-5-7038-6514-9.