Подробное описание документа
Захаров Е. А.
Генерация фильмов с помощью искусственного интеллекта / Захаров Е. А., Белов Ю. С. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Региональной научно-технической конференции (Калуга, 23 - 25 апреля 2024 года) : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 2. -
Мультимодальные модели сталкиваются с трудностями в понимании длинных видео из-за сложности и разнообразия данных. MovieLLM предлагает новую структуру, которая использует модели преобразования текста в изображение и GPT-4 для создания высококачественных синтетических данных для длинных видеороликов. Предоставляя подробные сценарии и визуальные эффекты, этот подход помогает улучшить производительность мультимодальных моделей, преодолевая проблему предвзятости и нехватки существующих наборов данных.
Ключевые слова: искусственный интеллект, GPT, визуализация текста, машинное обучение, мультимодальные модели
004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, основанные на использовании знаний
Статья опубликована в следующих изданиях
Т. 2. - 2025. - 457 с. : ил. - Библиогр.