Подробное описание документа

Статья в журнале

Цаплин С. Т.
Анализ возможностей применения VLM для прогнозирования временных рядов / Цаплин С. Т. // Информационно - измерительные и управляющие системы. - 2026. - Т. 24, № 1. - С. 34-42.

Аннотация

Постановка проблемы. Традиционные подходы к прогнозированию временных рядов, включающие в себя статистические методы (ARIMA, SARIMA) и современные алгоритмы машинного обучения, демонстрируют определенные ограничения при работе с комплексными данными, характеризующимися нелинейными зависимостями и многофакторной обусловленностью. Несмотря на развитие методов машинного обучения и больших языковых моделей, остается актуальной задача повышения точности прогнозирования временных рядов, особенно в условиях ограниченного объема обучающих данных и необходимости учета разнородных внешних факторов. Интеграция визуально-языковых моделей (VLM) в область прогнозирования временных рядов представляет собой малоизученный инновационный подход, требующий систематического анализа его применимости и эффективности.
Цель. Оценить применимость визуально-языковых моделей (VLM) для прогнозирования временных последовательностей путем сравнительного анализа с существующими методами на основе пяти ключевых критериев: точности прогноза, вычислительной скорости, простоты применения, интерпретируемости результатов и способности эффективно учитывать разнородные внешние факторы и экзогенные переменные.
Результаты. Проведено комплексное сопоставление классических статистических подходов, алгоритмов машинного обучения и инновационных мультимодальных систем с точки зрения их результативности при обработке темпоральных данных. Выполнен сравнительный анализ четырех классов моделей, который продемонстрировал значительное превосходство VLM по точности прогнозирования: среднеквадратичная ошибка у модели Time-VLM составила 4.80 против 15.80 у классической модели ARIMA, 8.90 у LSTM и 6.50 у Time-LLM, модель VLM получила наивысшие оценки по точности прогноза (5/5 баллов) и способности эффективно интегрировать разнообразные внешние факторы (5/5 баллов). Показано, что архитектура Time-VLM, объединяющая Retrieval-Augmented Learner для обработки временных данных, Vision-Augmented Learner для преобразования числовых рядов в информативные визуальные представления и Text-Augmented Learner для генерации релевантных контекстуальных описаний, обеспечивает эффективную обработку мультимодальных данных с синергетическим эффектом. Практическая значимость. Полученные результаты определяют возможность использования VLM для принятия обоснованного выбора оптимальных методов прогнозирования в зависимости от специфики конкретной задачи, доступных вычислительных ресурсов и требований к точности предсказаний. Исследование подтверждает эффективность мультимодального подхода, объединяющего визуальную, текстовую и временную информацию, особенно в условиях ограниченного объема обучающих данных (few-shot и zero-shot обучение). Практическая значимость работы заключается в систематизации преимуществ и ограничений различных подходов к прогнозированию, что позволяет специалистам выбирать оптимальные методы для конкретных применений в экономике, финансах, промышленности и других областях. Научная новизна работы состоит в первом систематическом анализе применимости VLM для прогнозирования временных рядов. Основные ограничения VLM включают в себя высокую сложность практического применения и значительные вычислительные требования.
Ключевые слова vlm, time-vlm, time-llm, машинное обучение, arima, нейронные сети, временной ряд

УДК
004.912 Обработка текста. Подготовка текстов

Авторы МГТУ

Цаплин Сергей Тимофеевич

Статья опубликована в следующих изданиях

с. 34-42

Журнал

Информационно - измерительные и управляющие системы.
Т. 24, № 1. - 2026.

подробнее