Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья

Горяинов В. Б., Горяинова Е. Р.
   Сравнительный анализ качества робастных модификаций метода главных компонент при сжатии коррелированных данных / Горяинов В. Б., Горяинова Е. Р. - URL: https://vestniken.bmstu.ru/catalog/math/compmath/977.html (дата обращения: 11.03.2026). - DOI 10.18698/1812-3368-2021-3-23-45 // Вестник МГТУ им. Н. Э. Баумана. Сер. Естественные науки. - 2021. - № 3. - С. 23-45.

Скачать документ
Полнотекстовый документ
DOI 10.18698/1812-3368-2021-3-23-45
vestniken.bmstu.ru/catalog/math/compmath/977.html

Одним из традиционных методов решения задачи снижения размерности многомерного вектора с коррелированными компонентами является метод главных компонент. Построение главных компонент проводится с использованием специального представления ковариационной или корреляционной матрицы наблюдаемых показателей. В классическом методе главных компонент в качестве оценок элементов корреляционной матрицы используются выборочные коэффициенты корреляции Пирсона. Эти оценки крайне чувствительны к засорению выборки и наличию аномальных наблюдений. Для робастификации метода главных компонент предложено заменить выборочные оценки корреляционных матриц известными робастными аналогами, к числу которых относятся ранговый коэффициент Спирмена, MCD-оценки, ортогонализованные оценки Гнанадесикана - Кетенринга (OGK) и оценки Олива - Хокинса. Цель работы состоит в проведении численного сравнительного анализа классического метода главных компонент и его робастных модификаций. Для этого проведено моделирование девятимерных векторов с известной структурой корреляционных матриц и введена специальная метрика, позволяющая оценивать качество сжатия данных. Обширный численный эксперимент показал, что наилучшее качество сжатия при нормальном распределении наблюдений имеет классический метод главных компонент. Когда наблюдения имеют распределение Стьюдента с тремя степенями свободы, а также при наличии в данных кластера выбросов, отдельных аномальных наблюдений или симметричных засорений, описываемых распределением Тьюки, наилучшее качество сжатия показывают оценки Гнанадесикана - Кетенринга и Олива - Хокинса модификации метода главных компонент. Качество классического метода главных компонент и ранговой модификации Спирмена в этих случаях снижается.
Ключевые слова: робастный метод главных компонент, MCD-оценка, оценка типа Гнанадесикана - Кетенринга, оценка Олива - Хокинса

519.234 Непараметрические методы

Статья опубликована в следующих изданиях

с. 23-45
   Журнал
   Вестник МГТУ им. Н. Э. Баумана. Сер. Естественные науки. - ISSN 1812-3368 (print). - ISSN 2686-8768 (web).
   № 3. - 2021.