Подробное описание документа
Горяинов В. Б.
Сравнительный анализ качества робастных модификаций метода главных компонент при сжатии коррелированных данных / Горяинов В. Б., Горяинова Е. Р. - URL: https://vestniken.bmstu.ru/catalog/math/compmath/977.html (дата обращения: 11.03.2026). - DOI 10.18698/1812-3368-2021-3-23-45 // Вестник МГТУ им. Н. Э. Баумана. Сер. Естественные науки. - 2021. - № 3. -
Одним из традиционных методов решения задачи снижения размерности многомерного вектора с коррелированными компонентами является метод главных компонент. Построение главных компонент проводится с использованием специального представления ковариационной или корреляционной матрицы наблюдаемых показателей. В классическом методе главных компонент в качестве оценок элементов корреляционной матрицы используются выборочные коэффициенты корреляции Пирсона. Эти оценки крайне чувствительны к засорению выборки и наличию аномальных наблюдений. Для робастификации метода главных компонент предложено заменить выборочные оценки корреляционных матриц известными робастными аналогами, к числу которых относятся ранговый коэффициент Спирмена, MCD-оценки, ортогонализованные оценки Гнанадесикана - Кетенринга (OGK) и оценки Олива - Хокинса. Цель работы состоит в проведении численного сравнительного анализа классического метода главных компонент и его робастных модификаций. Для этого проведено моделирование девятимерных векторов с известной структурой корреляционных матриц и введена специальная метрика, позволяющая оценивать качество сжатия данных. Обширный численный эксперимент показал, что наилучшее качество сжатия при нормальном распределении наблюдений имеет классический метод главных компонент. Когда наблюдения имеют распределение Стьюдента с тремя степенями свободы, а также при наличии в данных кластера выбросов, отдельных аномальных наблюдений или симметричных засорений, описываемых распределением Тьюки, наилучшее качество сжатия показывают оценки Гнанадесикана - Кетенринга и Олива - Хокинса модификации метода главных компонент. Качество классического метода главных компонент и ранговой модификации Спирмена в этих случаях снижается.
Ключевые слова: робастный метод главных компонент, MCD-оценка, оценка типа Гнанадесикана - Кетенринга, оценка Олива - Хокинса
519.234 Непараметрические методы
