Подробное описание документа
Костромина П. А.
Оптимизация работы с большими массивами данных с использованием экосистемы Hadoop / Костромина П. А., Гагарин Ю. Е. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Всероссийской научно-технической конференции, Калуга, 19-21 ноября 2025 г. : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 2. -
Рассмотрены основные аспекты оптимизации работы с большими объемами данных в экосистеме Hadoop. Эта платформа является одной из самых эффективных для обработки данных, и исследование направлено на анализ ее основных возможностей. Цель работы — проанализировать основные возможности Hadoop для распределенного хранения и обработки данных, включая изучение ключевых компонентов, таких как HDFS, MapReduce, YARN, Hive, Pig, а также их взаимосвязи и роли в повышении эффективности обработки данных. На основе исследования предлагаются выводы о потенциале Hadoop в обработке данных и его потенциале для масштабирования.
Ключевые слова: большие массивы данных, экосистема Hadoop, HDFS, MapReduce, Hive, YARN, Pig, масштабируемость, параллельная обработка данных
004.942 Исследование поведения объекта на основе его математической модели
Статья опубликована в следующих изданиях
Т. 2. - 2025. - 292 с. : ил. - Библиогр.
