Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья

Пролетарская В. А., Григорьев Ю. А.
   Модели процессов соединения таблиц хранилища данных по технологии MapReduce/Spark / Пролетарская В. А., Григорьев Ю. А. - DOI 10.18698/0236-3933-2019-5-79-94 // Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - 2019. - № 5. - С. 79-94.

Скачать документ
Полнотекстовый документ
DOI 10.18698/0236-3933-2019-5-79-94
vestnikprib.bmstu.ru/catalog/icec/mmod/1168.html

Разработана модель и получена оценка передаваемого по сети объема данных при дублировании таблицы по узлам и с использованием фильтра Блума в среде MapReduce/Spark. Созданы модели процессов выполнения запросов на соединение таблиц базы данных при каскадном использовании фильтра Блума в этой же среде. Рассмотрены два случая соединения таблиц: 1) несколько кустов с одним измерением в каждом; 2) один куст с несколькими измерениями (хранилище типа "звезда"). Получена оценка объема фильтра Блума, передаваемого по сети при соединении таблиц. На примере запроса Q3 из теста TPC-H выполнен анализ адекватности оценки выигрыша в объеме данных, передаваемых по сети при каскадном использовании фильтра Блум. Ошибка прогнозного значения составила 2 %

004.65 Системы управления базами данных (СУБД)

Статья опубликована в следующих изданиях

с. 79-94
   Журнал
   Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - ISSN 0236-3933 (print). - ISSN 2687-0614 (web).
   № 5. - 2019.