Подробное описание документа
Валишин А. А.
Моделирование и сравнительный анализ эффективности перцептивных хеш-функций для поиска сегментированных изображений / Валишин А. А., Запривода А. В., Цухло С. С. // Математическое моделирование и численные методы. - 2024. - № 2. -
В статье исследуется применение перцептивных хеш-функций для повышения эффективности поиска изображений аэрофотосъемки и спутникового дистанционного зондирования, сегментированных свёрточной нейронной сетью. Анализируются три алгоритма хеширования. Первый алгоритм основан на использовании низкочастотного фильтра и направлен на уменьшение детализации изображения с целью выделения наиболее устойчивых признаков изображения. Второй алгоритм использует двумерное дискретно-косинусное преобразование для создания хеша изображения. Третий алгоритм основан на преобразовании Радона, которое позволяет извлечь информацию о направлениях линий на изображении, а также обеспечить максимальную инвариантность к преобразованию на вращение входного изображения. В статье проводится тестирование данных алгоритмов, включающее анализ их инвариантности к преобразованиям на вращение, масштабирование и сдвиг исходного изображения. Результаты тестирования показывают, что алгоритм, основанный на преобразовании Радона, проявляет хорошую инвариантность к вращению, однако он чувствителен к качеству сегментации, что может привести к частым коллизиям при поиске схожих изображений. Более стабильными и имеющими меньший разброс значений оказались алгоритмы с использованием двумерного дискретно-косинусного преобразования и алгоритм с применением низкочастотного фильтра. Однако следует отметить, что алгоритмы, использующие низкочастотный фильтр и двумерное дискретно-косинусное преобразование, могут оказаться неприменимыми в случае повернутых изображений. По результатам анализа и сравнения производительности алгоритмов, рекомендуется отдать предпочтение либо второму, либо третьему алгоритму, т.к. каждый из них имеет свои достоинства и недостатки и решение о применении конкретного алгоритма в задаче поиска максимально схожего изображения, необходимо учитывать конкретные условия и ограничения задачи, а также требования к качеству сравнения изображений.
Ключевые слова машинное зрение, перцептивное хеширование, семантическая сегментация, дискретно-косинусное преобразование, преобразование Радона
519.7 Математическая кибернетика
