Подробное описание документа
Корлякова М. О.
Оценка семантического сходства текстов методами машинного обучения / Корлякова М. О., Васенков П. А. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Всероссийской научно-технической конференции, Калуга, 19-21 ноября 2025 г. : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 1. -
Рассмотрены основные аспекты метода семантического поиска, проведен файнтюнинг модели RuBERT. Изложена концепция пуллинга для уменьшения размерности векторов. Был выбран оптимальный датасет и проведена подготовка данных. Также были выбраны и предложены метрики для анализа качества обучаемой модели. Результаты были представлены в виде таблиц, был проведен анализ, выявлены недостатки предобученной модели BERT при работе с ассиметричными данными. Написан пайплайн семантического анализа текстовой идентичности. Проведенные исследования могут быть полезны в сфере обработки естественного языка.
Ключевые слова: обработка естественного языка, машинное обучение, семантический анализ, искусственный интеллект
004.896 Искусственный интеллект в промышленных системах. Интеллектуальные САПР и АСУП. Интеллектуальные средства робототехники
Статья опубликована в следующих изданиях
Т. 1. - 2025. - 495 с. : ил. - Библиогр.
