Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья

Корлякова М. О., Васенков П. А.
   Оценка семантического сходства текстов методами машинного обучения / Корлякова М. О., Васенков П. А. // Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Всероссийской научно-технической конференции, Калуга, 19-21 ноября 2025 г. : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - 2025. - Т. 1. - С. 185-190.

Рассмотрены основные аспекты метода семантического поиска, проведен файнтюнинг модели RuBERT. Изложена концепция пуллинга для уменьшения размерности векторов. Был выбран оптимальный датасет и проведена подготовка данных. Также были выбраны и предложены метрики для анализа качества обучаемой модели. Результаты были представлены в виде таблиц, был проведен анализ, выявлены недостатки предобученной модели BERT при работе с ассиметричными данными. Написан пайплайн семантического анализа текстовой идентичности. Проведенные исследования могут быть полезны в сфере обработки естественного языка.
Ключевые слова: обработка естественного языка, машинное обучение, семантический анализ, искусственный интеллект

004.896 Искусственный интеллект в промышленных системах. Интеллектуальные САПР и АСУП. Интеллектуальные средства робототехники

Статья опубликована в следующих изданиях

с. 185-190
   Наукоёмкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе : материалы Всероссийской научно-технической конференции, Калуга, 19-21 ноября 2025 г. : в 2 т. / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - М. : Изд-во МГТУ им. Н. Э. Баумана, 2025. - ISBN 978-5-7038-6702-0.
   Т. 1. - 2025. - 495 с. : ил. - Библиогр. в конце статей. - ISBN 978-5-7038-6704-4.