Подробное описание документа
Анашкин Ю. Н.
Исследование методов классификации синтетических и реальных адресных данных / Анашкин Ю. Н., Мангутов К. Р., Лебедев А. И. // Русский инженер: : сборник тезисов 2-го Всероссийского конгресса с международным участием, Москва, 30 октября-1 ноября 2024 года / МГТУ им. Н. Э. Баумана (национальный исследовательский университет) ; вступ. сл. Гордин М. В. - М., 2024. -
Исследовано влияние качества искусственно сгенерированных списков почтовых адресов для обучения больших языковых моделей (LLM). Классификация выполнена путем векторизации с использованием методов машинного обучения, при этом данные разбиваются на два класса: синтетические и реальные. Исследовано применение моделей RNN, GRU и CatBoost, которые позволяют выявлять синтезированные данные и повышать точность работы LLM
004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, основанные на использовании знаний