Подробное описание документа
Анашкин Ю. Н.
Исследование методов классификации синтетических и реальных адресных данных / Анашкин Ю. Н., Мангутов К. Р., Лебедев А. И. // Русский инженер: II Всероссийский конгресс с международным участием. - М., 2024. -
Исследовано влияние качества искусственно сгенерированных списков почтовых адресов для обучения больших языковых моделей (LLM). Классификация выполнена путем векторизации с использованием методов машинного обучения, при этом данные разбиваются на два класса: синтетические и реальные. Исследовано применение моделей RNN, GRU и CatBoost, которые позволяют выявлять синтезированные данные и повышать точность работы LLM
004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, основанные на использовании знаний