Подробное описание документа
Жиров Д. В.
Идентификация англоязычных имен и фамилий с использованием машинного обучения и обработки естественного языка / Жиров Д. В., Иванов И. П., Андреева К. И. // Русский инженер: : сборник тезисов 2-го Всероссийского конгресса с международным участием, Москва, 30 октября-1 ноября 2024 года / МГТУ им. Н. Э. Баумана (национальный исследовательский университет) ; вступ. сл. Гордин М. В. - М., 2024. -
Представлены результаты исследования возможности разработки приложения для идентификации англоязычных имен и фамилий в текстах с использованием методов машинного обучения и обработки естественного языка. Изучены алгоритмы Левенштейна, n-грамм, дерево поиска по префиксам и метод случайного леса. Сравни-тельный анализ показал, что все методы имеют свои плюсы и минусы, а результаты идентификации не всегда идеальны. Предобработка данных включала токенизацию и стемминг, демонстрируя высокую точность и эффективность в большинстве случаев
004.021 Алгоритмы