Подробное описание документа
Жиров Д. В.
Идентификация англоязычных имен и фамилий с использованием машинного обучения и обработки естественного языка / Жиров Д. В., Иванов И. П., Андреева К. И. // Русский инженер: II Всероссийский конгресс с международным участием. - М., 2024. -
Представлены результаты исследования возможности разработки приложения для идентификации англоязычных имен и фамилий в текстах с использованием методов машинного обучения и обработки естественного языка. Изучены алгоритмы Левенштейна, n-грамм, дерево поиска по префиксам и метод случайного леса. Сравни-тельный анализ показал, что все методы имеют свои плюсы и минусы, а результаты идентификации не всегда идеальны. Предобработка данных включала токенизацию и стемминг, демонстрируя высокую точность и эффективность в большинстве случаев
004.021 Алгоритмы