Герб МГТУ им. Н.Э. БауманаНаучно-техническая библиотека МГТУ им. Н.Э. Баумана

Подробное описание документа

   Статья

Жиров Д. В., Иванов И. П., Андреева К. И.
   Идентификация англоязычных имен и фамилий с использованием машинного обучения и обработки естественного языка / Жиров Д. В., Иванов И. П., Андреева К. И. // Русский инженер: II Всероссийский конгресс с международным участием. - М., 2024. - С. 83-84.

Представлены результаты исследования возможности разработки приложения для идентификации англоязычных имен и фамилий в текстах с использованием методов машинного обучения и обработки естественного языка. Изучены алгоритмы Левенштейна, n-грамм, дерево поиска по префиксам и метод случайного леса. Сравни-тельный анализ показал, что все методы имеют свои плюсы и минусы, а результаты идентификации не всегда идеальны. Предобработка данных включала токенизацию и стемминг, демонстрируя высокую точность и эффективность в большинстве случаев

004.021 Алгоритмы

Статья опубликована в следующих изданиях

с. 83-84
   Русский инженер: II Всероссийский конгресс с международным участием. - М. : Изд-во МГТУ им. Н. Э. Баумана, 2024. - [402] с. - ISBN 978-5-7038-6447-0.