Подробное описание документа
Каташинский К. Ю.
Анализ подходов и методов по извлечению текстовых данных / Каташинский К. Ю. // Управление качеством инженерного образования: перспективы искусственного интеллекта : материалы 3-ей Международной конференции, посвящённой 70-летию кафедры ИУ6, Москва, 30 октября-2 ноября 2023 года / МГТУ им. Н. Э. Баумана (национальный исследовательский университет). - М., 2024. -
В работе были рассмотрены подходы и методы по извлечению текстовых данных. В результате анализа было выявлено, что в настоящее время применяются 3 основных подхода (основанный на правилах, основанный на машинном обучении и гибридный). При этом было выявлено, что системы извлечения данных, использующие инженерный подход, опираются в своей работе на лингвистические шаблоны и правила, а также словарные ресурсы. При этом в системах, основанных на машинном обучении, чаще всего используется обучение с учителем. В статье были рассмотрены методы, применяющиеся в рамках этого подхода. В результате было сделано заключение, что лучшие результаты показывает метод опорных векторов.
Ключевые слова: подходы, интеллектуальные методы, извлечение данных, машинное обучение
004 Информационные технологии. Вычислительная техника. Теория, технология и применения вычислительных машин и систем.