Подробное описание документа
Модели и методы автоматической классификации текстовых документов / Андреев А. М., Березкин Д. В., Сюзев В. В., Шабанов В. И. // Вестник МГТУ им. Н. Э. Баумана. Сер. Приборостроение. - 2003. - № 4. -
Рассмотрена задача выделения терминов из текста и определения их значимости для программ обработки текстовой информации (поиска, классификации, квазиреферирования, кластеризации). Проанализированы возможные варианты решения задачи, для каждого из вариантов разработаны алгоритмы и соответствующее программное обеспечение. На примере программы автоматической классификации проведено экспериментальное сравнение методов. Наилучшие результаты получены методом приближенного выделения словосочетаний, основанным на статистической информации.
