Гулин, В. В.
    Методы снижения размерности признакового описания документов в задаче классификации текстов [Текст] / В. В. Гулин // Вестник Московского энергетического института. - 2013. - № 2. - С. 115-121 . - ISSN 1993-6982
УДК
ББК 22.161.1
Рубрики: Математика
   Дифференциальные и интегральные исчисления в целом

Кл.слова (ненормированные):
адабуст -- выделение признаков -- классификация текстов -- машинное обучение -- метод главных компонент -- метод градиентного бус-тинга -- невнимательные деревья решений -- отбор признаков -- самоорганизующиеся карты -- случайный лес деревьев решений
Аннотация: Задача классификации текстовых документов рассматривается по отношению к машинному обучению. В работе предлагается метод снижения размерности признакового описания текстовых документов, основанный на методе главных компонент. Описываются вычислительные эксперименты на тестовой коллекции Reuters-21578, показывающие хорошую точность предлагаемого метода.


Имеются экземпляры в отделах: всего 1 : эн.ф. (1)
Свободны: эн.ф. (1)