Вид документа : Статья из журнала
Шифр издания :
Автор(ы) : Карпович С. Н., Смирнов А. В., Тесля Н. Н.
Заглавие : Учет неизвестных слов в вероятностной тематической модели
Параллельн. заглавия :Penalty for Unknown Words in Topic Model
Серия: Интеллектуальный анализ текстов
Место публикации : Информационные технологии и вычислительные системы. - 2020. - № 4. - С.111-124: ил., табл. - ISSN 2071-8632 (Шифр itiv/2020/4). - ISSN 2071-8632
Примечания : Библиогр.: с. 121-124 (31 назв. )
УДК : 004.91
ББК : 32.973-018.2
Предметные рубрики: Вычислительная техника
Обработка и создание документов
Ключевые слова (''Своб.индексиров.''): pebl-tm--python--sctmru--алгоритмы обработки текстов--анализ потоковых данных--анализ текстовых документов--векторное представление слов--кодирование текста--компьютерные языки--новизна текстовых документов--унитарный код--учет неизвестных слов
Аннотация: Рассмотрены подходы к учету неизвестных слов в языковых моделях алгоритмов обработки естественного языка. Предложен метод учета неизвестных слов в вероятностном тематическом моделировании, который позволяет определить вероятность новизны документа без обновления параметров модели.

Доп.точки доступа:
Смирнов, А. В.; Тесля, Н. Н.