Вид документа : Статья из журнала Шифр издания : Автор(ы) : Карпович С. Н., Смирнов А. В., Тесля Н. Н. Заглавие : Учет неизвестных слов в вероятностной тематической модели Параллельн. заглавия :Penalty for Unknown Words in Topic Model Серия: Интеллектуальный анализ текстов Место публикации : Информационные технологии и вычислительные системы. - 2020. - № 4. - С.111-124: ил., табл. - ISSN 2071-8632 (Шифр itiv/2020/4). - ISSN 2071-8632 Примечания : Библиогр.: с. 121-124 (31 назв. ) УДК : 004.91 ББК : 32.973-018.2 Предметные рубрики: Вычислительная техника Обработка и создание документов Ключевые слова (''Своб.индексиров.''): pebl-tm--python--sctmru--алгоритмы обработки текстов--анализ потоковых данных--анализ текстовых документов--векторное представление слов--кодирование текста--компьютерные языки--новизна текстовых документов--унитарный код--учет неизвестных слов Аннотация: Рассмотрены подходы к учету неизвестных слов в языковых моделях алгоритмов обработки естественного языка. Предложен метод учета неизвестных слов в вероятностном тематическом моделировании, который позволяет определить вероятность новизны документа без обновления параметров модели. Доп.точки доступа: Смирнов, А. В.; Тесля, Н. Н. |