Главная Упрощенный режим Описание Шлюз Z39.50
Авторизация
Фамилия
Пароль
 

Базы данных


БД "Статьи" - результаты поиска

Вид поиска

Область поиска
Формат представления найденных документов:
полный информационныйкраткий
Отсортировать найденные документы по:
авторузаглавиюгоду изданиятипу документа
Поисковый запрос: (<.>K=векторное представление слов<.>)
Общее количество найденных документов : 3
Показаны документы с 1 по 3
1.

Вид документа : Статья из журнала
Шифр издания :
Автор(ы) : Шундеев А. С. (кандидат физико-математических наук; ведущий научный сотрудник)
Заглавие : Об изменении размерности векторного представления текстовых данных
Место публикации : Программная инженерия. - 2019. - Т. 10, № 6. - С.265-273: рис. - ISSN 2220-3397 (Шифр proi/2019/10/6). - ISSN 2220-3397
Примечания : Библиогр.: с. 272-273 (10 назв.). - Загл., аннот. и библиогр. парал. рус., англ.
УДК : 004.41/.42
ББК : 32.973-018
Предметные рубрики: Вычислительная техника
Программирование ЭВМ. Компьютерные программы. Программотехника
Ключевые слова (''Своб.индексиров.''): векторное представление документов--векторное представление слов--интеллектуальный анализ данных--классификация текстов
Аннотация: В настоящее время интеллектуальный анализ данных является основой для построения широкого спектра прикладных информационных систем. Современным и бурно развивающимся подходом в области анализа текстовых данных является использование векторных представлений слов и текстов. Векторные представления изначально применяли для решения задач определения смысловой близости слов и поиска аналогий, однако они оказались востребованными также и в области решения задачи классификации текстов. Применительно к этой задаче векторные представления рассматриваются в настоящей работе. Предложен подход к построению векторных представлений текстов, базирующийся на трансформации согласованных с ними векторных представлений слов. Подобные трансформации подразумевают изменение исходной модели и размерности векторного представления и реализуются в виде решения задачи восстановления многомерной регрессии. Проведенные над тестовыми наборами данных эксперименты позволяют сделать следующие выводы. Построенные с помощью трансформаций векторные представления документов могут иметь меньшую размерность. При этом их использование в решении задачи классификации текстов в большинстве случаев дает более точный результат, чем при использовании исходных векторных представлений.
Найти похожие

2.

Вид документа : Статья из журнала
Шифр издания :
Автор(ы) : Шундеев А. С. (кандидат физико-математических наук; ведущий научный сотрудник), Заславский Д. Д., Пехтерев С. И.
Заглавие : Уменьшение размерности векторного представления документов с помощью метода главных компонент
Место публикации : Программная инженерия. - 2021. - Т. 12, № 1. - С.48-57: ил. - ISSN 2220-3397 (Шифр proi/2021/12/1). - ISSN 2220-3397
Примечания : Библиогр.: с. 55-57 (27 назв.). - Авт., загл., аннот., кл. сл. и библиогр. парал. рус., англ.
УДК : 81'42 + 80:004.3
ББК : 81.0 + 81.1с
Предметные рубрики: Языкознание
Лингвистика текста
Применение вычислительной техники в языкознании
Ключевые слова (''Своб.индексиров.''): glove--word2vec--fasttext--анализ текста--векторное представление документов--векторное представление слов--дистрибутивная гипотеза--классификация текстовых текстов--компьютерная лингвистика--метод главных компонент--пост-обработка--текстовые документы
Аннотация: Векторные представления слов являются популярным объектом исследований, и эффективным средством анализа текстовых данных начиная с 1970-х годов. В частности, с их помощью удалось формализовать и дать решения задачам определения смысловой близости слов и поиска аналогий. В данной статье векторные представления слов рассматриваются с точки зрения решения задачи классификации текстовых документов. Популярным средством, используемым для снижения размерности данных, является метод главных компонент. В том числе он применяется и к векторным представлениям слов. В последнее время появился ряд работ, в которых исследуется не совсем традиционный подход к применению данного метода. В них предлагается удалять проекции не на последние, а на первые главные компоненты. Проводимые на этом направлении экспериментальные исследования показывают, что точность решения задач определения смысловой близости слов и поиска аналогий при этом может увеличиться. Целью исследования, описанного в данной работе, является проверка того, сохраняется ли подобный эффект при решении задачи классификации текстовых документов.
Найти похожие

3.

Вид документа : Статья из журнала
Шифр издания :
Автор(ы) : Карпович С. Н., Смирнов А. В., Тесля Н. Н.
Заглавие : Учет неизвестных слов в вероятностной тематической модели
Параллельн. заглавия :Penalty for Unknown Words in Topic Model
Серия: Интеллектуальный анализ текстов
Место публикации : Информационные технологии и вычислительные системы. - 2020. - № 4. - С.111-124: ил., табл. - ISSN 2071-8632 (Шифр itiv/2020/4). - ISSN 2071-8632
Примечания : Библиогр.: с. 121-124 (31 назв. )
УДК : 004.91
ББК : 32.973-018.2
Предметные рубрики: Вычислительная техника
Обработка и создание документов
Ключевые слова (''Своб.индексиров.''): pebl-tm--python--sctmru--алгоритмы обработки текстов--анализ потоковых данных--анализ текстовых документов--векторное представление слов--кодирование текста--компьютерные языки--новизна текстовых документов--унитарный код--учет неизвестных слов
Аннотация: Рассмотрены подходы к учету неизвестных слов в языковых моделях алгоритмов обработки естественного языка. Предложен метод учета неизвестных слов в вероятностном тематическом моделировании, который позволяет определить вероятность новизны документа без обновления параметров модели.
Найти похожие

 
Статистика
за 30.07.2024
Число запросов 101898
Число посетителей 1
Число заказов 0
© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)