Главная Упрощенный режим Описание Шлюз Z39.50
Авторизация
Фамилия
Пароль
 

Базы данных


БД "Статьи" - результаты поиска

Вид поиска

Область поиска
Формат представления найденных документов:
полныйинформационныйкраткий
Отсортировать найденные документы по:
авторузаглавиюгоду изданиятипу документа
Поисковый запрос: (<.>K=векторное представление слов<.>)
Общее количество найденных документов : 3
Показаны документы с 1 по 3
1.


    Шундеев, А. С. (кандидат физико-математических наук; ведущий научный сотрудник).
    Об изменении размерности векторного представления текстовых данных [Текст] / А. С. Шундеев // Программная инженерия. - 2019. - Т. 10, № 6. - С. 265-273 : рис. - Библиогр.: с. 272-273 (10 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
УДК
ББК 32.973-018
Рубрики: Вычислительная техника
   Программирование ЭВМ. Компьютерные программы. Программотехника

Кл.слова (ненормированные):
векторное представление документов -- векторное представление слов -- интеллектуальный анализ данных -- классификация текстов
Аннотация: В настоящее время интеллектуальный анализ данных является основой для построения широкого спектра прикладных информационных систем. Современным и бурно развивающимся подходом в области анализа текстовых данных является использование векторных представлений слов и текстов. Векторные представления изначально применяли для решения задач определения смысловой близости слов и поиска аналогий, однако они оказались востребованными также и в области решения задачи классификации текстов. Применительно к этой задаче векторные представления рассматриваются в настоящей работе. Предложен подход к построению векторных представлений текстов, базирующийся на трансформации согласованных с ними векторных представлений слов. Подобные трансформации подразумевают изменение исходной модели и размерности векторного представления и реализуются в виде решения задачи восстановления многомерной регрессии. Проведенные над тестовыми наборами данных эксперименты позволяют сделать следующие выводы. Построенные с помощью трансформаций векторные представления документов могут иметь меньшую размерность. При этом их использование в решении задачи классификации текстов в большинстве случаев дает более точный результат, чем при использовании исходных векторных представлений.


Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)

Найти похожие

2.


    Шундеев, А. С. (кандидат физико-математических наук; ведущий научный сотрудник).
    Уменьшение размерности векторного представления документов с помощью метода главных компонент [Текст] / А. С. Шундеев, Д. Д. Заславский, С. И. Пехтерев // Программная инженерия. - 2021. - Т. 12, № 1. - С. 48-57 : ил. - Библиогр.: с. 55-57 (27 назв.). - Авт., загл., аннот., кл. сл. и библиогр. парал. рус., англ. . - ISSN 2220-3397
УДК
ББК 81.0 + 81.1с
Рубрики: Языкознание
   Лингвистика текста

   Применение вычислительной техники в языкознании

Кл.слова (ненормированные):
GloVe -- Word2Vec -- fastText -- анализ текста -- векторное представление документов -- векторное представление слов -- дистрибутивная гипотеза -- классификация текстовых текстов -- компьютерная лингвистика -- метод главных компонент -- пост-обработка -- текстовые документы
Аннотация: Векторные представления слов являются популярным объектом исследований, и эффективным средством анализа текстовых данных начиная с 1970-х годов. В частности, с их помощью удалось формализовать и дать решения задачам определения смысловой близости слов и поиска аналогий. В данной статье векторные представления слов рассматриваются с точки зрения решения задачи классификации текстовых документов. Популярным средством, используемым для снижения размерности данных, является метод главных компонент. В том числе он применяется и к векторным представлениям слов. В последнее время появился ряд работ, в которых исследуется не совсем традиционный подход к применению данного метода. В них предлагается удалять проекции не на последние, а на первые главные компоненты. Проводимые на этом направлении экспериментальные исследования показывают, что точность решения задач определения смысловой близости слов и поиска аналогий при этом может увеличиться. Целью исследования, описанного в данной работе, является проверка того, сохраняется ли подобный эффект при решении задачи классификации текстовых документов.


Доп.точки доступа:
Заславский, Д. Д. (студент); Пехтерев, С. И. (студент)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)

Найти похожие

3.


    Карпович, С. Н.
    Учет неизвестных слов в вероятностной тематической модели [Текст] = Penalty for Unknown Words in Topic Model / Карпович С. Н., Смирнов А. В., Тесля Н. Н. // Информационные технологии и вычислительные системы = Journal of Information Technologies and Computing Systems. - 2020. - № 4. - С. 111-124 : ил., табл. - Библиогр.: с. 121-124 (31 назв. ) . - ISSN 2071-8632
УДК
ББК 32.973-018.2
Рубрики: Вычислительная техника
   Обработка и создание документов

Кл.слова (ненормированные):
PEBL-TM -- Python -- SCTMru -- алгоритмы обработки текстов -- анализ потоковых данных -- анализ текстовых документов -- векторное представление слов -- кодирование текста -- компьютерные языки -- новизна текстовых документов -- унитарный код -- учет неизвестных слов
Аннотация: Рассмотрены подходы к учету неизвестных слов в языковых моделях алгоритмов обработки естественного языка. Предложен метод учета неизвестных слов в вероятностном тематическом моделировании, который позволяет определить вероятность новизны документа без обновления параметров модели.


Доп.точки доступа:
Смирнов, А. В.; Тесля, Н. Н.

Имеются экземпляры в отделах: всего 1 : н.з. (1)
Свободны: н.з. (1)

Найти похожие

 
Статистика
за 07.07.2024
Число запросов 134695
Число посетителей 1
Число заказов 0
© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)