Библиотека Амурского Государственного Университета

Главная

Упрощенный режим

Описание

Шлюз Z39.50

Базы данных

БД "Статьи" - результаты поиска

Вид поиска

БД "Книги"

БД "Статьи"

Труды АМГУ

Выпускные квалификационные работы

Антитеррор

Область поиска

Формат представления найденных документов:
полный	информационный	краткий

Отсортировать найденные документы по:
автору	заглавию	году издания	типу документа

Поисковый запрос: (<.>K=векторное представление слов<.>)

Общее количество найденных документов : 3
Показаны документы с 1 по 3

Шундеев, А. С. (кандидат физико-математических наук; ведущий научный сотрудник).
Об изменении размерности векторного представления текстовых данных [Текст] / А. С. Шундеев // Программная инженерия. - 2019. - Т. 10, № 6. - С. 265-273 : рис. - Библиогр.: с. 272-273 (10 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397

УДК

^a004.41/.42

ББК 32.973-018
Рубрики: Вычислительная техника
Программирование ЭВМ. Компьютерные программы. Программотехника
Кл.слова (ненормированные):
векторное представление документов -- векторное представление слов -- интеллектуальный анализ данных -- классификация текстов
Аннотация: В настоящее время интеллектуальный анализ данных является основой для построения широкого спектра прикладных информационных систем. Современным и бурно развивающимся подходом в области анализа текстовых данных является использование векторных представлений слов и текстов. Векторные представления изначально применяли для решения задач определения смысловой близости слов и поиска аналогий, однако они оказались востребованными также и в области решения задачи классификации текстов. Применительно к этой задаче векторные представления рассматриваются в настоящей работе. Предложен подход к построению векторных представлений текстов, базирующийся на трансформации согласованных с ними векторных представлений слов. Подобные трансформации подразумевают изменение исходной модели и размерности векторного представления и реализуются в виде решения задачи восстановления многомерной регрессии. Проведенные над тестовыми наборами данных эксперименты позволяют сделать следующие выводы. Построенные с помощью трансформаций векторные представления документов могут иметь меньшую размерность. При этом их использование в решении задачи классификации текстов в большинстве случаев дает более точный результат, чем при использовании исходных векторных представлений.

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)

Найти похожие

Шундеев, А. С. (кандидат физико-математических наук; ведущий научный сотрудник).
Уменьшение размерности векторного представления документов с помощью метода главных компонент [Текст] / А. С. Шундеев, Д. Д. Заславский, С. И. Пехтерев // Программная инженерия. - 2021. - Т. 12, № 1. - С. 48-57 : ил. - Библиогр.: с. 55-57 (27 назв.). - Авт., загл., аннот., кл. сл. и библиогр. парал. рус., англ. . - ISSN 2220-3397

УДК

^a81'42

^a80:004.3

ББК 81.0 + 81.1с
Рубрики: Языкознание
Лингвистика текста
Применение вычислительной техники в языкознании
Кл.слова (ненормированные):
GloVe -- Word2Vec -- fastText -- анализ текста -- векторное представление документов -- векторное представление слов -- дистрибутивная гипотеза -- классификация текстовых текстов -- компьютерная лингвистика -- метод главных компонент -- пост-обработка -- текстовые документы
Аннотация: Векторные представления слов являются популярным объектом исследований, и эффективным средством анализа текстовых данных начиная с 1970-х годов. В частности, с их помощью удалось формализовать и дать решения задачам определения смысловой близости слов и поиска аналогий. В данной статье векторные представления слов рассматриваются с точки зрения решения задачи классификации текстовых документов. Популярным средством, используемым для снижения размерности данных, является метод главных компонент. В том числе он применяется и к векторным представлениям слов. В последнее время появился ряд работ, в которых исследуется не совсем традиционный подход к применению данного метода. В них предлагается удалять проекции не на последние, а на первые главные компоненты. Проводимые на этом направлении экспериментальные исследования показывают, что точность решения задач определения смысловой близости слов и поиска аналогий при этом может увеличиться. Целью исследования, описанного в данной работе, является проверка того, сохраняется ли подобный эффект при решении задачи классификации текстовых документов.

Доп.точки доступа:
Заславский, Д. Д. (студент); Пехтерев, С. И. (студент)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)

Найти похожие

Карпович, С. Н.
Учет неизвестных слов в вероятностной тематической модели [Текст] = Penalty for Unknown Words in Topic Model / Карпович С. Н., Смирнов А. В., Тесля Н. Н. // Информационные технологии и вычислительные системы = Journal of Information Technologies and Computing Systems. - 2020. - № 4. - С. 111-124 : ил., табл. - Библиогр.: с. 121-124 (31 назв. ) . - ISSN 2071-8632

УДК

^a004.91

ББК 32.973-018.2
Рубрики: Вычислительная техника
Обработка и создание документов
Кл.слова (ненормированные):
PEBL-TM -- Python -- SCTMru -- алгоритмы обработки текстов -- анализ потоковых данных -- анализ текстовых документов -- векторное представление слов -- кодирование текста -- компьютерные языки -- новизна текстовых документов -- унитарный код -- учет неизвестных слов
Аннотация: Рассмотрены подходы к учету неизвестных слов в языковых моделях алгоритмов обработки естественного языка. Предложен метод учета неизвестных слов в вероятностном тематическом моделировании, который позволяет определить вероятность новизны документа без обновления параметров модели.

Доп.точки доступа:
Смирнов, А. В.; Тесля, Н. Н.

Имеются экземпляры в отделах: всего 1 : н.з. (1)
Свободны: н.з. (1)

Найти похожие

Тематический навигатор

Статистика за 07.07.2024
Число запросов	134695
Число посетителей	1
Число заказов	0

© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)