Толчеев, В. О. (канд. техн. наук, доц.).
    Синтез коллективов решающих правил для проведения классификации текстовых документов [Текст] / В. О. Толчеев // Информационные технологии. - 2007. - N 10. - С. . 32-38. - Библиогр.: с. 32 (21 назв. )
УДК
ББК 32.973.26-018.2
Рубрики: Вычислительная техника--Программное обеспечение персональных компьютеров
Кл.слова (ненормированные):
текстовые документы -- методы классификации -- классификаторы -- свойства классификаторов -- классификация текстовых документов
Аннотация: Рассматриваются вопросы построения коллективов решающих правил в целях обеспечения высокой точности классификации текстовых документов.


Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Бородкин, А. А.
    Разработка учебно-исследовательского программного комплекса для обработки и анализа библиографических текстовых документов [Текст] / А. А. Бородкин, В. О. Толчеев // Вестник Московского энергетического института. - 2010. - N 1. - С. 96-102. - Библиогр.: с. 102 (8 назв. ) . - ISSN 1993-6982
УДК
ББК 73
Рубрики: Информатика
   Информатика в целом

Кл.слова (ненормированные):
программные комплексы -- текстовые документы -- библиографическая информация -- информатика -- интеллектуальный анализ данных -- алгоритмы
Аннотация: Рассматриваются функциональные возможности учебно-исследовательского программного комплекса для обработки и анализа библиографической текстовой информации.


Доп.точки доступа:
Толчеев, В. О.

Имеются экземпляры в отделах: всего 1 : эн.ф. (1)
Свободны: эн.ф. (1)




    Дербенев, Н. В. (аспирант; ассистент).
    Выявление нечетких дубликатов в наукометpическом анализе [Текст] / Н. В. Дербенев, В. О. Толчеев // Информационные технологии. - 2011. - N 12. - С. 24-29. . - Библиогр.: с. 29 (20 назв. )
УДК
ББК 32.973-018.2
Рубрики: Вычислительная техника
   Обработка и создание документов

Кл.слова (ненормированные):
нечеткие дубликаты -- наукометрический анализ -- библиографические документы -- текстовые документы -- расстояние Джаро-Винклера -- Джаро-Винклера расстояние -- коэффициенты ассоциативности -- метод шинглов -- меры близости -- порог близости
Аннотация: Рассматривается проблема выявления нечетких дубликатов в научной периодике. Обосновывается необходимость разработки специализированной процедуры идентификации нечетких дубликатов и целесообразность ее использования при проведении наукометрических исследований.


Доп.точки доступа:
Толчеев, В. О. (доктор технических наук; профессор)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Баранов, М. А. (аспирант).
    Составные ключевые термы в задаче кластеризации текстовых документов [Текст] / М. А. Баранов // Информационные технологии. - 2014. - № 1. - С. 3-8. - Библиогр.: с. 8 (15 назв.) . - ISSN 1684-6400
УДК
ББК 22.171
Рубрики: Математика
   Теория вероятностей

Кл.слова (ненормированные):
вычислительные эксперименты -- информационный поиск -- кластеризация документов -- обработка текста -- составные ключевые термы -- текстовые документы
Аннотация: В рамках векторной модели представления документов рассматривается задача кластеризации текстовых документов с использованием словосочетаний, состоящих более чем из двух слов.


Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Гулин, В. В.
    О классификации текстовых документов с учетом некоторых структурных особенностей [Текст] / В. В. Гулин, А. Б. Фролов // Известия РАН. Теория и системы управления. - 2016. - № 1. - С. 104-114. - Библиогр.: с. 113-114 (31 назв. ) . - ISSN 0002-3388
УДК
ББК 32.813
Рубрики: Радиоэлектроника
   Искусственный интеллект. Экспертные системы

Кл.слова (ненормированные):
байесовский классификатор -- классификация текстовых документов -- машинное обучение -- метод логической регрессии -- метод опорных векторов -- методы классификации -- методы машинного обучения -- структурирование данных -- текстовые документы
Аннотация: Изучается возможность модернизации традиционной модели “мешка слов” с целью отражения структурных особенностей текстовых документов и их учета при классификации методами теории машинного обучения. Предложено эти особенности характеризовать отношениями на множестве некоторых лексем, и имена отношений наряду с именами лексем использовать в качестве признаков. Этим рассматриваемые модели отличаются от традиционной модели, в которой отражаются только унарные отношения. Эффективность такой модернизации методов машинного обучения проанализирована посредством компьютерных экспериментов в условиях применения восьми известных классификаторов. Показано, что ее целесообразно применять при классификации текстовых документов с помощью простых классификаторов.


Доп.точки доступа:
Фролов, А. Б.

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Гулин, В. В.
    О классификации текстовых документов с учетом некоторых структурных особенностей [Текст] / В. В. Гулин, А. Б. Фролов // Известия РАН. Теория и системы управления. - 2016. - № 3. - С. 66-75. - Библиогр.: с. 75 (31 назв. ) . - ISSN 0002-3388
УДК
ББК 32.973-018.2
Рубрики: Вычислительная техника
   Распознавание и преобразование образов

Кл.слова (ненормированные):
байесовский классификатор -- древо решений -- классификация текстов -- машинное обучение -- метод логистической регрессии -- метод опорных векторов -- методы классификации -- методы машинного обучения -- наивный байесовский классификатор -- простые классификаторы -- текстовая классификация -- текстовые документы -- электронные текстовые документы
Аннотация: Изучается возможность модернизации традиционной модели “мешка слов” с целью отражения структурных особенностей текстовых документов и их учета при классификации методами теории машинного обучения. Предложено эти особенности характеризовать отношениями на множестве некоторых лексем и имена отношений наряду с именами лексем использовать в качестве признаков. Этим предлагаемые модели отличаются от традиционной модели, в которой отражаются только унарные отношения. Эффективность такой модернизации методов машинного обучения проанализирована посредством компьютерных экспериментов классами коллекции Reuters-21578 в условиях применения восьми известных классификаторов. Показано, что такие модели целесообразно применять при классификации текстовых документов с использованием простых классификаторов.


Доп.точки доступа:
Фролов, А. Б.

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




   
    Программное обеспечение для автоматизации подготовки текстовой конструкторской документации на программно-управляемые изделия [Текст] / С. А. Леоновец [и др.] // Программная инженерия. - 2017. - Т. 8, № 3. - С. 129-135 : рис. - Библиогр.: с. 134 (12 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
УДК
ББК 32.973-018 + 34.92
Рубрики: Вычислительная техника
   Программирование ЭВМ. Компьютерные программы. Программотехника

   Приборостроение

   Проектирование приборов

Кл.слова (ненормированные):
САПР -- автоматизация подготовки конструкторской документации -- конструкторская документация -- программная инженерия -- программное обеспечение -- система автоматизированного проектирования -- текстовые документы
Аннотация: Автоматизация процесса подготовки конструкторский документации основана на специализированной обработке инженерных данных, заданных в нормативно-технической документации или в техническом задании. Обработка инженерных данных предполагает математический анализ технических характеристик изделия и семантический анализ тактических требований к изделию. Описано разработанное программное обеспечение и инструментальные средства, доступные разработчику в проектной деятельности на приборостроительном предприятии.


Доп.точки доступа:
Леоновец, С. А. (старший инженер; аспирант); Гурьянов, А. В. (генеральный директор); Шукалов, А. В. (кандидат технических наук; первый заместитель генерального директора; главный конструктор; доцент); Жаринов, И. О. (доктор технических наук; доцент; руководитель учебно-научного центра; заведующий кафедрой)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Бурлаева, Е. И. (аспирант).
    Обзор методов классификации текстовых документов на основе подхода машинного обучения [Текст] / Е. И. Бурлаева // Программная инженерия. - 2017. - Т. 8, № 7. - С. 328-336 : рис. - Библиогр.: с. 334-335 (43 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
УДК
ББК 32.973-018
Рубрики: Вычислительная техника
   Программирование ЭВМ. Компьютерные программы. Программотехника

Кл.слова (ненормированные):
Байесовский классификатор -- автоматическая классификация текста -- автоматический анализ текста -- векторное представление текста -- деревья решений -- классификация текста -- латентно-семантический анализ -- машинное обучение -- метод опорных векторов -- наивный Байесовский классификатор -- обработка информации -- программная инженерия -- текстовые документы
Аннотация: Рассмотрены вопросы и сложности, возникающие при решении задач автоматической классификации текстовых документов. Отмечены преимущества и недостатки основных методов классификации текста. Приведен анализ различных методов машинного обучения, которые используются для многоклассовой классификации текстовых документов.


Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




   
    Программное средство для автоматизации контроля жизненного цикла текстовой документации на программно-управляемые изделия [Текст] / С. А. Леоновец [и др.] // Программная инженерия. - 2018. - Т. 9, № 2. - С. 91-96 : рис. - Библиогр.: с. 95 (14 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
УДК
ББК 32.973-018 + 34.96
Рубрики: Вычислительная техника
   Программирование ЭВМ. Компьютерные программы. Программотехника

   Приборостроение

   Технология приборостроения

Кл.слова (ненормированные):
авиационное оборудование -- авионика -- автоматизация конструкторской документации -- бортовое оборудование -- жизненный цикл документов -- конструкторская документация -- программная инженерия -- программное обеспечение -- текстовые документы -- техническая документация
Аннотация: Рассмотрена задача автоматизации процесса подготовки, хранения и мониторинга контроля версий текстовой конструкторской и программной документации с помощью специализированного программного обеспечения. Описано новое разработанное программное обеспечение и инструментальные средства на его основе, облегчающие документирование результатов разработки бортового приборного оборудования.


Доп.точки доступа:
Леоновец, С. А. (старший инженер; аспирант); Гурьянов, А. В. (кандидат экономических наук; генеральный директор); Шукалов, А. В. (кандидат технических наук; доцент; первый заместитель генерального директора; главный конструктор); Жаринов, И. О. (доктор технических наук; профессор; заведующий кафедрой; руководитель учебно-научного центра)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Дли, Максим Иосифович (доктор технических наук, заместитель директора по научной работе).
    Формирование структуры интеллектуальной системы анализа и рубрицирования неструктурированной текстовой информации в различных ситуациях [Текст] = Formation of the structure of the intellectual system of analyzing and rubricating unstructured text information in different situations / М. И. Дли, О. В. Булыгина, П. Ю. Козлов // Прикладная информатика. - 2018. - Т. 13, № 4 (76). - С. 111-123 : 3 ил., 1 табл. - Библиогр.: с. 121-122 (22 назв. )
УДК
ББК 73
Рубрики: Информатика
   Документальные источники информации

Кл.слова (ненормированные):
вероятностно-статистические методы -- интеллектуальные методы -- методы анализа -- мультимодельный подход -- неструктурированные документы -- нечетко-логические алгоритмы -- пирамидальные сети -- растущие сети -- рубрики -- рубрицирование -- текстовая информация -- текстовые документы -- электронные документы
Аннотация: Предложен мультимодельный подход к рубрицированию, отличающийся комбинированным использованием интеллектуальных и вероятностно-статистических методов анализа текстовых документов. Его применение позволит повысить точность отнесения электронных текстовых документов к конкретным рубрикам с учетом их специфики и различных целей практического применения в организации.


Доп.точки доступа:
Булыгина, Ольга Валентиновна (кандидат экономических наук; доцент); Козлов, Павел Юрьевич (кандидат технических наук; ассистент)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




   
    Developing the economic information system for automated analysis of unstructured text documens [Text] = Разработка экономической информационной системы автоматизированного анализа неструктированных текстовых документов / M. Dli [et al.] // Прикладная информатика. - 2018. - Т. 13, № 5 (77). - С. 51-57 : 3 табл. - Библиогр.: с. 56-57 (13 назв. )
УДК
ББК 32.973-018.2
Рубрики: Вычислительная техника
   Прикладные информационные (компьютерные) технологии в целом

Кл.слова (ненормированные):
автоматизированное рубрицирование -- автоматизированный анализ -- информационные системы -- нейро-нечеткие классификаторы -- неструктурированные документы -- нечеткая логика -- нечеткие решения -- обращения граждан -- органы власти -- рубрицирование -- текстовые документы -- электронные документы
Аннотация: Проведено исследование задач и методов автоматизированного рубрицирования текстов и оценены их перспективы для анализа неструктурированных электронных текстовых документов с учетом особенностей обращений граждан, поступающих в органы власти.


Доп.точки доступа:
Dli, M.; Bulygina, O.; Kozlov, P.; Ross, G.

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Бурлаева, Е. И.
    Анализ методов преобразования текстов в форму объектов векторного пространства [Текст] / Е. И. Бурлаева, В. Н. Павлыш // Программная инженерия. - 2019. - Т. 10, № 1. - С. 30-37 : рис. - Библиогр.: с. 35-37 (29 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
УДК
ББК 32.973-018
Рубрики: Вычислительная техника
   Программирование ЭВМ. Компьютерные программы. Программотехника

Кл.слова (ненормированные):
векторное представление -- композиция методов -- метода tf-idf -- стемминг -- текстовые документы
Аннотация: Одной из востребованных технологий обработки текстовой информации является автоматическая классификация документов, представленных в текстовом виде. Традиционное представление документа в форме последовательности символов затрудняет работу с ним как с объектом классификации. Большинство алгоритмов машинного обучения работают с такими документами как с элементами векторного пространства, вследствие чего появляется необходимость соответствующего преобразования текстов в форму векторного объекта. В статье представлен подход к преобразованию текста в форму векторного объекта, использующий композицию методов. На основании проведенных экспериментов, позволяющих сравнивать эффективности методов векторизации и морфологического разбора, выбран подход к сокращению размерности векторов, использующий сочетание методов "стемминг", "стоп-слова" и tf-idf. Такая композиция, как показали эксперименты, позволяет облегчить работу с использованием метода tf-idf, избавляя текст от неинформативных слов и преобразуя слова к общей форме.


Доп.точки доступа:
Павлыш, Владимир Николаевич (доктор технических наук; профессор; заведующий кафедрой)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Вычегжанин, С. В.
    Определение точки зрения автора текста на основе ансамблей классификаторов [Текст] / С. В. Вычегжанин, Е. В. Котельников // Программирование. - 2019. - № 5. - С. 10-24. - Библиогр.: с. 24 (67 назв.) . - ISSN 0132-3474
УДК
ББК 32.813
Рубрики: Радиоэлектроника
   Искусственный интеллект. Экспертные системы

Кл.слова (ненормированные):
ансамбли классификаторов -- социальные медиа -- текстовые документы
Аннотация: В статье предложен метод решения задачи определения точки зрения автора текстового документа, основанный на машинном обучении ансамблей классификаторов.


Доп.точки доступа:
Котельников, Е. В.

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)




    Шундеев, А. С. (кандидат физико-математических наук; ведущий научный сотрудник).
    Уменьшение размерности векторного представления документов с помощью метода главных компонент [Текст] / А. С. Шундеев, Д. Д. Заславский, С. И. Пехтерев // Программная инженерия. - 2021. - Т. 12, № 1. - С. 48-57 : ил. - Библиогр.: с. 55-57 (27 назв.). - Авт., загл., аннот., кл. сл. и библиогр. парал. рус., англ. . - ISSN 2220-3397
УДК
ББК 81.0 + 81.1с
Рубрики: Языкознание
   Лингвистика текста

   Применение вычислительной техники в языкознании

Кл.слова (ненормированные):
GloVe -- Word2Vec -- fastText -- анализ текста -- векторное представление документов -- векторное представление слов -- дистрибутивная гипотеза -- классификация текстовых текстов -- компьютерная лингвистика -- метод главных компонент -- пост-обработка -- текстовые документы
Аннотация: Векторные представления слов являются популярным объектом исследований, и эффективным средством анализа текстовых данных начиная с 1970-х годов. В частности, с их помощью удалось формализовать и дать решения задачам определения смысловой близости слов и поиска аналогий. В данной статье векторные представления слов рассматриваются с точки зрения решения задачи классификации текстовых документов. Популярным средством, используемым для снижения размерности данных, является метод главных компонент. В том числе он применяется и к векторным представлениям слов. В последнее время появился ряд работ, в которых исследуется не совсем традиционный подход к применению данного метода. В них предлагается удалять проекции не на последние, а на первые главные компоненты. Проводимые на этом направлении экспериментальные исследования показывают, что точность решения задач определения смысловой близости слов и поиска аналогий при этом может увеличиться. Целью исследования, описанного в данной работе, является проверка того, сохраняется ли подобный эффект при решении задачи классификации текстовых документов.


Доп.точки доступа:
Заславский, Д. Д. (студент); Пехтерев, С. И. (студент)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)