Толчеев, В. О. (канд. техн. наук, доц.). Синтез коллективов решающих правил для проведения классификации текстовых документов [Текст] / В. О. Толчеев> // Информационные технологии. - 2007. - N 10. - С. . 32-38. - Библиогр.: с. 32 (21 назв. )
Рубрики: Вычислительная техника--Программное обеспечение персональных компьютеров Кл.слова (ненормированные): текстовые документы -- методы классификации -- классификаторы -- свойства классификаторов -- классификация текстовых документов Аннотация: Рассматриваются вопросы построения коллективов решающих правил в целях обеспечения высокой точности классификации текстовых документов. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Бородкин, А. А. Разработка учебно-исследовательского программного комплекса для обработки и анализа библиографических текстовых документов [Текст] / А. А. Бородкин, В. О. Толчеев> // Вестник Московского энергетического института. - 2010. - N 1. - С. 96-102. - Библиогр.: с. 102 (8 назв. ) . - ISSN 1993-6982
Рубрики: Информатика Информатика в целом Кл.слова (ненормированные): программные комплексы -- текстовые документы -- библиографическая информация -- информатика -- интеллектуальный анализ данных -- алгоритмы Аннотация: Рассматриваются функциональные возможности учебно-исследовательского программного комплекса для обработки и анализа библиографической текстовой информации. Доп.точки доступа: Толчеев, В. О. Имеются экземпляры в отделах: всего 1 : эн.ф. (1) Свободны: эн.ф. (1) |
Дербенев, Н. В. (аспирант; ассистент). Выявление нечетких дубликатов в наукометpическом анализе [Текст] / Н. В. Дербенев, В. О. Толчеев> // Информационные технологии. - 2011. - N 12. - С. 24-29. . - Библиогр.: с. 29 (20 назв. )
Рубрики: Вычислительная техника Обработка и создание документов Кл.слова (ненормированные): нечеткие дубликаты -- наукометрический анализ -- библиографические документы -- текстовые документы -- расстояние Джаро-Винклера -- Джаро-Винклера расстояние -- коэффициенты ассоциативности -- метод шинглов -- меры близости -- порог близости Аннотация: Рассматривается проблема выявления нечетких дубликатов в научной периодике. Обосновывается необходимость разработки специализированной процедуры идентификации нечетких дубликатов и целесообразность ее использования при проведении наукометрических исследований. Доп.точки доступа: Толчеев, В. О. (доктор технических наук; профессор) Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Баранов, М. А. (аспирант). Составные ключевые термы в задаче кластеризации текстовых документов [Текст] / М. А. Баранов> // Информационные технологии. - 2014. - № 1. - С. 3-8. - Библиогр.: с. 8 (15 назв.) . - ISSN 1684-6400
Рубрики: Математика Теория вероятностей Кл.слова (ненормированные): вычислительные эксперименты -- информационный поиск -- кластеризация документов -- обработка текста -- составные ключевые термы -- текстовые документы Аннотация: В рамках векторной модели представления документов рассматривается задача кластеризации текстовых документов с использованием словосочетаний, состоящих более чем из двух слов. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Гулин, В. В. О классификации текстовых документов с учетом некоторых структурных особенностей [Текст] / В. В. Гулин, А. Б. Фролов> // Известия РАН. Теория и системы управления. - 2016. - № 1. - С. 104-114. - Библиогр.: с. 113-114 (31 назв. ) . - ISSN 0002-3388
Рубрики: Радиоэлектроника Искусственный интеллект. Экспертные системы Кл.слова (ненормированные): байесовский классификатор -- классификация текстовых документов -- машинное обучение -- метод логической регрессии -- метод опорных векторов -- методы классификации -- методы машинного обучения -- структурирование данных -- текстовые документы Аннотация: Изучается возможность модернизации традиционной модели “мешка слов” с целью отражения структурных особенностей текстовых документов и их учета при классификации методами теории машинного обучения. Предложено эти особенности характеризовать отношениями на множестве некоторых лексем, и имена отношений наряду с именами лексем использовать в качестве признаков. Этим рассматриваемые модели отличаются от традиционной модели, в которой отражаются только унарные отношения. Эффективность такой модернизации методов машинного обучения проанализирована посредством компьютерных экспериментов в условиях применения восьми известных классификаторов. Показано, что ее целесообразно применять при классификации текстовых документов с помощью простых классификаторов. Доп.точки доступа: Фролов, А. Б. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Гулин, В. В. О классификации текстовых документов с учетом некоторых структурных особенностей [Текст] / В. В. Гулин, А. Б. Фролов> // Известия РАН. Теория и системы управления. - 2016. - № 3. - С. 66-75. - Библиогр.: с. 75 (31 назв. ) . - ISSN 0002-3388
Рубрики: Вычислительная техника Распознавание и преобразование образов Кл.слова (ненормированные): байесовский классификатор -- древо решений -- классификация текстов -- машинное обучение -- метод логистической регрессии -- метод опорных векторов -- методы классификации -- методы машинного обучения -- наивный байесовский классификатор -- простые классификаторы -- текстовая классификация -- текстовые документы -- электронные текстовые документы Аннотация: Изучается возможность модернизации традиционной модели “мешка слов” с целью отражения структурных особенностей текстовых документов и их учета при классификации методами теории машинного обучения. Предложено эти особенности характеризовать отношениями на множестве некоторых лексем и имена отношений наряду с именами лексем использовать в качестве признаков. Этим предлагаемые модели отличаются от традиционной модели, в которой отражаются только унарные отношения. Эффективность такой модернизации методов машинного обучения проанализирована посредством компьютерных экспериментов классами коллекции Reuters-21578 в условиях применения восьми известных классификаторов. Показано, что такие модели целесообразно применять при классификации текстовых документов с использованием простых классификаторов. Доп.точки доступа: Фролов, А. Б. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Программное обеспечение для автоматизации подготовки текстовой конструкторской документации на программно-управляемые изделия [Текст] / С. А. Леоновец [и др.]> // Программная инженерия. - 2017. - Т. 8, № 3. - С. 129-135 : рис. - Библиогр.: с. 134 (12 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
Рубрики: Вычислительная техника Программирование ЭВМ. Компьютерные программы. Программотехника Приборостроение Проектирование приборов Кл.слова (ненормированные): САПР -- автоматизация подготовки конструкторской документации -- конструкторская документация -- программная инженерия -- программное обеспечение -- система автоматизированного проектирования -- текстовые документы Аннотация: Автоматизация процесса подготовки конструкторский документации основана на специализированной обработке инженерных данных, заданных в нормативно-технической документации или в техническом задании. Обработка инженерных данных предполагает математический анализ технических характеристик изделия и семантический анализ тактических требований к изделию. Описано разработанное программное обеспечение и инструментальные средства, доступные разработчику в проектной деятельности на приборостроительном предприятии. Доп.точки доступа: Леоновец, С. А. (старший инженер; аспирант); Гурьянов, А. В. (генеральный директор); Шукалов, А. В. (кандидат технических наук; первый заместитель генерального директора; главный конструктор; доцент); Жаринов, И. О. (доктор технических наук; доцент; руководитель учебно-научного центра; заведующий кафедрой) Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Бурлаева, Е. И. (аспирант). Обзор методов классификации текстовых документов на основе подхода машинного обучения [Текст] / Е. И. Бурлаева> // Программная инженерия. - 2017. - Т. 8, № 7. - С. 328-336 : рис. - Библиогр.: с. 334-335 (43 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
Рубрики: Вычислительная техника Программирование ЭВМ. Компьютерные программы. Программотехника Кл.слова (ненормированные): Байесовский классификатор -- автоматическая классификация текста -- автоматический анализ текста -- векторное представление текста -- деревья решений -- классификация текста -- латентно-семантический анализ -- машинное обучение -- метод опорных векторов -- наивный Байесовский классификатор -- обработка информации -- программная инженерия -- текстовые документы Аннотация: Рассмотрены вопросы и сложности, возникающие при решении задач автоматической классификации текстовых документов. Отмечены преимущества и недостатки основных методов классификации текста. Приведен анализ различных методов машинного обучения, которые используются для многоклассовой классификации текстовых документов. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Программное средство для автоматизации контроля жизненного цикла текстовой документации на программно-управляемые изделия [Текст] / С. А. Леоновец [и др.]> // Программная инженерия. - 2018. - Т. 9, № 2. - С. 91-96 : рис. - Библиогр.: с. 95 (14 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
Рубрики: Вычислительная техника Программирование ЭВМ. Компьютерные программы. Программотехника Приборостроение Технология приборостроения Кл.слова (ненормированные): авиационное оборудование -- авионика -- автоматизация конструкторской документации -- бортовое оборудование -- жизненный цикл документов -- конструкторская документация -- программная инженерия -- программное обеспечение -- текстовые документы -- техническая документация Аннотация: Рассмотрена задача автоматизации процесса подготовки, хранения и мониторинга контроля версий текстовой конструкторской и программной документации с помощью специализированного программного обеспечения. Описано новое разработанное программное обеспечение и инструментальные средства на его основе, облегчающие документирование результатов разработки бортового приборного оборудования. Доп.точки доступа: Леоновец, С. А. (старший инженер; аспирант); Гурьянов, А. В. (кандидат экономических наук; генеральный директор); Шукалов, А. В. (кандидат технических наук; доцент; первый заместитель генерального директора; главный конструктор); Жаринов, И. О. (доктор технических наук; профессор; заведующий кафедрой; руководитель учебно-научного центра) Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Дли, Максим Иосифович (доктор технических наук, заместитель директора по научной работе). Формирование структуры интеллектуальной системы анализа и рубрицирования неструктурированной текстовой информации в различных ситуациях [Текст] = Formation of the structure of the intellectual system of analyzing and rubricating unstructured text information in different situations / М. И. Дли, О. В. Булыгина, П. Ю. Козлов> // Прикладная информатика. - 2018. - Т. 13, № 4 (76). - С. 111-123 : 3 ил., 1 табл. - Библиогр.: с. 121-122 (22 назв. )
Рубрики: Информатика Документальные источники информации Кл.слова (ненормированные): вероятностно-статистические методы -- интеллектуальные методы -- методы анализа -- мультимодельный подход -- неструктурированные документы -- нечетко-логические алгоритмы -- пирамидальные сети -- растущие сети -- рубрики -- рубрицирование -- текстовая информация -- текстовые документы -- электронные документы Аннотация: Предложен мультимодельный подход к рубрицированию, отличающийся комбинированным использованием интеллектуальных и вероятностно-статистических методов анализа текстовых документов. Его применение позволит повысить точность отнесения электронных текстовых документов к конкретным рубрикам с учетом их специфики и различных целей практического применения в организации. Доп.точки доступа: Булыгина, Ольга Валентиновна (кандидат экономических наук; доцент); Козлов, Павел Юрьевич (кандидат технических наук; ассистент) Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Developing the economic information system for automated analysis of unstructured text documens [Text] = Разработка экономической информационной системы автоматизированного анализа неструктированных текстовых документов / M. Dli [et al.]> // Прикладная информатика. - 2018. - Т. 13, № 5 (77). - С. 51-57 : 3 табл. - Библиогр.: с. 56-57 (13 назв. )
Рубрики: Вычислительная техника Прикладные информационные (компьютерные) технологии в целом Кл.слова (ненормированные): автоматизированное рубрицирование -- автоматизированный анализ -- информационные системы -- нейро-нечеткие классификаторы -- неструктурированные документы -- нечеткая логика -- нечеткие решения -- обращения граждан -- органы власти -- рубрицирование -- текстовые документы -- электронные документы Аннотация: Проведено исследование задач и методов автоматизированного рубрицирования текстов и оценены их перспективы для анализа неструктурированных электронных текстовых документов с учетом особенностей обращений граждан, поступающих в органы власти. Доп.точки доступа: Dli, M.; Bulygina, O.; Kozlov, P.; Ross, G. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Бурлаева, Е. И. Анализ методов преобразования текстов в форму объектов векторного пространства [Текст] / Е. И. Бурлаева, В. Н. Павлыш> // Программная инженерия. - 2019. - Т. 10, № 1. - С. 30-37 : рис. - Библиогр.: с. 35-37 (29 назв.). - Загл., аннот. и библиогр. парал. рус., англ. . - ISSN 2220-3397
Рубрики: Вычислительная техника Программирование ЭВМ. Компьютерные программы. Программотехника Кл.слова (ненормированные): векторное представление -- композиция методов -- метода tf-idf -- стемминг -- текстовые документы Аннотация: Одной из востребованных технологий обработки текстовой информации является автоматическая классификация документов, представленных в текстовом виде. Традиционное представление документа в форме последовательности символов затрудняет работу с ним как с объектом классификации. Большинство алгоритмов машинного обучения работают с такими документами как с элементами векторного пространства, вследствие чего появляется необходимость соответствующего преобразования текстов в форму векторного объекта. В статье представлен подход к преобразованию текста в форму векторного объекта, использующий композицию методов. На основании проведенных экспериментов, позволяющих сравнивать эффективности методов векторизации и морфологического разбора, выбран подход к сокращению размерности векторов, использующий сочетание методов "стемминг", "стоп-слова" и tf-idf. Такая композиция, как показали эксперименты, позволяет облегчить работу с использованием метода tf-idf, избавляя текст от неинформативных слов и преобразуя слова к общей форме. Доп.точки доступа: Павлыш, Владимир Николаевич (доктор технических наук; профессор; заведующий кафедрой) Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Вычегжанин, С. В. Определение точки зрения автора текста на основе ансамблей классификаторов [Текст] / С. В. Вычегжанин, Е. В. Котельников> // Программирование. - 2019. - № 5. - С. 10-24. - Библиогр.: с. 24 (67 назв.) . - ISSN 0132-3474
Рубрики: Радиоэлектроника Искусственный интеллект. Экспертные системы Кл.слова (ненормированные): ансамбли классификаторов -- социальные медиа -- текстовые документы Аннотация: В статье предложен метод решения задачи определения точки зрения автора текстового документа, основанный на машинном обучении ансамблей классификаторов. Доп.точки доступа: Котельников, Е. В. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Шундеев, А. С. (кандидат физико-математических наук; ведущий научный сотрудник). Уменьшение размерности векторного представления документов с помощью метода главных компонент [Текст] / А. С. Шундеев, Д. Д. Заславский, С. И. Пехтерев> // Программная инженерия. - 2021. - Т. 12, № 1. - С. 48-57 : ил. - Библиогр.: с. 55-57 (27 назв.). - Авт., загл., аннот., кл. сл. и библиогр. парал. рус., англ. . - ISSN 2220-3397
Рубрики: Языкознание Лингвистика текста Применение вычислительной техники в языкознании Кл.слова (ненормированные): GloVe -- Word2Vec -- fastText -- анализ текста -- векторное представление документов -- векторное представление слов -- дистрибутивная гипотеза -- классификация текстовых текстов -- компьютерная лингвистика -- метод главных компонент -- пост-обработка -- текстовые документы Аннотация: Векторные представления слов являются популярным объектом исследований, и эффективным средством анализа текстовых данных начиная с 1970-х годов. В частности, с их помощью удалось формализовать и дать решения задачам определения смысловой близости слов и поиска аналогий. В данной статье векторные представления слов рассматриваются с точки зрения решения задачи классификации текстовых документов. Популярным средством, используемым для снижения размерности данных, является метод главных компонент. В том числе он применяется и к векторным представлениям слов. В последнее время появился ряд работ, в которых исследуется не совсем традиционный подход к применению данного метода. В них предлагается удалять проекции не на последние, а на первые главные компоненты. Проводимые на этом направлении экспериментальные исследования показывают, что точность решения задач определения смысловой близости слов и поиска аналогий при этом может увеличиться. Целью исследования, описанного в данной работе, является проверка того, сохраняется ли подобный эффект при решении задачи классификации текстовых документов. Доп.точки доступа: Заславский, Д. Д. (студент); Пехтерев, С. И. (студент) Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |