Голомазов, Д. Д. (аспирант, мл. науч. сотр.). Выделение терминов из коллекции текстов с заданным тематическим делением [Текст] / Д. Д. Голомазов> // Информационные технологии. - 2010. - N 2. - С. 8-13. - Библиогр.: с. 13 (9 назв. ) . - ISSN 1684-6400
Рубрики: Вычислительная техника Обработка и создание документов Кл.слова (ненормированные): алгоритм Brainsterm -- выделение терминов -- классификация текстов -- кластеризация текстов -- рубрикация текстов -- векторные модели -- навигация по документам -- коллекции документов Аннотация: Предлагается разработанный и программно реализованный автором статистический алгоритм Brainsterm решения задачи выделения терминов из текстовых документов, разбитых на рубрики. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Чанышев, О. Г. (канд. техн. наук). Метод автоматической кластеризации текстов на основе анализа пересечений кластеров доминант [Текст] / О. Г. Чанышев> // Информационные технологии. - 2010. - N 11. - С. 2-7. . - Библиогр.: с. 7 (18 назв. )
Рубрики: Математика Вычислительная математика Радиоэлектроника Искусственный интеллект. Экспертные системы Кл.слова (ненормированные): методы кластеризации -- кластеризация текстов -- доминанты -- БКТ -- бинарные классифицирующие таксоны -- экспериментальные исследования -- алгоритмы кластеризации Аннотация: Основная цель работы - определение пар текстов с максимальной тематической близостью из заданного множества. Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |
Кольцова, Олеся Юрьевна (кандидат социологических наук). Выявление тематической структуры российской блогосферы: автоматические методы анализа текстов [Текст] / О. Ю. Кольцова, К. А. Маслинский> // Социология: методология, методы, математическое моделирование. - 2013. - № 36 (январь-июнь). - С. 113-139 : табл., рис. - Библиогр.: с. 137-139 (28 назв.) . - ISSN 1994-8964
Рубрики: Социология Социологическое исследование--Россия Кл.слова (ненормированные): Интернет -- автоматические методы анализа -- анализ текстов -- блоги -- кластеризация текстов -- методология социологических исследований -- российская блогосфера -- тематическое моделирование Аннотация: Изложены методологические результаты исследования русскоязычных блогов. Произведена адаптация и апробация автоматизированных методов анализа текстов и соответствующего программного обеспечения для решения содержательных задач (выявление тематической структуры блогосферы, описание ее изменений во времени, выявление процесса образования дискуссионных сообществ). Выделяются и описываются два класса методов деления больших массивов текстов на группы - кластерный анализ и тематическое моделирование; из каждой группы выбирается и апробируется программное обеспечение. Обосновывается выбор в пользу тематического моделирования. Представлено описание полной технологической цепочки от сбора до социологического анализа данных. Доп.точки доступа: Маслинский, Кирилл Александрович (научный сотрудник) Имеются экземпляры в отделах: всего 1 : ч.з. (1) Свободны: ч.з. (1) |