Тарасов, С. В. (ведущий инженер).
    Контекстно зависимый способ поиска нечетких дубликатов в реляционных базах данных [Текст] / С. В. Тарасов, В. В. Бураков // Информационно-управляющие системы. - 2015. - № 2. - С. 76-81 : 2 табл., 1 рис. - Библиогр.: с. 80 . - ISSN 1684-8853
УДК
ББК 32.973-018.2
Рубрики: Вычислительная техника
   Системы управления базами данных (СУБД)

Кл.слова (ненормированные):
качество данных -- метод N-грамм -- нечеткие дубликаты -- очистка данных -- реляционные базы данных -- смысловые дубликаты
Аннотация: Целью работы является разработка способа обнаружения нечетких дубликатов, который мог бы быть реализован в реляционной модели данных и промышленной реляционной СУБД.


Доп.точки доступа:
Бураков, В. В. (доктор технических наук)
Нет сведений об экземплярах (Источник в БД не найден)




    Мохов, А. С. (ассистент).
    Способы учета структуры научных документов в задачах обработки и анализа текстовой информации [Текст] / А. С. Мохов, В. О. Толчеев // Информационные технологии. - 2016. - Т. 22, № 5. - С. 332-339. - Библиогр.: с. 339 (20 назв.) . - ISSN 1684-6400
УДК
ББК 32.973-018.2
Рубрики: Вычислительная техника
   Обработка и создание документов

Кл.слова (ненормированные):
анализ текстовых данных -- модели текстовых документов -- информационный поиск -- автоматическое аннотирование -- нечеткие дубликаты
Аннотация: Рассмотрены процедуры обработки и анализа текстовой информации на основе учета структуры документа. Приведены основные модели представления текстов в задачах машинного обучения.


Доп.точки доступа:
Толчеев, В. О. (доктор технических наук; профессор)
Нет сведений об экземплярах (Источник в БД не найден)