Главная Упрощенный режим Описание Шлюз Z39.50
Авторизация
Фамилия
Пароль
 

Базы данных


БД "Статьи" - результаты поиска

Вид поиска

Область поиска
Формат представления найденных документов:
полныйинформационныйкраткий
Отсортировать найденные документы по:
авторузаглавиюгоду изданиятипу документа
Поисковый запрос: (<.>K=корпус текстов<.>)
Общее количество найденных документов : 2
Показаны документы с 1 по 2
1.


    Бурыкин, Алексей Алексеевич (доктор филологических наук).
    Электронный ресурс для исследований в области русской лексикологии и лексикографии "библиотека лексикографа": опыт работы, перспективы пополнения, возможности пополнения, возможности использования [Текст] = Electronic resource for studies in the field of Russian lexicology and lexicography "lexicographers library": experience, outlook for enlarging, possibilities of using / А. А. Бурыкин // Теоретическая и прикладная лингвистика. - 2015. - № 4. - С. 5-28. - Библиогр.: с. 23-28 (31 назв.) . -
УДК
ББК 81.1
Рубрики: Языкознание
   Прикладное языкознание

Кл.слова (ненормированные):
прикладная лингвистика -- компьютерная лингвистика -- электронные ресурсы -- корпус текстов -- лексикология -- лексикография -- картотека -- тезаурус
Аннотация: Настоящая статья посвящена использованию информационных технологий для обработки филологического материала. Даётся обзор доступных электронных библиотек, достоинств и недостатков организации в них текстового материала, подчёркивается необходимость дальнейшей оптимизации работы в области русской лексикологии и лексикографии. Подробно анализируется созданный корпус «Библиотека лексикографа». В Библиотеке насчитывается 3,1 млрд. словоформ из более чем 260 тыс. текстов различных видов. Максимальная полнота охвата материала, открытость и возможности для неограниченного пополнения и редактирования являются достоинствами проекта. Объективным недостатком проекта является его принципиально оффлайновый характер. Рассматривается проблематика приведения текстового материала к единому формату и повышения эффективности поисковых систем, в том числе в связи с вариантностью графико-орфографической репрезентации материала в разные хронологические периоды. Приводится спектр задач, которые можно решать с помощью «Библиотеки лексикографа», включая описание, уточнение, хронологизацию, систематизацию, восполнение материала.


Имеются экземпляры в отделах: всего 3 : ч.з. (1), н.з. (1), аб. (1)
Свободны: ч.з. (1), н.з. (1), аб. (1)

Найти похожие

2.


    Бутенко, Юлия Ивановна (кандидат технических наук; доцент).
    Метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов [Текст] / Ю. И. Бутенко, Ю. В. Строганов, А. М. Сапожков // Прикладная информатика. - 2021. - Т. 16, № 6. - С. 21-27. - Библиогр. в конце ст. (13 назв.) . - ISSN 1993-8314
УДК
ББК 32.973-018.2
Рубрики: Вычислительная техника
   Обработка и создание документов

Кл.слова (ненормированные):
извлечение терминов -- корпус текстов -- многокомпонентные термины -- научно-технические тексты -- структура текста -- терминологическая лексика
Аннотация: В статье представлен метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов на основе структурных моделей терминологических словосочетаний. Описаны существующие подходы к извлечению терминов на основе метода извлечения устойчивых словосочетаний, статистических и гибридных методов, а также отмечены лингвистические аспекты терминоведения, не охваченные перечисленными методами. Охарактеризован лексический состав научно-технических текстов, приведена классификация специальной лексики в научно-технических текстах. Изучены структурные особенности терминологической лексики. Представлены наиболее продуктивные модели многокомпонентных терминологических словосочетаний в русском языке. Предложен метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов, а также описаны его этапы. Показано, что на первом этапе проводится морфолого- синтаксический анализ текста путем приписывания каждому слову его грамматических характеристик. Затем происходит исключение частей речи, которые не могут входить в состав русскоязычных многокомпонентных терминов, а также стоп-слов, которые вместе с термином образуют свободные словосочетания. Полученные цепочки слов далее соотносятся с шаблонами терминологических словосочетаний, имеющихся в базе структурных моделей терминов, а также с терминологическим словарем на предмет наличия исследуемого термина-кандидата. Обоснована необходимость привлечения терминолога для разрешения неоднозначных случаев. Каждый этап метода извлечения русскоязычных многокомпонентных терминов из научно-технических текстов проиллюстрирован примерами. Перечислены перспективы исследования, а также обоснована необходимость усложнения методов извлечения терминов путем дальнейшей классификации терминологической лексики по формальной и семантической структурам, видам антропоморфных терминов, номенклатурным названиям, нормативности/ненормативности терминологических единиц.


Доп.точки доступа:
Строганов, Юрий Владимирович (кандидат технических наук; доцент); Сапожков, Андрей Михайлович (студент)

Имеются экземпляры в отделах: всего 1 : ч.з. (1)
Свободны: ч.з. (1)

Найти похожие

 
Статистика
за 26.08.2024
Число запросов 157799
Число посетителей 1
Число заказов 0
© Международная Ассоциация пользователей и разработчиков электронных библиотек и новых информационных технологий
(Ассоциация ЭБНИТ)