Тезаурус

Значение слова: ТЕЗАУРУС - в словарях на ЧТО-ОЗНАЧАЕТ.РФ

  • МФА: ед. ч. [tɛˈzaʊrʊs], мн. ч. [tɛˈzaʊrʊsɨ]

Семантические свойства

Значение

  1. совокупность смысловыражающих единиц языка с описанием семантических отношений между ними В. О. Толчеев, «Модели и методы классификации текстовой информации», 2004 г. (цитата из Национального корпуса русского языка, см. Список литературы) обычно формируется на основе использования экспертных знаний в сочетании со статистическим анализом. тезаурусВ настоящее время семантический и лингвистический анализ текстов ещё недостаточно хорошо разработан, чтобы обеспечивать надёжные результаты, поэтому на практике ◆ 

Синонимы

  1. идеографический словарь

Антонимы

         В 70-х гг. 20 в. получили распространение информационно-поисковые Т. В этих Т. выделены специальные лексические единицы —

ы

1. Словарь, в котором словарные единицы сгруппированы по семантическим полям, понятийным группам и т.д.

2. Список особых лексических единиц, которые обычно представляются в виде слов или словосочетаний естественного языка, с зафиксированными логическими отношениями.

3. В общем смысле — совокупность знаний, накопленных человеком или коллективом. В более узком смысле тезаурус — это словарь, предназначенный для поиска слов какого-либо языка по их смыслу.

4. Словарь, отражающий словарный состав данного языка в полном объеме.

До настоящего времени тезаурусы остаются наиболее популярным способом описания знаний в любой области, необходимой для эффективного восприятия человеком.

Отношения слов в тезаурусе

Самыми распространенными отношениями в классическом тезаурусе считаются:

Во-первых, не имеющие в силу своей семантики обратных связей. Например, в программе Грамматический Словарь для многих словарных
статей приводятся примеры их употребления. Эти примеры хранятся в тезаурусе как связи особого типа.

Во-вторых, двунаправленные, другими словами для которых обратная связь имеет тот же тип. Сюда
относятся синонимы и антонимы.

В-третьих, парные. Для них обратная связь всегда допустима и имеет строго определенный тип.
Примеры - гиперонимы и гипонимы, образующие такую взаимодополняющую пару.
К этому же классу можно отнести переводы - обычно если cat
переводится на русский как кошка, то и кошка переводится на
английский как cat.
Ситуацию осложняют теги - дополнительные условия для связей, которые в
случае переводов обычно отвечают за применение перевода в зависимости
от тематики документа.

В-четвертых, двухфакторные или многосвязные. Хороший пример - переводы на русский для кандзи и кана-вариантов
в японском словаре. Если кандзи и кана-написания хранятся как отдельные
словарные статьи, то работа составителя словаря переводов осложняется
необходимостью задавать перевод как для кандзи, так и для
кана-варианта. Автоматизировать создание переводов кана-русский можно с
помощью алгоритма: если есть перевод кандзи на русский, и если есть
кана-вариант для этой кандзи-статьи, то генерируем перевод каны на
русский.

Итак, можно автоматизировать процесс создания обратных связей, описав генераторы обратных связей. Существует 2 синтаксиса для
простых генераторов и для многосвязных.

Описание простого генератора:

linkgeneratorкласс1
<прямая_связка> класс2->
<генерируемая_обратная_связка>

Такой генератор создаст при компиляции словаря связку
класс2 <заданная_обратная_связка>
класс2 из соответствующих прямых
связей, подставив соответствующие статьи.

Можно проиллюстрировать генераторы на примере доформирования русско-английских переводов:

link generatorСУЩЕСТВИТЕЛЬНОЕ <to_english>
ENG_NOUN->
<to_russian>

link generatorENG_NOUN <to_russian>
СУЩЕСТВИТЕЛЬНОЕ-> <to_english>

В этом случае генератор для перевода
существительного с русского на английский автоматически сгенерирует
обратный перевод - с английского на русский. Второе правило выполнит
генерацию перевода русских существительных в английские.

В исходных текстах словаря можно
посмотреть на объявленные правила генерации связей в файле rus-links-generators.sol

Описание многосвязного генератора:

link generator { классA:A <связкаAB> классB:B  классC:C <связкаCD> классD:D } -> X <новая_связка> Y

В данном случае A, B, C, D, X, Y это определяемые пользователем локальные имена для удобства описания генератора. В правильном генераторе переменная C совпадает либо с A, либо с B. Далее, переменные X и Y должны совпадать с парой из множества A, B, C, D.

Очевидно, что падение ценности информации с ростом тезауруса должно зависеть от отношения тезауруса к количеству получаемой информации.

Очевидно, что оптимальная ценность художественной информации соответствует близости тезауруса читателя и тезауруса поэта.


Синонимы

Антонимы

Гиперонимы

Гипонимы

         Ю. А. Шрейдер.

Наверх