ГОСТ 7-24-2007 СИБИД Тезаурус информационно-поисковый многоязычный Состав структура и основные требования к построению

Автор: | 17.02.2015

ФЕДЕРАЛЬНОЕ АГЕНТСТВО
ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ
СТАНДАРТ
РОССИЙСКОЙ
ФЕДЕРАЦИИ

ГОСТ Р
7.24-
2007

Система стандартов по информации, библиотечному и издательскому делу

ТЕЗАУРУС ИНФОРМАЦИОННОПОИСКОВЫЙ МНОГОЯЗЫЧНЫЙ

Состав, структура и основные требования к построению

Москва

Стандартинформ

2006

Предисловие

Цели, основные принципы и основной порядок проведения работ по межгосударственной стандартизации установлены ГОСТ 1.092 «Межгосударственная система стандартизации. Основные положения» и ГОСТ 1.297 «Межгосударственная система стандартизации. Стандарты межгосударственные, правила и рекомендации по межгосударственной стандартизации. Порядок разработки, принятия, применения, обновления и отмены»

Сведения о стандарте

1 РАЗРАБОТАН Всероссийским институтом научной и технической информации Российской академии наук

2 ВНЕСЕН Федеральным агентством по техническому регулированию и метрологии

3 ПРИНЯТ Межгосударственным советом по стандартизации, метрологии и сертификации (протокол 31 от 8 июня 2007 г.)

За принятие проголосовали:

Краткое наименование страны по МК (ИСО 3166) 00497

Код страны по МК (ИСО 3166) 00497

Сокращенное наименование национального органа по стандартизации

Азербайджан

AZ

Азстандарт

Армения

AM

Армстандарт

Беларусь

BY

Госстандарт Республики Беларусь

Грузия

GE

Грузстандарт

Кыргызстан

KG

Кыргызстандарт

Молдова

MD

МолдоваСтандарт

Российская Федерация

RU

Федеральное агентство по техническому регулированию и метрологии

Таджикистан

TJ

Таджикстандарт

Туркменистан

TM

Главгосслужба «Туркменстандартлары»

Узбекистан

UZ

Агентство «Узстандарт»

Казахстан

KZ

Госстандарт Республики Казахстан

4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО 5964:1985 «Документация. Руководство по построению и разработке многоязычных тезаурусов» (ISO 5964:1985«Guidelinesforthe establishment and development of multilingual thesauri», IDT)

5 Приказом Федерального агентства по техническому регулированию и метрологии от 31 октября 2007 г. 287-ст межгосударственный стандарт ГОСТ 7.242001 введен в действие в качестве национального стандарта Российской Федерации с 1 июля 2008 г.

6 ВЗАМЕН ГОСТ 7.24-90

Информация о введении в действие (прекращении действия) настоящего стандарта публикуется в указателе «Национальные стандарты».

Информация об изменениях к настоящему стандарту публикуется в указателе «Национальные стандарты», а текст изменений в информационных указателях «Национальные стандарты». В случае пересмотра или отмены настоящего стандарта соответствующая информация будет опубликована в информационном указателе «Национальные стандарты»

Содержание

 

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

Система стандартов по информации, библиотечному и издательскому делу

ТЕЗАУРУС ИНФОРМАЦИОННОПОИСКОВЫЙ МНОГОЯЗЫЧНЫЙ

Состав, структура и основные требования к построению

System of standards on information, librarianship and publishing. Multilingual thesaurus for information retrieval. Composition, structure and basic requirements for development

Дата введения 20080701

1 Область применения

Настоящий стандарт распространяется на многоязычные информационнопоисковые тезаурусы (далее МИПТ) и устанавливает состав, структуру и основные требования к построению МИПТ, применяемых в информационнопоисковых системах.

2 Нормативные ссылки

В настоящем стандарте использованы ссылки на следующие межгосударственные стандарты:

ГОСТ 7.252001 Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационнопоисковый одноязычный. Правила разработки, структура, состав и форма представления

ГОСТ 7.7496 Система стандартов по информации, библиотечному и издательскому делу. Информационнопоисковые языки. Термины и определения

Примечание При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю «Национальные стандарты», составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться заменяющим (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяется в части, не затрагивающей эту ссылку.

3 Термины и определения

В настоящем стандарте применены термины по ГОСТ 7.7496, а также следующие термины с соответствующими определениями:

3.1 многоязычный информационнопоисковый тезаурус: Информационнопоисковый тезаурус, содержащий лексические единицы, взятые из нескольких естественных языков и представляющий эквивалентные по смыслу понятия на каждом из этих языков.

Примечание Предназначен для обработки документов (запросов) и информационного поиска с целью обмена информацией на различных естественных языках.

3.2 одноязычный информационнопоисковый тезаурус: Информационнопоисковый тезаурус, содержащий лексические единицы, взятые из одного естественного языка.

3.3 языккомпонент МИПТ: Язык, на основе которого разработана какаялибо из одноязычных версий.

3.4 дескриптор МИПТ: Основная лексическая единица МИПТ, представляющая собой совокупность эквивалентных дескрипторов одноязычных версий, связанных средствами для указания эквивалентности.

4 Состав и структура тезауруса

4.1 Обязательными составными частями МИПТ являются:

— вводная часть;

— алфавитные лексикосемантические указатели, включающие средства для указания эквивалентности дескрипторов одноязычных версий (см. 4.4). Допускается в состав тезауруса вводить систематические, пермутационные, иерархические и другие указатели и списки специальных категорий лексических единиц, а также приложения, содержащие дополнительные сведения о разработке и использовании МИПТ.

4.2 Вводная часть включает титульный лист и введение, составленные согласно ГОСТ 7.252001 и изложенные на одном или нескольких языкахкомпонентах.

На титульном листе следует указывать все языкикомпоненты. Рекомендуется наименование тезауруса на титульном листе формулировать на одном языке, а дополнительно к основному титульному листу включать во вводную часть титульные листы на всех языкахкомпонентах. Введение должно содержать краткое описание методических принципов установления эквивалентности дескрипторов одноязычных версий, а также указание на то, что тезаурус разработан в соответствии с настоящим стандартом. Рекомендуется в состав вводной части включать полный или сокращенный перевод введения на всех языкахкомпонентах.

4.3 Алфавитный лексикосемантический указатель в каждой из одноязычных версий содержит перечень тезаурусных статей, расположенных в алфавитном порядке заглавных лексических единиц на соответствующем языкекомпоненте. Состав и структура тезаурусных статей в лексикосемантических указателях одноязычных версий по ГОСТ 7.252001.

4.4 Средства для указания эквивалентности дескрипторов одноязычных версий реализуются введением в тезаурусную статью кода эквивалентности дескрипторов (идентификационного кода) и (или) эквивалентных дескрипторов на языкахкомпонентах.

При использовании идентификационных кодов в дополнение к алфавитному лексико-семантическому указателю МИПТ составляют указатель идентификационных кодов, в котором каждому коду приписывают соответствующие дескрипторы одноязычных версий.

4.5 Систематические, иерархические и пермутационные указатели строятся по ГОСТ 7.252001 на языкахкомпонентах и содержат средства для указания эквивалентности дескрипторов одноязычных версий. Примеры использования средств для указания эквивалентности дескрипторов приведены в приложении А.

4.6 Состав и структура одноязычных версий должны соответствовать следующим требованиям:

— в каждой одноязычной версии должны содержаться все дескрипторы, необходимые для представления онтологии предметной области с целью поиска и обмена информацией между системами, использующими различные языки;

— классы условной эквивалентности лексических единиц одноязычных версий должны соответствовать друг другу по объему выражаемых понятий;

— соответствующие друг другу дескрипторы отдельных одноязычных версий должны иметь по возможности максимально совпадающие парадигматические отношения.

Одноязычные версии допускается дополнять дескрипторами, не являющимися необходимыми для межъязыкового обмена и отсутствующими в других одноязычных версиях; при этом указывают иерархическую подчиненность их какомулибо дескриптору МИПТ.

Одноязычные версии могут включать парадигматические отношения, отсутствующие в других одноязычных версиях, если они на данном языкекомпоненте уточняют понятия, выраженные дескриптором МИПТ, и не противоречат его пониманию в других языкахкомпонентах.

5 Основные требования к построению многоязычных информационнопоисковых тезаурусов

5.1 Содержание работ по формированию одноязычных версий определяют наличием или отсутствием одноязычных тезаурусов по данной тематике на языкахкомпонентах.

5.1.1 При отсутствии одноязычных тезаурусов по данной тематике на языкахкомпонентах, как правило, сначала создают одну одноязычную версию и на ее основе строят остальные.

Возможна также совместная разработка одновременно всех или нескольких одноязычных версий при взаимном согласовании состава дескрипторов и их парадигматических связей.

5.1.2 При наличии тезауруса по данной тематике на одном из языковкомпонентов, как правило, его берут за основу разрабатываемого МИПТ. Другие одноязычные версии формируют подбором эквивалентов дескрипторов этого тезауруса на языкахкомпонентах. При этом возможны различные степени семантического соответствия эквивалентов дескрипторов на различных языках.

5.1.3 При наличии нескольких исходных тезаурусов по данной тематике на языкахкомпонентах разработка МИПТ ведется подбором эквивалентных дескрипторов в данных тезаурусах (см. 5.2.1 и 5.2.2). Дескрипторы, не имеющие эквивалентов в отдельных одноязычных версиях, переводят на соответствующие языки и включают в одноязычные версии, в которых этот дескриптор первоначально отсутствовал. При этом следует вносить в исходные тезаурусы изменения, необходимые для согласования одноязычных версий.

5.1.4 Рекомендуется одну из одноязычных версий выбирать в качестве базовой и устанавливать эквивалентность дескрипторов других одноязычных версий по отношению к дескрипторам базовой версии.

5.2 При установлении эквивалентности дескрипторов различных одноязычных версий необходимо различать на разных языкахкомпонентах следующие степени эквивалентности терминов:

— полная;

— неполная;

— частичная;

— отсутствие эквивалентного термина.

5.2.1 При наличии в языкахкомпонентах полностью эквивалентных терминов их считают представителями одного дескриптора МИПТ.

5.2.2 При отсутствии в языкахкомпонентах полных эквивалентов для выражения одного и того же понятия в качестве дескриптора МИПТ в одноязычных версиях используют неполные и частичные эквиваленты.

Неполными эквивалентами являются термины, для которых объемы выражаемых ими понятий пересекаются.

Частичными эквивалентами являются термины, для которых объем понятия, выражаемого одним эквивалентом, входит в объем понятия, выражаемого другим эквивалентом.

5.2.2.1 Если различие в объеме понятий между неполными или частичными эквивалентами несущественно для данного МИПТ, то их можно использовать для представления дескриптора МИПТ в разных одноязычных версиях, например:

ru: АННОТАЦИЯ

fr: RESUME

5.2.2.2 Если различие в объеме понятий между неполными или частичными эквивалентами существенно, то при представлении дескриптора МИПТ в одноязычных версиях значение используемого термина уточняют одним из следующих способов:

— добавлением релятора (см. 5.2.2.3);

— добавлением примечания (см. 5.2.2.4);

— включением термина в уточняющее словосочетание с определяющими словами (см. 5.2.2.5);

— введением условно эквивалентных аскрипторов в тезаурусную статью дескриптора одноязычной версии (см. 5.2.2.6);

— использованием комбинации двух или более терминов (см. 5.2.2.7).

5.2.2.3 Добавление релятора, который является частью дескриптора, применяют в тех случаях, когда для более полного соответствия содержанию дескриптора необходимо ограничивать объем понятия, выражаемого термином, например:

англ.

русск.

TREE

ДЕРЕВО (РАСТЕНИЕ)

WOOD (MATERIAL)

ДЕРЕВО (МАТЕРИАЛ)

WOOD (LANDSCAPE)

ЛЕС (ЛАНДШАФТ)

5.2.2.4 Добавление примечания, которое не является частью дескриптора, используют в случаях уточнения объема понятия, выраженного соответствующими дескрипторами на разных языкахкомпонентах, например:

франц.

русск.

AFFILIATION

МЕСТО РАБОТЫ (как элемент библиографического описания, обозначающий место работы автора публикации)

5.2.2.5 Включение термина в уточняющее словосочетание применяют в тех случаях, когда требуется ограничивать объем понятия и данное словосочетание устойчиво употребляется в документах, например:

англ.

русск.

CRANE (MACHINE)

ПОДЪЕМНЫЙ КРАН

5.2.2.6 Введение условно эквивалентных аскрипторов в тезаурусную статью дескриптора одноязычной версии применяют в тех случаях, когда они необходимы для однозначного представления понятия в данной версии, например:

англ.

русск.

GRAPH

ГРАФИК

UF diagram chart

 

5.2.2.7 Если исходный дескриптор обозначает понятие, не выраженное в виде единого термина на другом языкекомпоненте, то допускается использовать в одноязычной версии в качестве эквивалента комбинацию двух и более дескрипторов одноязычной версии, например:

франц.

русск.

CARTE PERFOREE+SELECTION

ПЕРФОКАРТА РУЧНОГО

MANUELLE

ОБРАЩЕНИЯ

REFERER ANALYTIQUE+ELABORATION

РЕФЕРИРОВАНИЕ

5.2.3 При отсутствии лексического эквивалента в одном из языковкомпонентов допускаются решения, приведенные в 5.2.3.15.2.3.5.

5.2.3.1 Создание нового термина переводом или калькированием иноязычного дескриптора, например:

англ.

франц.

русск.

FIVE-YEAR PLAN

PLAN QUINQUENNAL

ПЯТИЛЕТНИЙ ПЛАН

5.2.3.2 Использование в качестве эквивалента словосочетания, например:

англ.

русск.

CORER

МАШИНА ДЛЯ УДАЛЕНИЯ СЕРДЦЕВИНЫ ПЛОДА

5.2.3.3 Заимствование иноязычного термина, например:

англ.

русск.

FILE

ФАЙЛ

5.2.3.4 Использование в качестве эквивалента термина с близким значением, например:

франц.

русск.

OUTILS LINGUISTIQUES

ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ

англ.

русск.

TEENAGER

ПОДРОСТОК

5.2.3.5 Использование в качестве эквивалента термина, более широкого по значению и не входящего в лексический состав данной тематической области, например в МИПТ по библиотечному делу:

франц.

русск.

ANIMATEUR

ОРГАНИЗАТОР КУЛЬТМАССОВОЙ РАБОТЫ

5.3 По окончании разработки МИПТ представляют для регистрации в национальный и/или международный центр ведения информационнопоисковых языков. МИПТ представляют в составе всех его одноязычных версий.

Каждая одноязычная версия МИПТ может быть представлена как одноязычный тезаурус с иноязычными эквивалентами.

Национальные и международные центры ведения информационнопоисковых языков предоставляют заинтересованным лицам сведения о зарегистрированных МИПТ на условиях, определяемых разработчиком.

Форма представления одноязычных версий по ГОСТ 7.252001 и .

5.4 Процесс ведения МИПТ сводят к ведению его одноязычных версий и к обеспечению их согласованности. Изменения вносят одновременно во все одноязычные версии после их согласования на уровне языковкомпонентов.

Рекомендуется не реже чем через пять лет обновлять сведения о МИПТ, зарегистрированных по 5.3.

Приложение А (справочное)
Примеры использования средств указания эквивалентности дескрипторов в одноязычных версиях

Примеры

1 Использование цифровых идентификационных кодов, не зависящих от языка:

STALA дескриптор на польском языке

086210 идентификационный код

a      CHARAKTERYSTYKA

INDEKS

MODUL

STALY

WSKAZNIK(LICZBA)

2 Использование эквивалентов дескрипторов на другом языке:

КОНСТАНТА дескриптор на русском языке

STALA дескриптор на польском языке

с Постоянная

а      КОЭФФИЦИЕНТ

МОДУЛЬ

ПОКАЗАТЕЛЬ

ХАРАКТЕРИСТИКА

3 Использование эквивалентов дескрипторов на других языках и идентификационных кодов:

БЕНЗИНЫ дескриптор на русском языке

fre: ESSENCE MOTEUR дескриптор на французском языке

eng: GASOLINE дескриптор на английском языке

pol: BENZYNA дескриптор на польском языке

011420 идентификационный код

в     НЕФТЕПРОДУКТЫ СВЕТЛЫЕ

ТОПЛИВО ЖИДКОЕ

ТОПЛИВО КАРБЮРАТОРНОЕ

н     БЕНЗИНЫ АВИАЦИОННЫЕ

БЕНЗИНЫ АВТОМОБИЛЬНЫЕ

БЕНЗИНЫ АЛКИЛИРОВАННЫЕ

4 Использование совместного расположения статей на двух языках:

русский язык

немецкий язык

АМАЛЬГАМА СЕРЕБРА

SILBERAMALGAM

в МЕТАЛЛЫ

OBMETALLE

н КУПРОАРКВЕРИТ

UB CUPROARQUERIT

Ключевые слова: многоязычный информационнопоисковый тезаурус, дескриптор, лексическая единица, эквивалентность дескрипторов, идентификационный код дескриптора