Страница 124

Страница 124: Базы знаний интеллектуальных систем, Автор неизвестен, 2001 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Учебник для технических вузов по входящим в различные дисциплины вопросам разработки интеллектуальных систем

В язык введены три эпистемологически различных примитива:

• Идентификация объекта, который может быть определен как экземпляр определенного класса, с помощью URL

• Установка значения атрибута объекта.

• Определение отношений между объектами.

Все примитивы синтаксически расширяют тег <а ...> языка HTML. Так, например, если специалист Иванов захочет определить себя как объект обсуждавшейся выше онтологии, он может на своей домашней странице ввести конструкцию вида:

<а onto=" "http://www.anywhere.ru/~ivanov/" : Researcher"> </a>

Теперь для объекта Иванов класса Researcher можно ввести атрибут email и его значение с помощью следующей конструкции:

<а onto=" "http://www. anywhere.ru/~ivanov/"

[email="mailto:ivanov@anvwhere. ru"1 "> </a>

Аналогичным образом вводятся и отношения:

<а onto= "REL(Obj1, Obj2, Obj3, ___ Objn)" > ... </a>

Имеются в языке и средства, которые обеспечивают уменьшение сложности аннотирования: например, возможности именования «длинных» конструкций и последующего использования этих имен.

При таком подходе Ontocrawler — компонент системы Ontobroker — простой CGI-скрипт, который периодически проверяет аннотированные страницы на Web. Для поиска таких страниц он обращается к индексным страницам провайдеров, которые зарегистрированы в рамках инициативы (КА)2.

8.3.3. Проект SHOE — спецификация

онтологии и инструментарий

Общая характеристика проекта

Проект SHOE (Simple HTML Ontology Extensions) ориентирован на решение проблемы добавления к Web-страницам семантической информации и соотнесения ее с онтологиями соответствующих предметных областей. Предполагается, что, используя эту информацию, поисковые системы смогут обеспечивать более релевантные ответы на запросы, чем это возможно сейчас на базе использования машин поиска, функционирующих в Интернете.

Для поддержки процессов аннотирования в рамках проекта SHOE разрабатывается специальный набор инструментальных средств (suite of tools), а основой кх является язык Интернет-совместимого представления знаний, который, собственно, и дал название всему проекту.

В настоящее время в проекте SHOE выделены следующие главные направления исследований:

• Разработка множества повторно используемых онтологии (reusable ontologies) для концептов, которые наиболее частотны для Web-ресурсов.

• Создание средств проектирования онтологии — аннотаторов знаний (Knowledge Annotator), которые бы упростили этот процесс.

Предполагается также, что в SHOE-инструментарий будет включена «несложная» обработка естественного языка (lightweight natural language processing techniques), которая обеспечит представление пользователям аннотаций документов.

Спецификации онтологии и инструментарий SHOE

В данном подразделе мы сосредоточимся не столько на самих онтологиях, разрабатываемых в рамках проекта SHOE [Luke et al, 1996], сколько на языке представления онтологических знаний и средствах поддержки процессов проектирования онтологии.

Формализм представления и машина вывода

Следует сразу отметить, что-SHOE по своей идее близок к уже обсуждавшейся выше инициативе (КА)2. Но концепция языка представления знаний здесь другая, хотя и она лежит в русле расширения HTML специальными тегами. А основное отличие языка SHOE в том, что здесь, по существу, предлагается «полномасштабное» расширение HTML. Для этого SHOE вводит в HTML-стандарт следующие новые теги для спецификации онтологии: ONTOLOGY, USE-ONTOLOGY, DEF-CATEGORY, DEF-RELATION, DEF-ARG. DEF-RENAME, DEF-CON-STANT, DEF-TYPE, DEF-INFERENCE, INF-IF, INF-THEN, COMPARISON, CATEGORY, RELATION, ARC и некоторые другие. Для аннотирования HTML-документов используется часть из уже перечисленных тегов и, кроме того, вводятся новые, например INSTANCE. И наконец, в SHOE вводится метатег вида <МЕТА НТТР-EQUIV =...">.

Для определенности в рамках спецификации языка SHOE предполагается, что онтология представляется в виде is_a иерархии классов/категорий, множества атомарных отношений между категориями и множества правил вывода в форме простых клауз Хорна.

Термами языка являются термы HTML и дополнительно к этому понятия Category (Class), Data (причем с типами STRING, NUMBER, DATE, TRUTH),Element, Instance, Instance Key, Name, Ontology, Relation (Relationship), Rule и некоторые другие.

Декларации онтологии задаются внутри тела HTML-документа и не могут перекрываться с другими тегами HTML. В одном документе может быть определено несколько онтологии, но такие определения тоже не может перекрываться или быть вложенными. Общая схема определения онтологии следующая:

<ONTOLOGY ID="идентификатор-онтологии"

VERSION="версия"

[BACKWARD-COMPATIBLE-WITH="список-версий”]

[DESCRIPTION^1 текст"]

[DECLARATORS="список-деклар.-экземпляров"]>

 собственно-декларация-онтологии

</ONTOLOGY>

Базы знаний интеллектуальных систем

Базы знаний интеллектуальных систем

Обсуждение Базы знаний интеллектуальных систем

Комментарии, рецензии и отзывы

Страница 124: Базы знаний интеллектуальных систем, Автор неизвестен, 2001 читать онлайн, скачать pdf, djvu, fb2 скачать на телефон Учебник для технических вузов по входящим в различные дисциплины вопросам разработки интеллектуальных систем