Страница 61
• система ETS для извлечения и анализа репертуарных решеток с последующим преобразованием их в базу продукционных правил;
• средства конструирования различных иерархических структур знаний;
• средства извлечения, представления и использования неточных знаний;
• средства тестирования и коррекции БЗ;
• средства, позволяющие эксперту оценивать конструкторы по наиболее подходящим шкалам;
• средства работы с несколькими экспертами;
• средства автоматического пополнения и коррекции БЗ.
Dialog Manager представляет собой ЭС, специально созданную для того, чтобы консультировать эксперта о возможностях, представляемых AQUINAS, и руководить экспертом при работе с AQUINAS. Возможны три режима взаимодействия с Dialog Manager:
• автоматический, при котором Dialog Manager полностью берет на себя руководство процессом извлечения знаний;
• ассистирующий, при котором хотя эксперту и даются рекомендации относительно его дальнейших действий, но он может им не следовать;
• режим наблюдения за действиями эксперта и сохранения истории.
Выбрав автоматический или ассистирующий режим, экспрет должен выбрать степень подробности подсказок и объяснений, даваемых системой («полностью», «на среднем уровне», «кратко»).
В БЗ Dialog Manager имеются эвристики, которые позволяют этой системе при накоплении экспертом достаточного опыта перейти от автоматического режима к ассистирующему. Dialog Manager информирует эксперта о переключении режимов. Работая в ассистирующем режиме, Dialog Manager оставляет за экспертом выбор деятельности, но на основе своих эвристик рекомендует наиболее подходящую. В частности, если Dialog Manager считает, что эксперту следует заняться анализом БЗ, то в рекомендации обычно указывается, какой именно аспект нуждается в анализе. Так, эксперту может быть рекомендовано обратиться либо к процедурам анализа сходства элементов (конструкторЪв), либо к процедурам кластеризации элементов (конструкторов), либо к разбиению исходной решетки на несколько иерархически связанных.
Интегрированная среда приобретения знаний KITTEN (Knowledge Initiation & transfer Tools for Experts and Novices) [Show, Woodward, 1988], подобно AQUINAS, основана на построении и анализе репертуарных решеток. Отличие KITTEN от AQUINAS заключается в том, что в KITTEN обеспечивается извлечение элементов и конструкторов из текстов, а кроме того, имеются процедуры, анализирующие примеры решения задач экспертом и генерирующие по ним продукционные правила. Продукционные правила, порождаемые из примеров и решеток, могут быть загружены в БЗ оболочки NEXPERT, с помощью которой проводится тестирование БЗ.
Завершая обзор прямых методов приобретения знаний, суммируем проблемы, которые этими методами не решаются:
• эти методы не устраняют посредника между системой и экспертом;
• автономное использование описанных методов не решает таких проблем инженерии знаний, как устранение «пробелов» в знаниях, выявление «глубинных», невербальных знаний; сохраняется большая «время-емкость» и субъективность интервью;
• фаза приобретения знаний идеологически и теоретически не связывается со следующими фазами инженерии знаний.
4.6.4. Приобретение знаний из текстов
Как было указано в параграфе 4.3, даже ручные методы выявления знаний из текста крайне слабо разработаны. В тех же немногих случаях, когда применяются автоматизированные методики, речь, как правило, идет о методах лексико-семантического анализа, а также о моделях понимания текста.
Наибольшую известность имеют модели понимания на лингвистическом уровне. Системы, основанные на них, состоят в большинстве случаев из двух частей:
• первая — морфологический и синтаксический анализ;
• вторая — семантический анализ, который использует результаты работы первой части, а также словарную или справочную информацию для построения формализованного образа текста.
Говоря о семантическом анализе текста, надо иметь в виду, что всякие отношения текстах его семантикой начинаются после того, как в нашем распоряжении оказывается некоторая модель действительности. Объектами этой модели, в частности, могут являться индивиды и отношения.
Таким образом, первая проблема, возникающая при попытках автоматического извлечения знаний из текста, — это выявление свойств элементов текста для соотнесения этих элементов с объектами модели. Крайне редко эти свойства присутствуют в тексте эксплицитно, то есть явно.
Вторая особенность существующих систем анализа текста — это, как правило, необходимость использования словаря предметной области для выполнения морфологического анализа, выделения имен и словосочетаний и т. д. Однако требование предварительного создания словаря предметной области одновременно сильно осложняет задачу и уменьшает степень универсальности получаемой системы.
Понимание текста на семантическом уровне предполагает выявление не только лингвистических, но и логических отношений между языковыми объектами [Апресян, 1974]. Среди подходов к пониманию текста на семантическом уровне следует выделить модели типа «смысл — текст», в частности, модель семантик предпочтения [Wilks, 1976], модель концептуальной зависимости [Хейес-Рот и др., 1987]. В модели «смысл — текст» [Мельчук, 1974] предлагается семантическое представление на основе семантического графа и описания коммуникативной структуры текста.
В системе KRITON [Diderich, Ruchman, May, 1987] анализ текста используется для выявления хорошо структурированных знаний из книг, документов, описаний, инструкций. Основанный на контент-анализе метод протокольного анализа используется для выявления процедурных знаний. Он осуществляется в пять шагов.
1. Протокол делится на сегменты на основании пауз, которые делает эксперт в процессе записи.
2. Семантический анализ сегментов, формирование высказываний для каждого сегмента.
3. Из текста выделяются операторы и аргументы.
4. Делается попытка поиска по образцу в БЗ для обнаружения переменных в высказываниях (переменная вставляется в высказывание, если соответствующая ссылка в тексте не обнаружена).
Обсуждение Базы знаний интеллектуальных систем
Комментарии, рецензии и отзывы