Страница 28
• установить соответствие между набором полей базы данных и множеством элементов декларативной компоненты базы знаний;
• выполнить преобразование результата работы алгоритма обучения в способ представления, поддерживаемый программными средствами интеллектуальной системы.
Помимо перечисленных существуют также и другие стратегии получения знаний, например, в случае обучения на примерах (case-based reasoning), когда источник знаний — это множество примеров предметной области [Осипов, 1997; Попов, Фоминых, Кисель, 1996]. Обучение на основе примеров (прецедентов) включает настройку алгоритма распознавания на задачу посредством предъявления примеров, классификация которых известна [Ибер-ла, 1980].
Обучение на примерах тесно связано с машинным обучением. Различие заключается в том, что результат обучения в рассматриваемом здесь случае должен быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся факты и закономерности предметной области, и преобразован в способ представления, который допускает использование результата обучения в базе знаний, для моделирования рассуждений, для работы механизма объяснения и т. д., то есть делает результат обучения элементом соответствующей технологии.
Например, в системе INDUCE [Коов и др., 1988] порождается непротиворечивое описание некоторого класса объектов по множествам примеров и контр-примеров данного класса. В качестве языка представления используется язык перемен-но-значной логики первого порядка (вариант языка многозначной логики первого порядка).
Следует отметить также появление двух новых «флагов» в стане сторонников методов машинного обучения — это data mining и knowledge discovery. Оба подхода базируются на анализе данных и поиске закономерностей.
Таким образом, можно выделить три основные стратегии проведения стадии получения знаний при разработке ЭС (рис. 3.6).
Рис. 3.6. Стратегии получения знаний
1. С использованием ЭВМ при наличии подходящего программного инструментария, иначе приобретение знаний.
2. С использованием программ обучения при наличии репрезентативной (то есть достаточно представительной) выборки примеров принятия решений в предметной области и соответствующих пакетов прикладных программ, иначе формирование знаний.
3. Без использования вычислительной техники путем непосредственного контакта инженера по знаниям и источника знаний (будь то эксперт, специальная литература или другие источники), иначе извлечение знаний.
В учебнике подробно будут рассматриваться процессы извлечения и приобретения знаний, так как на современном этапе разработки ЭС эти стратегии являются наиболее эффективными и перспективными. Формирование знаний, тяготеющее в большей степени к области machine learning, то есть индуктивному обучению, основываясь на хорошо исследованном аппарате распознавания образов [Гаек, Гавранек, 1983] и обнаружения сходства объектов [Гусакова, Финн, 1987], выходит за рамки данного учебника. Также вне этой книги остались вопросы формирования знаний из данных (data mining, knowledge discovery) и др.
3.3. Теоретические аспекты извлечения
знаний
Поскольку основной проблемой инженерии знаний является процесс извлечения знаний, инженеру по знаниям необходимо четко понимать природу и особенности этих процессов. Для того чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой процедуры (рис. 3.7):
А = {А1, А2, A3} = {психологический, лингвистический, гносеологический}.
Рис. 3.7. Теоретические аспекты инженерии знаний
3.3.1. Психологический аспект
Из трех аспектов извлечения знаний психологический — А1 — является ведущим, поскольку он определяет успешность и эффективность взаимодействия инженера по знаниям (аналитика) с основным источником знаний — экспертом-профессионалом. Психологический аспект выделяется еще и потому, что извлечение знаний происходит чаще всего в процессе непосредственного общения разработчиков системы. А в общении психология является доминантной.
Общение, или коммуникация (от лат. communicatio — связь), — это междисциплинарное понятие, обозначающее все формы непосредственных контактов между людьми — от дружеских до деловых. Оно широко исследуется в психологии, философии, социологии, этологии, лингвистике, семиотике и других науках. Существует несколько десятков теорий общения, и единственное, в чем сходятся все авторы, — это сложность, многоплановость процедуры общения. Подчеркивается, что общение — не просто однонаправленный процесс передачи сообщений и не двухтактный обмен порциями сведений, а нерасчлененный процесс циркуляции информации, то есть совместный поиск истины [Каган, 1988] (рис. 3.8).
Рис. 3.8. Структура процесса общения
Итак, общение есть процесс выработки новой информации, общей для общающихся людей и рождающей их общность. И хотя общение — первый вид деятельности, которым овладевает человек в онтогенезе, по-настоящему владеют культурой и наукой общения единицы.
Можно выделить четыре основных уровня-общения [Сагатовский, 1980].
1. Уровень манипулирования, когда один субъект рассматривает другого как средство или помеху по отношению к проекту своей деятельности.
2. Уровень «рефлексивной игры», когда в процессе своей деятельности человек учитывает «контрпроект» другого субъекта, но не признает за ним самоценность и стремится к «выигрышу», к реализации своего проекта.
Обсуждение Базы знаний интеллектуальных систем
Комментарии, рецензии и отзывы