Базы знаний интеллектуальных



страница7/13
Дата22.05.2016
Размер3.92 Mb.
ТипРеферат
1   2   3   4   5   6   7   8   9   10   ...   13

Рис. 3.4. Функциональная составляющая поля знаний


Структура Sf включает понятия предметной области А и моделирует основные
функциональные связи RA или отношения между понятиями, образующими Sk.
Эти связи отражают модель или стратегию принятия решения в выбранной ПО.
Таким образом Sf образует стратегическую составляющую М.
Семантика. Семантика, придающая определенное значение предложениям любо-
го формального языка, определяется на некоторой области. Фактически это на-
бор правил интерпретации предложений и формул языка. Семантика L должна
быть композиционной, то есть значение предложения определяется как функция
значений его составляющих.

Семантика языка L зависит от особенностей предметной области, она обладает


свойством полиморфизма, то есть одни и те же операторы языка в разных зада-
чах могут иметь свои особенности.

Семантику поля знаний Pz можно рассматривать на двух уровнях. На первом


уровне P'Zg есть семантическая модель знаний эксперта i о некоторой предметной
области Og. На втором уровне любое поле знаний Pz является моделью некоторых
знаний, и, следовательно, можно говорить о смысле его как некоторого зеркала
действительности. Рассматривать первый уровень в отрыве от конкретной облас-
ти нецелесообразно, поэтому остановимся подробнее на втором.
Схему, отображающую отношения между реальной действительностью и полем
знаний, можно представить так, как показано на рис. 3.5.



Рис. 3.5. «Испорченный телефон» при формировании поля знаний

Как следует из рисунка, поле P'JZfi — это результат, полученный «после 4-й транс-


ляции» (если говорить на языке информатики).

• 1-я трансляция (1^) — это восприятие и интерпретация действительности О


предметной области gi-м экспертом. В результате /, в памяти эксперта образу-
ется модель My как семантическая репрезентация действительности и его лич-
ного опыта по работе с ней.



  • 2-я трансляция (V, ) — это вербализация опыта i-ro эксперта, когда он пытает-
    ся объяснить свои рассуждения 5, и передать свои знания Z, инженеру по зна-
    ниям. В результате V, образуется либо текст Tjt либо речевое сообщение Ct

  • 3-я трансляция (Ij) — это восприятие и интерпретация сообщений Т: или Ct j-м
    инженером по знаниям. В результате в памяти инженера по знаниям образует-
    ся модель мира Ма.

  • 4-я трансляция (Kj) — это кодирование и вербализация модели Mffl. в форме
    поля знаний P'JZg.

Более всего эта схема напоминает детскую игру в «испорченный телефон»; перед
инженером по знаниям стоит труднейшая задача — добиться максимального со-
ответствия Mgi и P'JZg. У читателей не должно возникать иллюзий, что Pzg отобра-
жает Og. Ни в коем случае, ведь знания — вещь сугубо авторизованная, следовало
бы на каждой ЭС ставить четкий ярлык i-j, то есть «база знаний эксперта i в пони-
мании инженера по знаниям]». Стоит заменить, например, инженера по знаниям
j на h, и получится совсем другая картина.

Пример 3.1

Приведем пример влияния субъективных взглядов эксперта на М^ и V,. Реаль-
ность (Ок): два человека прибегают на вокзал за 2 минуты до отхода поезда. В кассы —
очередь. В автоматических кассах свободно, но ни у того, ни у другого нет мелочи. Сле-
дующий поезд через 40 минут. Оба опаздывают на важную встречу.

Интерпретация 1-го эксперта (I,): нельзя приходить на вокзал менее чем за 10 минут.


Интерпретация 2-го эксперта (12): надо всегда иметь мелочь в кармане.

Вербализация 1-го эксперта (V,): опоздал к нужному поезду, так как не рассчитал


время.

Вербализация 2-го эксперта (V2): опоздал, так как на вокзале неразбериха, в кассах


толпа.

Последующие трансляции еще больше будут искажать и видоизменять модель, но те-


перь уже с учетом субъективного восприятия инженеров по знаниям.

Таким образом, если считать поле знаний смысловой (семантической) моделью пред-


метной области, то эта модель дважды субъективна. И если модель mk! (см. рис. 3.5) —
это усеченное отображение Og, то само Pz — лишь отблеск Mgi через призму \Л и М^.

Прагматика. В качестве прагматической составляющей семиотической модели


следует рассматривать технологии проведения структурного анализа ПО, поль-
зуясь которым инженер по знаниям может сформировать Pz по результатам ста-
дии извлечения знаний.

Таким образом, под прагматикой будем понимать практические аспекты разра-


ботки и использования поля, то есть как от хаоса черновиков и стенограмм сеан-
сов извлечения знаний перейти к стройной или хотя бы ясной модели.

Подробнее эти вопросы освещены в параграфах 3.4. и 4.4. Однако поле знаний,


несмотря на все старания инженера по знаниям и эксперта, всегда будут лишь
бледным отпечатком реально существующей предметной области, ведь окружа-
ющий нас мир так изменчив, сложен и многообразен, а то, что хранится в нашем
сознании, так плохо поддается вербализации. Тем не менее с точки зрения науч-

ной методологии без продуманного, четкого и красивого поля знаний не может
идти и речи о создании базы знаний промышленной ЭС.

3.1.3. «Пирамида» знаний

Иерархичность понятийной структуры сознания подчеркивается в работах мно-


гих психологов [Брунер, 1971; Веккер, 1976]. Поле знаний можно стратифициро-
вать, то есть рассматривать на различных уровнях абстракции понятий. В «пира-
миде знаний» каждый следующий уровень служит для восхождения на новую
ступень обобщения и углубления знаний в предметной области. Таким образом,
возможно наличие нескольких уровней понятийной структуры Sk
Представляется целесообразным связать это с глубиной профессионального опы-
та (например, как в системе АВТАНТЕСТ [Гаврилова, Червинская, 1992]) или с
уровнем иерархии в структурной лестнице организации (рис. 4.12 главы 4).
Естественно, что и стратегии принятия решений, то есть функциональные струк-
туры Sf, на различных уровнях будут существенно отличаться.
Если попытаться дать математическую интерпретацию уровней пирамиды зна-
ний U = (U,, U2, U3 ,..., Un ), то наиболее прозрачным является понятие гомомор-
физма — отображения некоторой системы Е, сохраняющего основные операции и
основные отношения этой системы.
Пусть
3.2. Стратегии получения знаний

При формировании поля знаний ключевым вопросом является сам процесс по-


лучения знаний, когда происходит перенос компетентности экспертов на инже-
неров по знаниям. Для названия этого процесса в литературе по ЭС получило
распространение несколько терминов: приобретение, добыча, извлечение, полу-
чение, выявление, формирование знаний. В англоязычной специальной литера-
туре в основном используются два: acquisition (приобретение) и elicitation (вы-
явление, извлечение, установление).

Термин «приобретение» трактуется либо очень широко — тогда он включает


весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ
автоматизированного построения базы знаний посредством диалога эксперта и
специальной программы (при этом структура поля знаний заранее закладывает-
ся в программу). В обоих случаях термин «приобретение» не касается самого та-
инства экстрагирования структуры знаний из потока информации о предметной
области. Этот процесс описывается понятием «извлечение».
Авторы склонны использовать этот термин как более емкий и более точно выра-
жающий смысл процедуры переноса компетентности эксперта через инженера по
знаниям в базу знаний ЭС.



некоторая система с основными понятиями о,, i 6 I и основными отношениями г;

J6J.

Гомоморфизмом системы Е в однотипную ей систему Е':



называется отображение



1

удовлетворяющее следующим двум условиям:





Для всех элементовиз Е и всех i I, jJ.

Согласно введенным обозначениям уровни пирамиды суть гомоморфизмы моде-
лей (то есть понятий и отношений) предметной области



— мета-понятия, или понятия более высокого
уровня абстракции; R' — мета-отношения;- мета-стратегии.
Восходя по ступеням пирамиды, мы получаем систему гомоморфизмов, что со-
ответствует результатам, полученным в когнитивной психологии об уменьше-
нии размерности семантического пространства памяти с увеличением опыта эк-
спертов.



Извлечение знаний (knowledge elicitation) — это процедура взаимодействия эксперта с
источником знаний, в результате которой становятся явными процесс рассуждений спе-
циалистов при принятии решения и структура их представлений о предметной области.

В настоящее время большинство разработчиков ЭС отмечает, что процесс извле-
чения знаний остается самым «узким» местом при построении промышленных ЭС.
При этом им приходится практически самостоятельно разрабатывать методы из-
влечения, сталкиваясь со следующими трудностями [Gaines, 1989]:


  • организационные неувязки;

  • неудачный метод извлечения, не совпадающий со структурой знаний в данной
    области;




  • неадекватная модель (язык) для представления знаний.
    Можно добавить к этому [Гаврилова, Червинская, 1992]:

  • неумение наладить контакт с экспертом;

  • терминологический разнобой;




  • отсутствие целостной системы знаний в результате извлечения только «фраг-
    ментов»;

  • упрощение «картины мира» эксперта и др.

Процесс извлечения знаний — это длительная и трудоемкая процедура, в кото-
рой инженеру по знаниям, вооруженному специальными знаниями по когнитив-
ной психологии, системному анализу, математической логике и пр., необходимо
воссоздать модель предметной области, которой пользуются эксперты для при-


нятия решения. Часто начинающие разработчики ЭС, желая упростить эту про-
цедуру, пытаются подменить инженера по знаниям самим экспертом. По многим
причинам это нежелательно.

Во-первых, большая часть знаний эксперта — это результат многочисленных на-


слоений, ступеней опыта. И часто, зная, что из А следует В, эксперт не отдает себе
отчета, что цепочка его рассуждений была гораздо длиннее, например А —> D —¥
С -»В или А -> Q -> R -> В.

Во-вторых, как было известно еще Платону, мышление диалогично. И поэтому


диалог инженера по знаниям и эксперта — наиболее естественная форма изуче-
ния лабиринтов памяти эксперта, в которых хранятся знания, частью носящие
невербальный характер, то есть выраженные не в форме слов, а в форме нагляд-
ных образов, например. И именно в процессе объяснения инженеру по знаниям
эксперт на эти размытые ассоциативные образы надевает четкие словесные яр-
лыки, то есть вербализует знания.

В-третьих, эксперту труднее создать модель предметной области вследствие глу-


бины и объема информации, которой он владеет. Еще в ситуационном управле-
нии [Поспелов, 1986] было выявлено: объекты реального мира связаны более чем
200 типами отношений (временные, пространственные, причинно-следственные,
типа «часть—целое» и др.). Эти отношения и связи предметной области образуют
сложную систему, из которой выделить «скелет» или главную структуру иногда
доступнее аналитику, владеющему к тому же системной методологией.
Термин «приобретение» в рамках данного учебника оставлен за автомати-
зированными системами прямого общения с экспертом. Они действительно
непосредственно приобретают уже готовые фрагменты знаний в соответствии
со структурами, заложенными разработчиками систем. Большинство этих ин-
струментальных средств специально ориентировано на конкретные ЭС с жестко
обозначенной предметной областью и моделью представления знаний, то есть не
являются универсальными.

Приобретение знаний (knowledge acquisition) процесс наполнения базы знаний экс-
пертом с использованием специализированных программных средств.

Например, система TEIRESIAS [Davis, 1982], ставшая прародительницей всех
инструментариев для приобретения знаний, предназначена для пополнения базы
знаний системы MYCIN или ее дочерних ветвей, построенных на «оболочке»
EMYCIN [Shortliffe, 1976] в области медицинской диагностики с использованием
продукционной модели представления знаний. Три поколения и основные тен-
денции СПЗ будут подробно описаны в параграфе 4.5. Более современные конк-
ретные системы описаны далее в параграфе 4.6.

Термин формирование знаний традиционно закрепился за чрезвычайно перспек-


тивной и активно развивающейся областью инженерии знаний, которая занима-
ется разработкой моделей, методов и алгоритмов обучения. Она включает индук-
тивные модели формирования знаний и автоматического порождения гипотез,
например ДСМ-метод [Аншаков, Скворцов, Финн, 1986] на основе обучающих
выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить
причинно-следственные эмпирические зависимости в базах данных с неполной
информацией, содержащих структурированные числовые и символьные объекты
(часто в условиях неполноты информации).

формирование знаний (machine learning) процесс анализа данных и выявление
скрытых закономерностей с использованием специального математического аппарата
и программных средств.

Традиционно к задачам формирования знаний или машинного обучения отно-
сятся задачи прогнозирования, идентификация (синтеза) функций, расшифров-
ки языков, индуктивного вывода и синтеза с дополнительной информацией
[Епифанов, 1984]. В широком смысле к обучению по примерам можно отнести и
методы обучения распознаванию образов [Аткинсон, 1989; Schwartz, 1988].
Индуктивный вывод правил из фактов применен также в системах AQ,
AQUINAS, KSSI, INSTIL и некоторых других.

Наиболее продвинутыми среди методов машинного обучения являются, по-ви-


димому, методы распознавания образов, в частности, алгебраический подход, в
котором предусматривается обогащение исходных эвристических алгоритмов с
помощью алгебраических операций и построение семейства алгоритмов, гаран-
тирующего получение корректного алгоритма для решения изучаемого класса
задач, то есть алгоритма, правильно классифицирующего конечную выборку по
всем классам [Берков, 1972]. Однако применение методов формирования зна-
ний пока не стало промышленной технологией разработки баз знаний.
Для того чтобы эти методы стали элементами технологии интеллектуальных си-
стем, необходимо решить ряд задач [Осипов, 1997]:

  • обеспечить механизм сопряжения независимо созданных баз данных, имею-
    щих различные схемы, с базами знаний интеллектуальных систем;

  • установить соответствие между набором полей базы данных и множеством
    элементов декларативной компоненты базы знаний;

  • выполнить преобразование результата работы алгоритма обучения в способ
    представления, поддерживаемый программными средствами интеллектуаль-
    ной системы.

Помимо перечисленных существуют также и другие стратегии получения
знаний, например, в случае обучения на примерах (case-based reasoning), ког-
да источник знаний — это множество примеров предметной области [Оси-
пов, 1997; Попов, Фоминых, Кисель, 1996]. Обучение на основе примеров
(прецедентов) включает настройку алгоритма распознавания на задачу по-
средством предъявления примеров, классификация которых известна [Ибер-
ла, 1980].

Обучение на примерах тесно связано с машинным обучением. Различие заключа-


ется в том, что результат обучения в рассматриваемом здесь случае должен
быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся
факты и закономерности предметной области, и преобразован в способ представ-

дения, который допускает использование результата обучения в базе знаний, для


моделирования рассуждений, для работы механизма объяснения и т. д., то есть
делает результат обучения элементом соответствующей технологии.

Например, в системе INDUCE [Коов и др., 1988] порождается непротиворечивое


эписание некоторого класса объектов по множествам примеров и контр-приме-
ров данного класса. В качестве языка представления используется язык перемен-
но-значной логики первого порядка (вариант языка многозначной логики перво-
го порядка).

Следует отметить также появление двух новых «флагов» в стане сторонников


методов машинного обучения — это data mining и knowledge discovery. Оба подхо-
ца базируются на анализе данных и поиске закономерностей.

Таким образом, можно выделить три основные стратегии проведения стадии по-


лучения знаний при разработке ЭС (рис. 3.6).

  1. С использованием ЭВМ при наличии подходящего программного инструмен-
    тария, иначе приобретение знаний.

  2. С использованием программ обучения при наличии репрезентативной (то есть
    достаточно представительной) выборки примеров принятия решений в пред-
    метной области и соответствующих пакетов прикладных программ, иначе фор-
    мирование знаний.

  3. Без использования вычислительной техники путем непосредственного контак-
    та инженера по знаниям и источника знаний (будь то эксперт, специальная
    литература или другие источники), иначе извлечение знаний.



Рис. 3.6. Стратегии получения знаний

3 учебнике подробно будут рассматриваться процессы извлечения и приобрете-


1ия знаний, так как на современном этапе разработки ЭС эти стратегии являются
наиболее эффективными и перспективными. Формирование знаний, тяготеющее
» большей степени к области machine learning, то есть индуктивному обучению,
зсновываясь на хорошо исследованном аппарате распознавания образов [Гаек,
Гавранек, 1983] и обнаружения сходства объектов [Гусакова, Финн, 1987], выхо-
шт за рамки данного учебника. Также вне этой книги остались вопросы форми-
ювания знаний из данных (data mining, knowledge discovery) и др.
3.3. Теоретические аспекты извлечения
знаний

Поскольку основной проблемой инженерии знаний является процесс извлечения


знаний, инженеру по знаниям необходимо четко понимать природу и особеннос-
ти этих процессов. Для того чтобы разобраться в природе извлечения знаний,
выделим три основных аспекта этой процедуры (рис. 3.7):

А = (А1, А2, A3} = {психологический, лингвистический, гносеологический}.





Рис. 3.7. Теоретические аспекты инженерии знаний

3.3.1. Психологический аспект

Из трех аспектов извлечения знаний психологический — А1 — является ведущим,


поскольку он определяет успешность и эффективность взаимодействия инжене-
ра по знаниям (аналитика) с основным источником знаний — экспертом-профес-
сионалом. Психологический аспект выделяется еще и потому, что извлечение
знаний происходит чаще всего в процессе непосредственного общения разработ-
чиков системы. А в общении психология является доминантной.
Общение, или коммуникация (от лат. communicatio — связь), — это междисцип-
линарное понятие, обозначающее все формы непосредственных контактов между
людьми — от дружеских до деловых. Оно широко исследуется в психологии, фи-
лософии, социологии, этологии, лингвистике, семиотике и других науках. Суще-
ствует несколько десятков теорий общения, и единственное, в чем сходятся все
авторы, — это сложность, многоплановость процедуры общения. Подчеркивает-
ся, что общение — не просто однонаправленный процесс передачи сообщений и
не двухтактный обмен порциями сведений, а нерасчлененный процесс циркуля-
ции информации, то есть совместный поиск истины [Каган, 1988] (рис. 3.8).
Итак, общение есть процесс выработки новой информации, общей для общаю-
щихся людей и рождающей их общность. И хотя общение — первый вид деятель-
ности, которым овладевает человек в онтогенезе, по-настоящему владеют куль-
турой и наукой общения единицы.

Неправильная
схема

|


Эксперт



Инженер
по знаниям

I


1

Правильная


схема

Эксперт



Инженер
по знаниям

Рис. 3.8. Структура процесса общения

Можно выделить четыре основных уровня общения [Саратовский, 1980].



  1. Уровень манипулирования, когда один субъект рассматривает другого как сред-
    ство или помеху по отношению к проекту своей деятельности.

  2. Уровень «рефлексивной игры», когда в процессе своей деятельности человек
    учитывает «контрпроект» другого субъекта, но не признает за ним самоцен-
    ность и стремится к «выигрышу», к реализации своего проекта.

  3. Уровень правового общения, когда субъекты признают право на существова-
    ние проектов деятельности друг друга и пытаются согласовать их хотя бы вне-
    шне.

  4. Уровень нравственного общения, когда субъекты внутренне принимают общий
    проект взаимной деятельности.

Стремление и умение общаться на высшем, четвертом, уровне может характе-
ризовать степень профессионализма инженера по знаниям. Извлечение зна-
ний — это особый вид общения, который можно отнести к духовно-информа-
ционному типу. Согласно работе [Каган, 1988] общение делится на мате-
риально-практическое; духовно-информационное; практически-духовное. При
этом информационный аспект общения для инженера по знаниям с прагмати-
ческой точки зрения важнейший.

И




Рис. 3.9. Потери информации при разговорном общении

звестно, что потери информации при разговорном общении велики [Мицич,
1987] (рис. 3.9).
В связи с этим рассмотрим проблему увеличения информативности общения
аналитика и эксперта за счет использования психологических знаний.
Можно выделить такие структурные компоненты модели общения при извлече-
нии знаний:

  • участники общения (партнеры);

  • средства общения (процедура);

  • предмет общения (знания).

В соответствии с этой структурой выделим три «слоя» психологических проблем,

возникающих при извлечении знаний (рис. 3.10):

Al = (Sll, S12, S13 } = (контактный, процедурный, когнитивный}.



S11 Контактный
слой

S12 Процедурный
слой

S13 Когнитивный
слой

Рис. 3.10. Психологический аспект извлечения знаний

Контактный слой (S11)

Практически все психологи отмечают, что на любой коллективный процесс вли-


яет атмосфера, возникающая в группе участников. Существуют эксперименты,
результаты которых неоспоримо говорят, что часто дружеская атмосфера в кол-
лективе больше влияет на результат, чем индивидуальные способности отдель-
ных членов группы [Немов, 1984]. Особенно важно, чтобы в коллективе раз-
работчиков складывались кооперативные, а не конкурентные отношения. Для
кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтере<
ванности в успехах друг друга, то есть уровень нравственного общения, а для о'
ношений конкурентного типа - атмосфера индивидуализма и межличностного
соперничества (более низкий уровень общения).

В настоящее время прогнозировать совместимость в общении со 100%-й гаран-


тией невозможно. Однако можно выделить ряд факторов и черт личности, ха-
рактера и других особенностей участников общения, несомненно, оказываю-
щих влияние на эффективность процедуры.

Разработка проблематики контактного слоя позволила выявить следующие^ па-


раметры партнеров, влияющие на результаты процедуры извлечения знаний:

311 = {sll_i} = {пол, возраст, личность, темперамент, мотивация и др.}, часть из


которых впоследствии вошли в формирование модели пользователя.

Значения параметров пола (sll_l) и возраста (sll_2) хотя и влияют на эффек-


тивность контакта, но не являются критическими. В литературе [Иванов, 1986]
этмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщи-
на) и соотношение:

20 > (В, - Ва) > 5,

где Вэ — возраст эксперта; Ва — возраст аналитика.

Под личностью (sll_3) обычно понимается устойчивая система психологичес?


;<их черт, характеризующая индивидуальность человека. Рекомендуемые компо-
ненты si 1_3 исследованы в работе [Гаврилова, 1990] и дополнены качествами из
руководства для журналистов в работе [Schouksmith G., 1978]. si 1_3 = (доброже-
лательность, аналитичность, хорошая память, внимание, наблюдательность, во-
Ьбражение, впечатлительность, большая собранность, настойчивость, общитель-
ность, находчивость).

Со времен Галена и Гиппократа, выделивших четыре классических типа темпе-


эамента (sll_4), вошли в научную терминологию понятия

jll_4= (холерик, сангвиник, меланхолик, флегматик).

Известно, что флегматики и меланхолики медленнее усваивают информацию
"Лунева, Хорошилова, 1987]. И для обеспечения психологического контакта с
ними не следует задавать беседе слишком быстрый темп, торопить их с ответом.
Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых
1войственно поверхностное усваивание информации. Последних следует специ-
шьно наводить на размышление и рефлексию. У меланхоликов часто занижена
тмооценка, они застенчивы и в беседе их надо подбадривать. Таким образом,
ааиболее успешными в рамках слоя S11 являются сангвиники и холерики.

Ла эффективность коллективного решения задач влияет также и мотивация


isll_5), то есть стремление к успеху. Инженер по знаниям в зависимости от ус-
ловий разработки должен изыскивать разнообразные стимулы для экспертов
}включая, разумеется, и материальные). Эксперт передает аналитику один из са-
ных дорогих в мире продуктов — знания. И если одни люди делятся опытом доб-
эовольно и с удовольствием, то другие весьма неохотно приоткрывают свои про-
бессиональные тайны. Иногда полезно оказывается возбудить в эксперте дух
эоперничества, конкуренции (не нарушая, естественно, обстановки кооператив-
посте в коллективе).

Процедурный слой (S12)

параметры процедурного слоя S12 описывают непосредственно процесс прове-


дения процедуры извлечения знаний. Фактически это профессиональные пара-
аетры:

112 = {s!2_i} = {ситуация общения (место, время, продолжительность); оборудо-


вание (вспомогательные средства, освещенность, мебель); профессиональные
рриемы (темп, стиль, методы и др.)}.
Инженер по знаниям, успешно овладевший наукой установления атмосферы до-
верия и взаимопонимания с экспертом (контактный слой — S11), должен еще су-
меть воспользоваться благоприятным воздействием этой атмосферы. Проблема
процедурного слоя касается проведения самой процедуры извлечения знаний.
Здесь мало проницательности и обаяния, полезных для решения проблемы кон-
такта, тут необходимы профессиональные знания.
Остановимся на общих закономерностях проведения процедуры.
s!2_l — ситуация общения определяется следующими компонентами:

  • s!2_l_l — место проведения сеансов;

  • s!2_l_2 — продолжительность проведения сеансов;

  • s!2_l_3 — время проведения сеансов.

Беседу с экспертом лучше всего проводить в небольшом помещении наедине
(s!2_l_l: место), поскольку посторонние люди нарушают доверительность бесе-
ды и могут породить эффект «фасада». Рабочее место эксперта является не са-
мым оптимальным вариантом, так как его могут отвлекать телефонные звонки,
сотрудники и пр. Атмосфера замкнутого пространства и уединенности положи-
тельно влияет на эффективность.

Американский психолог И. Атватер считает, что для делового общения наиболее


благоприятная дистанция от 1,2 до 3 метров [Schouksmith, 1978]. Минимальным
«комфортным» расстоянием можно считать 0,7-0,8 метра.

Реконструкция собственных рассуждений — трудоемкий процесс, и поэтому


длительность одного сеанса (s!2_l_2: продолжительность) обычно не превыша-
ет 1,5-2 часа. Эти два часа лучше выбрать в первой половине дня, например с 10
до 12 часов, если эксперт типа «жаворонок» (s!2_l_3: время). Известно, что вза-
имная утомляемость партнеров при беседе наступает обычно через 20—25 минут
[Ноэль, 1978], поэтому в сеансе нужны паузы.
s!2_2 — оборудование включает:

  • s!2_2_l — вспомогательные средства;

  • s!2_2_2 — освещенность;

  • s!2_2_3 - мебель.
    Вспомогательные средства (s!2_2_l):

  • средства для увеличения эффективности самого процесса извлечения знаний;

  • средства для протоколирования результатов.

К средствам для увеличения эффективности процесса извлечения знаний прежде
всего относится наглядный материал. Независимо от метода извлечения (см. гла-
ву 4), выбранного в конкретной ситуации, его реализация возможна разными спо-
собами. Например, можно учитывать следующий фактор: широко известно, что
людей, занимающихся интеллектуальной деятельностью, можно отнести к худо-
жественному либо мыслительному типу. Термины тут условны и не имеют отно-
шения к той деятельности, которую традиционно называют художественной или

мыслительной. Важно, что, определив тип эксперта, инженер по знаниям может


плодотворнее использовать любой из методов извлечения, зная, что люди худо-
жественного типа легче воспринимают зрительную информацию в форме рисун-
ков, графиков, диаграмм, так как эта информация воспринимается через первую
сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают
язык формул и текстовую информацию. При этом учитывается факт, что боль-
шую часть информации человек получает от зрения. Совет пользоваться актив-
нее наглядным материалом из работы [Хейес—Рот, Уотермена, Ленат, 1987]
можно считать универсальным. Такие методы, как свободный диалог и игры, пре-
доставляют богатые возможности использовать слайды, чертежи, рисунки.
Для протоколирования результатов в настоящее время используются следую-
щие способы:

  • запись на бумагу непосредственно по ходу беседы (недостатки — это часто ме-
    шает беседе, кроме того, трудно успеть записать все, даже при наличии навы-
    ков стенографии);

  • магнитофонная запись (диктофон), помогающая аналитику проанализиро-
    вать весь ход сеанса и свои ошибки (недостаток — может сковывать эксперта);

  • запоминание с последующей записью после беседы (недостаток — годится
    только для аналитиков с блестящей памятью).

Наиболее распространенным способом на сегодня является первый. При этом
наибблыпая опасность тут — потеря знаний, поскольку любая запись ответов -
это уже интерпретация, то есть привнесение субъективного понимания предмета.
Значения параметров освещенности (s!2_2_2) и мебели (s!2_2_3) очевидны и
связаны с влиянием внешних факторов на эксперта.
s!2_3 — профессиональные приемы аналитика, включают, в частности:

  • s!2_3_l - темп;

  • s!2_3_2 - стиль;

  • s!2_3_3 — методы.

Учет индивидуального темпа (s!2_3_l) и стиля (s!2_3_2) эксперта позволяет
аналитику снизить напряженность процедуры извлечения знаний. Типичной
ошибкой является навязывание собственных темпа и стиля.
На успешность также влияет длина фраз, которые произносит инженер по зна-
ниям. Этот факт был установлен американскими учеными — лингвистом Ингве
и психологом Миллером при проведении исследования о причинах низкой усво-
яемости команд на Военно-морском флоте США [Gammack, Young, 1985].
Причина была в длине команд. Оказалось, что человек лучше всего воспринимает
предложения глубиной (или длиной) 7+2(-2) слова. Это число (7±2) получило
название число Ингве—Миллера. Можно считать его мерой «разговорности»
речи. Опытные лекторы используют в лекции в основном короткие фразы, умень-
шая потерю информации с 20-30 % (у плохих лекторов) до 3-4 % [Горелов, 1987].
Большая часть информации поступает к инженеру по знаниям в форме предло-
жений на естественном языке. Однако внешняя речь эксперта естевоспроизведе-
ние его внутренней речи (мышления), которая гораздо богаче и многообразнее.
При этом для передачи этой внутренней речи эксперт использует и невербаль-
ные средства, такие как интонация, мимика, жесты. Опытный инженер по знани-
ям старается записывать по возможности в протоколы (в форме ремарок) эту до-
полнительную интонацию.

В целом, невербальная компонента стиля общения важна и для проблем контакт-


ного слоя при установлении контакта, когда по отдельным жестам и выражению
лица эксперта инженер по знаниям может установить границу возможной «дру-
жественности» общения.

Значение параметра методов (s!2_3_3) подробно рассмотрено в следующей


главе, исходя из позиции, что метод должен подходить к эксперту как «ключ к
замку».

Когнитивный слой (S13)

Когнитивные (от англ, cognition — познание) науки исследуют познавательные


процессы человека с позиций возможности их моделирования (психология, ней-
рофизиология, эргономика, инженерия знаний). Наименее исследованы на сегод-
няшний день проблемы когнитивного слоя S13, связанные с изучением семанти-
ческого пространства памяти эксперта и реконструкцией его понятийной струк-
туры и модели рассуждений.

Основными факторами, влияющими на когнитивную адекватность, будут:


S13 = {s!3_i} = {когнитивный стиль, семантическая репрезентативность поля зна-
ний и концептуальной модели}.

Под когнитивным стилем (s!3_l) человека понимается совокупность критериев


предпочтения при решении задач и познании мира, специфическая для каждого
человека. Когнитивный стиль определяет не столько эффективность деятельно-
сти, сколько способ достижения результата [Алахвердов, 1986]. Это способ по-
знания, который позволяет людям с разными способностями добиваться оди-
наковых результатов в деятельности. Это система средств и индивидуальных
приемов, к которым прибегает человек для организации своей деятельности.
Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный
стиль, а также стиль эксперта. Особенно важны такие характеристики когнитив-
ного стиля, как:

  • s!3_l_l — (полезависимость — поленезависимость);

  • s!3_l_2 — (импульсивность — рефлективность (рефлексивность);

  • s!3_l_3 — (ригидность — гибкость);

  • S13_l_4 — (когнитивная эквивалентность).

s!3_l_l. Поленезависимость позволяет человеку акцентировать внимание лишь
на тех аспектах проблемы, которые необходимы для решения конкретной зада-
чи, и уметь отбрасывать все лишнее, то есть не зависеть от фона или окружаю-
щего задачу шумового поля. Эта характеристика коррелирует с такими чертами
личности, как невербальный интеллект, аналитичность мышления, способность

к пониманию сути. Очевидно, что помимо того, что самому аналитику необходи-


мо иметь высокое значение параметра s!3_l_l, пдденезависимый эксперт — это
тоже желательный фактор. Однако приходится учитывать, что больше нуждают-
ся в общении полезависимые люди, а потому они и более контактны [Орехов,
1985].

Особенно полезны для общения гетерогенные (смешанные) пары, например «по-


лезависимый — поленезависимый» [Иванов, 1986]. В литературе описаны раз-
личные эксперименты, моделирующие общение, требующее понимания и совмест-
ной деятельности. Наиболее успешным в понимании оказались поленезависимые
испытуемые (92 % успеха), для сравнения полезависимые давали 56 % успеха
[Кулюткин, Сухобская, 1971].

!Для совместной профессиональной деятельности важна также гибкость когни-


тивной организации, которая связана с поленезависимостью. Итак, большую
: способность к адекватному пониманию партнера демонстрируют субъекты с вы-
: сокой психологической дифференциацией, то есть поленезависимостью.
Поленезависимость является одной из характерных профессиональных черт ког-
шитивного стиля наиболее квалифицированных инженеров по знаниям. По неко-
торым результатам [Алахвердов, 1986] мужчины более поленезависимы, чем жен-
пцины.

is!3_l_2. Под импульсивностью понимается быстрое принятие решения (часто


)без его достаточного обоснования), а под рефлексивностью — склонность к рас-
судительности. Рефлексивность по экспериментальным данным коррелирует со
способностью к формирования понятий и продуктивностью стратегий решения
шогических задач [Кулюткин, Сухобская, 1971]. Таким образом, и инженеру по
знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль
изменяется лишь частично и с большим напряжением.

jsl3_l_3. Ригидность — гибкость характеризует способность человека к измене-
шию установок и точек зрения в соответствии с изменяющейся ситуацией. Ригид-
шые люди не склонны менять свои представления и структуру восприятия, напро-
чгив, гибкие легко приспосабливаются к новой обстановке. Очевидно, что если
шксперт еще может себе позволить ригидность (что характерно для долго работа-
оющих над одной проблемой специалистов, особенно старшего возраста), то для
шнженера по знаниям эта характеристика когнитивного стиля явно противопо-
казана. Увеличение ригидности с возрастом отмечается многими психологами
^Кулюткин, Сухобская, 1971; Орехов, 1985].

ifc!3_l_4. Когнитивная эквивалентность характеризует способность человека к


различению понятий и разбиению их на классы и подклассы. Чем уже диапазон
скогнитивной эквивалентности, тем более тонкую классификацию способен про-
1вести индивид, тем большее количество признаков понятий он может выделить.
ЭЭбычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
^Семантическая репрезентативность (s!3_2) подразумевает подход, исключающий
•ррадиционное навязывание эксперту некой модели представлений (например,
фродукционной или фреймовой), и заставляет инженера по знаниям последова-
тельно воссоздавать модель мира эксперта, используя как неформальные методы,
так и математический аппарат, например многомерное шкалирование (см. главу
4). Проблема семантической репрезентативности ориентирована на достижение
когнитивной адекватности поля знаний и концептуальной модели. В настоящий
момент она может быть сформулирована как проблема «испорченного телефона»
[Гаврнлова, Червинская, 1992] (см. рис. 3.5) — возможные трансформации и по-
тери в цепи передачи информации:

(О,: предметная область или реальный мир) —>

/7,: интерпретация г-го эксперта]'—»



(Mgt: модель мира эксперта) —>

[V? вербализация модели мира эксперта] —>

(Ti & Ci: вербальные и невербальные сообщения г-го эксперта j- му аналитику) ->

[I: их интерпретация j-ым аналитиком]-*

(Mg: модель мира j-го аналитика) —>

[К: кодирование при формировании поля знаний с последующей структуризацией

в концептуальную модель].

Круглые скобки определяют понятия, квадратные — процессы.



3.3.2. Лингвистический аспект

Лингвистический (А2) аспект касается исследований языковых проблем, так как


язык — это основное средство общения в процессе извлечения знаний.
Сразу же следует оговорить, что поскольку тема данной книги ограничена изло-
жением теории и технологии инженерии знаний, то область разработки есте-
ственно-языковых интерфейсов и весь спектр проблем, связанных с ней — лекси-
ческих, синтаксических, семантических, прагматических и т. д. [Виноград, 1976;
Мальковский, 1985; Попов, 1982], — не рассматривается.

В инженерии знаний можно выделить три слоя лингвистических проблем


(рис. 3.11):

А2 = {S21, S22, 523} - («общий код», понятийная структура, словарь пользова-


теля}.



S21 «Общий код»

S22 Понятийная
структура

S23 Словарь
пользователя

Рис. 3.11. Лингвистический аспект извлечения знаний

«Общий код» (S21)

«Общий код» решает проблему языковых ножниц между профессиональной тер-
минологией эксперта и обыденной литературной речью инженера по знаниям и
включает следующие компоненты:

521 = {s21_i} = (общенаучная терминология; специальные понятия из профессио-


нальной литературы; элементы бытового языка; неологизмы, сформированные
за время совместной работы; профессиональный жаргон и др.}.

Детализация схемы общения (см. рис. 3.8) на рис. 3.11 позволяет представить


;редства общения как два потока [Горелов, 1987], в которых нас интересуют ком-
поненты VI и V2 — языки, на которых говорят аналитик и эксперт (VI1, V2' —
невербальные компоненты). Различие языков VI и V2 и обусловливает «языко-
вый барьер» или «языковые ножницы» в общении инженера по знаниям и экс-
перта.

Эти два языка являются отражением «внутренней речи» эксперта и аналитика,


поскольку большинство психологов и лингвистов считают, что язык — это ос-
новное средство мышления наряду с другими знаковыми системами «внутрен-
него пользования» (универсальный семантический код — УСК [Мартынов, 1977],
языки «смысла» [Мельчук, 1974], концептуальные языки [Шенк, 1980] и др.).

Язык аналитика VI состоит из трех компонентов:

  • s21_l — общенаучной терминологии из его «теоретического багажа»;

  • s21_2 — терминов предметной области, которые он почерпнул из специальной
    литературы в период подготовки;




  • s21_3 — бытового разговорного языка, которым пользуется аналитик.
    Язык эксперта V2 включает:

  • s21_l — общенаучную терминологию;

  • s21_2 — специальную терминологию, принятую в предметной области;

  • s21_3 — бытовой язык;

• s21_4 — неологизмы, созданные экспертом за время работы, то есть его про-
фессиональный жаргон.

Если считать, что бытовой и общенаучный языки у двух участников общения


примерно совпадают (хотя реально объем второго компонента у эксперта суще-
ственно больше), то некоторый общий язык или код, который необходимо выра-
ботать партнерам для успешного взаимодействия, будет складываться из пото-
ков, представленных на рис. 3.12.

В дальнейшем этот общий код преобразуется в некоторую понятийную (семан-


тическую) сеть, которая является прообразом поля знаний предметной области.

Выработка общего кода начинается с выписыванием аналитиком всех терминов,


употребляемых экспертом, и уточнения их смысла. Фактически это составление
словаря предметной области. Затем следует группирование терминов и выбор
синонимов (слов, означающих одно и то же). Разработка общего кода заканчи-

вается составлением словаря терминов предметной области с предварительной


группировкой их по смыслу, то есть по понятийной близости (это уже первый
шаг структурирования знаний).

На этом этапе аналитик должен с большим вниманием отнестись ко всем специ-


альным терминам, пытаясь максимально вникнуть в суть решаемых проблем и
терминологию. Освоение аналитиком языка предметной области — первый ру-
беж на подступах к созданию адекватной базы знаний.



Рис. 3.12. Структура общего кода

Р




Рис. 3.13. Неоднозначность интерпретации

исунок 3.12 дает представление о процессе неоднозначности интерпретации
терминов двумя специалистами. В семиотике, науке о знаковых системах,
проблема интерпретации является одной из центральных. Интерпретация свя-
зывает «знак» и «означаемый предмет». Только в интерпретации знак получает
смысл. Так, на рис. 3.13 слова «прибор X» для эксперта означает некоторую кон-
кретную схему, которая соответствует схеме оригинала прибора, а в голове начи-
нающего аналитика слова «прибор X» вызывают пустой образ или некоторый
черный ящик с ручками.

Внимание к лингвистическому аспекту проблемы извлечения знаний способству-


ет сближению образа 1 с образом 2 и интерпретации 11с интерпретацией 12, а сло-
ва «прибор X» перейдут в действительно «общий» код.

Таким образом, слой S21 включает изучение и управление процессом разработ-


ки специального промежуточного языка, необходимого для взаимодействия ин-
женера по знаниям и эксперта.

Понятийная структура (S22)

Проблемы формирования понятийной структуры представляют следующий


слой S22 лингвистического аспекта проблемы извлечения знаний. Особенности
формирования понятийной структуры обусловлены установленным постулатом
когнитивной психологии о взаимосвязи понятий в памяти человека и наличии
семантической сети, объединяющей отдельные термины во фрагменты, фраг-
менты в сценарии и т. д. Построение иерархической сети понятий, так называе-
мой «пирамиды знаний», — важнейшее звено в проектировании интеллектуаль-
ных систем.

Большинство специалистов по искусственному интеллекту и когнитивной пси-


хологии считают, что основная особенность естественного интеллекта и памяти
в частности — это связанность всех понятий в некоторую сеть. Поэтому для раз-
работки базы знаний и нужен не словарь, а «энциклопедия» [Шенк, Бирнбаум,
Мей, 1989], в которой все термины объяснены в словарных статьях со ссылками
на другие термины.

Таким образом, лингвистическая работа инженера по знаниям на данном слое


проблем заключается в построении таких связанных фрагментов с помощью
«сшивания» терминов. Фактически эта работа является подготовкой к этапу кон-
цептуализации, где это «шитье» (по Шенку — КОП, концептуальная организация
памяти [Шенк, Хантер, 1987]) приобретает некоторый законченный вид.

При тщательный работе аналитика и эксперта в понятийных структурах начина-


ет просматриваться иерархия понятий, подробно о которой будет говориться в
параграфах 4.4. и 8.2. Такие структуры имеют важнейшее гносеологическое и
дидактическое значение и последнее время для них используется специальный
термин — онтологии. Следует заметить, что эта иерархическая организация хо-
рошо согласуется с теорией универсального предметного кода (УПК) [Горелов,
1987; Жинкин, 1982], согласно которой при мышлении используются не языко-
вые конструкции, а их коды в форме некоторых абстракций, что в общем согла-
суется с результатами когнитивной психологии [Величковский, 1982].
Иерархия абстракций — это глобальная схема, которая может быть положена в
основу концептуального анализа структуры знаний любой предметной области.
Лингвистический эквивалент иерархии — иерархия понятий, которую необхо-
димо построить в понятийной структуре, формируемой инженером по знаниям
(рис. 3.14).

Следует подчеркнуть, что работа по составлению словаря и понятийной структу-


ры требует лингвистического «чутья», легкости манипулирования терминами и
богатого словарного запаса инженера по знаниям, так как зачастую аналитик вы-
нужден самостоятельно разрабатывать словарь признаков. Чем богаче и вырази-
тельнее получается общий код, тем более полнее база знаний.



Рис. 3.14. Пример иерархии

Аналитик вынужден все время помнить о трудности передачи образов и пред-


ставлений в вербальной форме. Полезными тут оказываются свойства многознач-
ности слов естественного языка. Часто инженеру по знаниям приходится под-
сказывать слова и выражения эксперту, и такие новые лексические конструкции
оказываются полезными.

Способность к словесной интерпретации зависит и от пола аналитика (параметр


sl_l). Установлено, что традиционно женщины придают большую значимость
невербальным компонентам общения, а в вербальных имеют более обширный ал-
фавит признаков. И вообще, существуют половые различия восприятия не толь-
ко в бытовой сфере, что очевидно, но и в профессиональной. Следовательно, у
эксперта-мужчины и у эксперта-женщины могут существенно отличаться алфа-
виты для вербализации признаков воспринимаемых объектов.

Словарь пользователя (S23)

Лингвистические результаты, соотнесенные к слоям общего кода и понятийной


структуры, направлены на создание адекватной базы знаний. Однако часто про-
фессиональный уровень конечного пользователя не позволяет ему применить
специальный язык предметной области в полном объеме.

Неожиданными для начинающих разработчиков являются проблемы формиро-


вания отдельного словаря для создания дружественного интерфейса с пользова-
телем ЭС, исследуемые в слое S23. Необходимы специальные приемы, увеличи-
вающие «прозрачность» и доступность системы. Для разработки пользователь-
ского интерфейса требуется дополнительная доработка словаря общего кода с по-
правкой на доступность и «прозрачность» системы.

Так, при разработке экспертной системы по психодиагностике АВТАНТЕСТ


[Гаврилова, 1984] пришлось разработать два словаря терминов — один для психо-
логов-профессионалов, второй — для неспециалистов (испытуемых). Поскольку
результат психодиагностического тестирования всегда интересен испытуемому,
ему выдается листинг с психологическим заключением на общелитературном
языке без употребления специальных терминов. Интересно, что при внедрении
системы использовался в основном этот второй словарь; даже профессиональные
психологи предпочитали получать тексты на обыденном языке.

3.3.3. Гносеологический аспект извлечения
знаний


Гносеология — это раздел философии, связанный с теорией познания, или теорией
отражения действительности в сознании человека. Гносеологический аспект (A3)
извлечения знаний объединяет методологические проблемы получения нового
научного знания, поскольку при создании БЗ эксперт часто впервые формулиру-
ет некоторые закономерности, до того момента составлявшие его личный опыт.
Инженерия знаний как наука, если можно так выразиться, дважды гносеологич-
на — сначала действительность (О) отражается в сознании эксперта (Ml), а за-
тем деятельность и опыт эксперта интерпретируются сознанием инженера по
знаниям (М2), что служит уже основой для построения третьей интерпретации
(Р) — поля знаний экспертной системы (см. рис. 3.5). Процесс познания, в сущ-
ности, направлен на создание внутренней репрезентации окружающего мира в
сознании человека.

Предметом данного учебника являются в основном процессы отображения 12 и 13


(II — изучают психология и философия); подробно интерпретация 13 будет рас-
смотрена далее.

Если описать процессы 12 и 13 в терминологии, введенной в главе 1, то мы имеем


дело с превращением экспертного знания и теоретического (книжного) опыта Z1
в поле знаний Z2, которое есть материализация модели мира М2 инженера по зна-
ниям.

В процессе извлечения знаний аналитика в основном интересует компонент Z1,


связанный с неканоническими индивидуальными знаниями экспертов, посколь-
ку предметные области, требующие именно такого типа знаний, считаются наи-
более восприимчивыми к внедрению экспертных систем. Эти области обычно
называют эмпирическими, так как в них накоплен большой объем отдельных эм-
пирических фактов и наблюдений, в то время как их теоретическое обобщение —
вопрос будущего.

Если считать, что инженер по знаниям извлекает только фрагмент Z1', то есть





Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   10   ...   13


База данных защищена авторским правом ©dogmon.org 2019
обратиться к администрации

    Главная страница