Базы знаний интеллектуальных


История искусственного интеллекта в России



страница2/13
Дата22.05.2016
Размер3.92 Mb.
ТипРеферат
1   2   3   4   5   6   7   8   9   ...   13

1.1.4. История искусственного интеллекта
в России

В 1954 г. в МГУ начал свою работу семинар «Автоматы и мышление» под руковод-


ством академика Ляпунова А. А. (1911-1973), одного из основателей российской ки-
бернетики. В этом семинаре принимали участие физиологи, лингвисты, психологи,
математики. Принято считать, что именно в это время родился искусственный ин-
теллект в России. Как и за рубежом, выделились два основных направления — ней-
рокибернетики и кибернетики «черного ящика».

В 1954-1964 гг. создаются отдельные программы и проводятся исследования в


области поиска решения логических задач. В Ленинграде (ЛОМИ — Ленинград-
ское отделение математического института им. Стеклова) создается программа
АЛПЕВ ЛОМИ, автоматически доказывающая теоремы. Она основана на ориги-
нальном обратном выводе Маслова, аналогичном методу резолюций Робинсона.
Среди наиболее значимых результатов, полученных отечественными учеными в
60-е годы, следует отметить алгоритм «Кора» М. М. Бонгарда, моделирующий
деятельность человеческого мозга при распознавании образов. Большой вклад в
становление российской школы ИИ внесли выдающиеся ученые Цетлин М.Л.,
Пушкин В. Н., Гаврилов М. Д чьи ученики и явились пионерами этой науки в Рос-
сии (например, знаменитая Гавриловская школа).

В 1965-1980 гг. происходит рождение нового направления — ситуационного


управления (соответствует представлению знаний, в западной терминологии).
Основателем этой научной школы стал проф. Поспелов Д. А. Были разработаны
специальные модели представления ситуаций — представления знаний [Поспе-
лов, 1986]. В ИПМ АН СССР был создан язык символьной обработки данных
РЕФАЛ [Тургин, 1968].

При том что отношение к новым наукам в советской России всегда было насторо-


женное, наука с таким «вызывающим» названием тоже не избежала этой участи и
была встречена в Академии наук в штыки [Поспелов, 1997]. К счастью, даже среди
членов Академии наук СССР нашлись люди, не испугавшиеся столь необычного
словосочетания в качестве названия научного направления. Двое из них сыграли
огромную роль в борьбе за признание ИИ в нашей стране. Это были академики
А. И. Берг и Г. С. Поспелов.

Только в 1974 году при Комитете по системному анализу при президиуме АН


СССР был создан Научный совет по проблеме «Искусственный интеллект», его
возглавил Г. С. Поспелов, его заместителями были избраны Д. А. Поспелов и
Л. И. Микулич. В состав совета входили на разных этапах М. Г. Гаазе-Рапопорт,
Ю. И. Журавлев, Л. Т. Кузин, А. С. Нариньяни, Д. Е. Охоцимский, А. И. Поло-
винкин, О. К, Тихомиров, В. В. Чавчанидзе.

По инициативе Совета было организовано пять комплексных научных проектов,


которые были возглавлены ведущими специалистами в данной области. Проек-
ты объединяли исследования в различных коллективах страны: «Диалог» (рабо-
ты по пониманию естественного языка, руководители А. П. Ершов, А. С. Наринь-
яни), «Ситуация» (ситуационное управление, Д. А. Поспелов), «Банк» (банки
данных, Л. Т. Кузин), «Конструктор» (поисковое конструирование, А. И. Поло-
винкин), «Интеллект робота» (Д. Е. Охоцимский).

В 1980-1990 гг. проводятся активные исследования в области представления зна-


ний, разрабатываются языки представления знаний, экспертные системы (более
300).

В 1988 г. создается АИИ — Ассоциация искусственного интеллекта. Ее членами


являются более 300 исследователей. Президентом Ассоциации единогласно из-
бирается Д. А. Поспелов, выдающийся ученый, чей вклад в развитие ИИ в
России трудно переоценить. Крупнейшие центры — в Москве, Петербурге, Пе-
реславле-Залесском, Новосибирске. В научный совет Ассоциации входят веду-
щие исследователи в области ИИ — В. П. Гладун, В. И. Городецкий, Г. С. Оси-
пов, Э. В. Попов, В. Л. Стефанюк, В. Ф. Хорошевский, В. К. Финн, Г. С. Цейтин,
А. С. Эрлих и другие ученые. В рамках Ассоциации проводится большое количе-
ство исследований, организуются школы для молодых специалистов, семинары,
симпозиумы, раз в два года собираются объединенные конференции, издается на-
учный журнал.

Уровень теоретических исследований по искусственному интеллекту в России


ничуть не ниже мирового. К сожалению, начиная с 80-х гг. на прикладных рабо-
тах начинает сказываться постепенное отставание в технологии. На данный мо-
мент отставание в области разработки промышленных интеллектуальных систем
составляет порядка 3-5 лет.

1.2. Основные направления исследований
в области искусственного интеллекта

Синтезируя десятки определений ИИ из различных источников, в данной книге в


качестве рабочего определения можно предложить следующее.

Искусственный интеллект — это одно из направлений информатики, целью которого яв-
ляется разработка аппаратно-программных средств, позволяющих пользователю-не-
программисту ставить и решать свои, традиционно считающиеся интеллектуальными за-
дачи, общаясь с ЭВМ на ограниченном подмножестве естественного языка.

Среди множества направлений искусственного интеллекта есть несколько веду-


щих, которые в настоящее время вызывают наибольший интерес у исследовате-
лей и практиков. Опишем их чуть подробнее.

1.2.1. Представление знаний и разработка
систем, основанных на знаниях
(knowledge-based systems)

Это основное направление в области разработки систем искусственного интел-


лекта. Оно связано с разработкой моделей представления знаний, созданием баз
знаний, образующих ядро экспертных систем. В последнее время включает в себя
модели и методы извлечения и структурирования знаний и сливается с инжене-
рией знаний. Именно исследованиям в этой области посвящена данная книга.
Подробнее см. главы 2-5.

1.2.2. Программное обеспечение систем ИИ
(software engineering for Al)

В рамках этого направления разрабатываются специальные языки для решения


интеллектуальных задач, в которых традиционно упор делается на преобладание
логической и символьной обработки над вычислительными процедурами. Эти
языки ориентированы на символьную обработку информации — LISP, PROLOG,
SMALLTALK, РЕФАЛ и др. Помимо этого создаются пакеты прикладных про-
грамм, ориентированные на промышленную разработку интеллектуальных сис-
тем, или программные инструментарии искусственного интеллекта, например
КЕЕ, ART, G2 [Хейес-Рот и др., 1987; Попов, Фоминых, Кисель, Шапот, 1996].
Достаточно популярно также создание так называемых пустых экспертных сис-
тем или «оболочек» — KAPPA, EXSYS, Ml, ЭКО и др., базы знаний которых мож-
но наполнять конкретными знаниями, создавая различные прикладные системы.
Подробно эти технологии рассмотрены в главе 6.

1.2.3. Разработка естественно-языковых
интерфейсов и машинный перевод
(natural language processing)

Начиная с 50-х годов одной из популярных тем исследований в области ИИ яв-


ляется компьютерная лингвистика, и, в частности, машинный перевод (МП).
Идея машинного перевода оказалась совсем не так проста, как казалось первым
исследователям и разработчикам.

Уже первая программа в области естественно-языковых (ЕЯ) интерфейсов — пе-


реводчик с английского на русский язык — продемонстрировала неэффективность
первоначального подхода, основанного на пословном переводе. Однако еще долго
разработчики пытались создать программы на основе морфологического анали-
за. Неплодотворность такого подхода связана с очевидным фактом: человек мо-
жет перевести текст только на основе понимания его смысла и в контексте пред-
шествующей информации, или контекста. Иначе появляются переводы в стиле
«Моя дорогая Маша — my expensive Masha». В дальнейшем системы МП услож-
нялись и в настоящее время используется несколько более сложных моделей:

  • применение так называемых «языков-посредников» или языков смысла, в ре-
    зультате происходит дополнительная трансляция «исходный язык оригина-
    ла — язык смысла — язык перевода»;

  • ассоциативный поиск аналогичных фрагментов текста и их переводов в специ-
    альных текстовых репозиториях или базах-данных;

  • структурный подход, включающий последовательный анализ и синтез есте-
    ственно-языковых сообщений. Традиционно такой подход предполагает на-
    личие нескольких фаз анализа:




  1. Морфологический анализ — анализ слов в тексте.

  2. Синтаксический анализ — разбор состава предложений и грамматических
    связей между словами.

  3. Семантический анализ — анализ смысла составных частей каждого предло-
    жения на основе некоторой предметно-ориентированной базы знаний.

4. Прагматический анализ — анализ смысла предложений в реальном контек-
• сте на основе собственной базы знаний.

Синтез ЕЯ-сообщений включает аналогичные этапы, но несколько в другом по-


рядке. Подробнее см. работы [Попов, 1982; Мальковский, 1985].

1.2.4. Интеллектуальные роботы (robotics)

Идея создания роботов далеко не нова. Само слово «робот» появилось в 20-х


годах, как производное от чешского «робота» — тяжелой грязной работы. Его
автор — чешский писатель Карел Чапек, описавший роботов в своем рассказе
«Р.У.Р».



Роботы — это электротехнические устройства, предназначенные для автоматизации че-
ловеческого труда.

Можно условно выделить несколько поколений в истории создания и развития
робототехники:

I поколение. Роботы с жесткой схемой управления. Практически все современ-
ные промышленные роботы принадлежат к первому поколению. Фактически это
программируемые манипуляторы.

II поколение. Адаптивные роботы с сенсорными устройствами. Есть образцы та-
ких роботов, но в промышленности они пока используются мало.

III поколение. Самоорганизующиеся или интеллектуальные роботы. Это — ко-
нечная цель развития робототехники. Основные нерешенные проблемы при со
здании интеллектуальных роботов — проблема машинного зрения и адекватногс
хранения и обработки трехмерной визуальной информации.

В настоящее время в мире изготавливается более 60 000 роботов в год. Фактиче


ски робототехника сегодня — это инженерная наука, не отвергающая технологи!
ИИ, но не готовая пока к их внедрению в силу различных причин.

1.2.5. Обучение и самообучение
(machine learning)

Активно развивающаяся область искусственного интеллекта. Включает модел£


методы и алгоритмы, ориентированные на автоматическое накопление и фор
мирование знаний на основе анализа и обобщения данных [Гаек, Гавранек, 198с
Гладун, 1994; Финн, 1991]. Включает обучение по примерам (или индуктивное),
также традиционные подходы из теории распознавания образов.

В последние годы к этому направлению тесно примыкают стремительно разви


вающиеся системы data mining — анализа данных и knowledge discovery — поис
ка закономерностей в базах данных.

1.2.6. Распознавание образов
(pattern recognition)

Традиционно — одно из направлений искусственного интеллекта, берущее нач;


ло у самых его истоков, но в настоящее время практически выделившееся в с;
мостоятельную науку. Ее основной подход — описание классов объектов через опр
деленные значения значимых признаков. Каждому объекту ставится в соо'
ветствие матрица признаков, по которой происходит его распознавани
Процедура распознавания использует чаще всего специальные математичесю
процедуры и функции, разделяющие объекты на классы. Это направление бли
ко к машинному обучению и тесно связано с нейрокибернетикой [Справочш
по ИИ, 1990].

11.2.7. Новые архитектуры компьютеров (new
hardware platforms and architectures)

С Самые современные процессоры сегодня основаны на традиционной последов -


ттельной архитектуре фон Неймана, используемой еще в компьютерах первь х
ппоколений. Эта архитектура крайне неэффективна для символьной обработки.
I Поэтому усилия многих научных коллективов и фирм уже десятки лет нацелены
v. на разработку аппаратных архитектур, предназначенных для обработки сим-
в вольных и логических данных. Создаются Пролог- и Лисп-машины, компью-
ттеры V и VI поколений. Последние разработки посвящены компьютерам баз
Л данных, параллельным и векторным компьютерам [Амамия, Танака, 1993].

IИ хотя удачные промышленные решения существуют, высокая стоимость, недо-


с статочное программное оснащение и аппаратная несовместимость с традицион-
i ными компьютерами существенно тормозят широкое использование новых архи-
1 тектур.

1.2.8. Игры и машинное творчество

; Это, ставшее скорее историческим, направление связано с тем, что на заре иссле-


I дований ИИ традиционно включал в себя игровые интеллектуальные задачи —
] шахматы, шашки, го. В основе первых программ лежит один из ранних подхо-
t дов — лабиринтная модель мышления плюс эвристики. Сейчас это скорее ком-
] мерческое направление, так как в научном плане эти идеи считаются тупико-
] выми.

Кроме того, это направление охватывает сочинение компьютером музыки [Зари-


: пов, 1983], стихов, сказок [Справочник по ИИ, 1986] и даже афоризмов [Любич,
1998]. Основным методом подобного «творчества» является метод пермутаций
(перестановок) плюс использование некоторых баз знаний и данных, содержа-
щих результаты исследований по структурам текстов, рифм, сценариям и т. п.

1.2.9. Другие направления

ИИ — междисциплинарная наука, которая, как мощная река по дороге к морю,


вбирает в себя ручейки и речки смежных наук. Выше перечислены лишь те на-
правления, которые прямо или косвенно связаны с основной тематикой учебни-
ка — инженерией знаний. Стоит лишь взглянуть на основные рубрикаторы кон-
ференций по ИИ, чтобы понять, насколько широко простирается область ис-
следований по ИИ:

  • генетические алгоритмы;

  • когнитивное моделирование;

  • интеллектуальные интерфейсы;

  • распознавание и синтез речи;

  • дедуктивные модели;



  • многоагентные системы;

  • онтологии;

  • менеджмент знаний;

  • логический вывод;

  • формальные модели;

  • мягкие вычисления и многое другое.

Конечно, невозможно в рамках одного учебника рассмотреть все многообразие
подходов и идей в области ИИ. Однако некоторые новые направления будут под-
робнее описаны в главах 5, 8, 9.

1.3. Представление знаний и вывод
на знаниях


1.3.1. Данные и знания

При изучении интеллектуальных систем традиционно возникает вопрос — что же


такое знания и чем они отличаются от обычных данных, десятилетиями обраба-
тываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках
которых это становится очевидным.

Данные — это отдельные факты, характеризующие объекты, процессы и явления пред-
метной области, а также их свойства.

При обработке на ЭВМ данные трансформируются, условно проходя следующие
этапы:

  1. D1 — данные как результат измерений и наблюдений;

  2. D2 — данные на материальных носителях информации (таблицы, протоколы,
    справочники);

  3. D3 — модели (структуры) данных в виде диаграмм, графиков, функций;

  4. D4 — данные в компьютере на языке описания данных;

  5. D5 — базы данных на машинных носителях информации.

Знания основаны на данных, полученных эмпирическим путем. Они представля-
ют собой результат мыслительной деятельности человека, направленной на обоб-
щение его опыта, полученного в результате практической деятельности.

Знания — это закономерности предметной области (принципы, связи, законы), получен-
ные в результате практической деятельности и профессионального опыта, позволяющие
специалистам ставить и решать задачи в этой области.

При обработке на ЭВМ знания трансформируются аналогично данным.

  1. Z1 — знания в памяти человека как результат мышления;

  2. Z2 — материальные носители знаний (учебники, методические пособия);

  3. Z3 — поле знаний — условное описание основных объектов предметной облас-
    ти, их атрибутов и закономерностей, их связывающих;

  4. Z4 — знания, описанные на языках представления знаний (продукционные язы-
    ки, семантические сети, фреймы — см. далее);

5. Z5 — база знаний на машинных носителях информации.
Часто используется такое определение знаний.

Знания — это хорошо структурированные данные, или данные о данных, или метаданные.

Существует множество способов определять понятия. Один из широко приме-
няемых способов основан на идее интенсионала. Интенсионол понятия — это
определение его через соотнесение с понятием более высокого уровня абстрак-
ции с указанием специфических свойств. Интенсионалы формулируют знания
об объектах. Другой способ определяет понятие через соотнесение с понятиями
более низкого уровня абстракции или перечисление фактов, относящихся к оп-
ределяемому, объекту. Это есть определение через данные, или экстенсионол по-
нятия.

Пример 1.1

Понятие «персональный компьютер». Его интенсионал: «Персональный компьютер —

это дружественная ЭВМ, которую можно поставить на стол и купить менее чем за

$2000-3000».

Экстенсионал этого понятия: «Персональный компьютер - это Mac, IBM PC, Sinkler...»

Для хранения данных используются базы данных (для них характерны большой
объем и относительно небольшая удельная стоимость информации), для хра-
нения знаний — базы знаний (небольшого объема, но исключительно дорогие
информационные массивы). База знаний — основа любой интеллектуальной си-
стемы.

Знания могут быть классифицированы по следующим категориям:



  • Поверхностные — знания о видимых взаимосвязях между отдельными собы-
    тиями и фактами в предметной области.

  • Глубинные — абстракции, аналогии, схемы, отображающие структуру и приро-
    ду процессов, протекающих в предметной области. Эти знания объясняют яв-
    ления и могут использоваться для прогнозирования поведения объектов.

Пример 1.2

Поверхностные знания: «Если нажать на кнопку звонка, раздастся звук. Если болит


голова, то следует принять аспирин».
Глубинные знания: «Принципиальная электрическая схема зевота и проводки. Знания
физиологов и врачей высокой квалификации о причинах, видах головных болей и методах
их лечения».

Современные экспертные системы работают в основном с поверхностными зна-


ниями. Это связано с тем, что на данный момент нет универсальных методик, по-
зволяющих выявлять глубинные структуры знаний и работать с ними.
Кроме того, в учебниках по ИИ знания традиционно делят на процедурные и дек-
ларативные. Исторически первичными были процедурные знания, то есть зна-
ния, «растворенные» в алгоритмах. Они управляли данными. Для их изменения
требовалось изменять программы. Однако с развитием искусственного интел-
лекта приоритет данных постепенно изменялся, и все большая часть знаний со-
средоточивалась в структурах данных (таблицы, списки, абстрактные типы дан-
ных), то есть увеличивалась роль декларативных знаний.

Сегодня знания приобрели чисто декларативную форму, то есть знаниями счита-


ются предложения, записанные на языках представления знаний, приближенных
к естественному и понятных неспециалистам.

1.3.2. Модели представления знаний

Существуют десятки моделей (или языков) представления знаний для различ-


ных предметных областей. Большинство из них может быть сведено к следую-
щим классам:

  • продукционные модели;

  • семантические сети;

  • фреймы;

  • формальные логические модели.

Продукционная модель

Продукционная модель или модель, основанная на правилах, позволяет представить зна-
ния в виде предложений типа «Если (условие), то (действие)».

Под «условием» (антецедентом) понимается некоторое предложение-образец,
по которому осуществляется поиск в базе знаний, а под «действием» (консеквен-
том)действия, выполняемые при успешном исходе поиска (они могут быть
промежуточными, выступающими далее как условия и терминальными или це-
левыми, завершающими работу системы).

Чаще всего вывод на такой базе знаний бывает прямой (от данных к поиску цели)


или обратный (от цели для ее подтверждения — к данным). Данные — это исход-
ные факты, хранящиеся в базе фактов, на основании которых запускается маши-
на вывода или интерпретатор правил, перебирающий правила из продукцион-
ной базы знаний (см. далее).

Продукционная модель чаще всего применяется в промышленных экспертных


системах. Она привлекает разработчиков своей наглядностью, высокой модуль-
ностью, легкостью внесения дополнений и изменений и простотой механизма ло-
гического вывода.

Имеется большое число программных средств, реализующих продукционный


подход (язык OPS 5; «оболочки» илих<пустые» ЭС — EXSYS Professional, Kappa,
ЭКСПЕРТ; ЭКО, инструментальные системы ПИЭС [Хорошевский, 1993] и
СПЭИС [Ковригин, Перфильев, 1988] и др.), а также промышленных ЭС на его
основе (например, ЭС, созданных средствами G2 [Попов, 1996]) и др.

Семантические сети

Термин семантическая означает «смысловая», а сама семантика — это наука, ус-


танавливающая отношения между символами и объектами, которые они обозна-
чают, то есть наука, определяющая смысл знаков.

Семантическая сеть — это ориентированный граф, вершины которого — понятия, а ду-
ги — отношения между ними.

В качестве понятий обычно выступают абстрактные или конкретные объекты, а
отношения — это связи типа: «это» («АКО — A-Kind-Of», «is»), «имеет частью»
(«has part»), «принадлежит», «любит». Характерной особенностью семантичес-
ких сетей является обязательное наличие трех типов отношений:
i

  • класс — элемент класса (цветок — роза);

  • свойство — значение (цвет — желтый);

  • пример элемента класса (роза — чайная).

Можно предложить несколько классификаций семантических сетей, связанных с
типами отношений между понятиями.

По количеству типов отношений:



  • Однородные (с единственным типом отношений).

  • Неоднородные (с различными типами отношений).
    По типам отношений:

  • Бинарные (в которых отношения связывают два объекта).

• N-арные (в которых есть специальные отношения, связывающие более двух
понятий).

Наиболее часто в семантических сетях используются следующие отношения:



  • связи типа «часть целое» («класс — подкласс», «элемент —множество»,
    и т. п.);

  • функциональные связи (определяемые обычно глаголами «производит»,
    «влияет»...);

  • количественные (больше, меньше, равно...);



  • пространственные (далеко от , близко от, за, под, над...);

  • временные (раньше, позже, в течение...);

  • атрибутивные связи (иметь свойство, иметь значение);

  • логические связи (И, ИЛИ, НЕ);

  • лингвистические связи и др.

Проблема поиска решения в базе знаний типа семантической сети сводится к за-
даче поиска фрагмента сети, соответствующего некоторой подсети, отражающей
поставленный запрос к базе.

Пример 1.3

На рис. 1.1 изображена семантическая сеть. В качестве вершин тут выступают понятия

«человек», «т. Иванов», «Волга», «автомобиль», «вид транспорта» и «двигатель».







Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   ...   13


База данных защищена авторским правом ©dogmon.org 2019
обратиться к администрации

    Главная страница