1. принятие решений в условиях неопределенности. Теория игр предмет и задачи теории игр



Скачать 153.5 Kb.
Дата21.05.2016
Размер153.5 Kb.

1.ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ.

ТЕОРИЯ ИГР




1.1.Предмет и задачи теории игр


Подавляющее большинство социально-экономических решений приходится принимать с учетом противоречивых интересов, относящихся либо к различным лицам или организациям, либо к различным аспектам рассматриваемого явления, либо к тому и другому. В таких случаях невозможно применить традиционные методы оптимизации. В обычных экстремальных задачах речь идет о выборе решения одним лицом, и результат решения зависит от этого выбора, то есть определяется действиями только одного лица. В такую схему не укладываются ситуации, где решения, оптимальные для одной стороны, совсем не оптимальны для другой и результат решения зависит от всех конфликтующих сторон.

Конфликтный характер таких задач не предполагает вражды между участниками, а свидетельствует о различных интересах. Необходимость анализировать подобные ситуации вызвала к жизни специальный математический аппарат - теорию игр (ТИ).

Теория игр представляет собой часть обширной теории, изучающей процессы принятия оптимальных решений. Она дает формальный язык для описания процессов принятия сознательных, целенаправленных решений с участием одного или нескольких лиц в условиях неопределенности и конфликта, вызываемого столкновением интересов конфликтующих сторон.

Целью теории игр является выработка рекомендаций по рациональному образу действий участников в конфликтных ситуациях, то есть определение оптимальной стратегии каждого из них.

Первые работы по ТИ (Цермело, Борель, фон Нейман) относятся к началу ХХ века. Но только появление и широкое распространение ЭВМ привлекло к ТИ внимание широкого круга специалистов.

Теория стратегических игр, в своей математической форме, возникла в 30-х годах нашего века. Ее создателем считается Джон фон Нейман. Первой фундаментальной книгой по теории игр была изданная в 1944 году работа "Теория игр и экономическое поведение" (Нейман Д., Моргенштерн О. М.:Наука,1970)

Практическое значение ТИ состоит в том, что она служит основой моделирования игровых экспериментов, в частности, деловых игр, позволяющих определять оптимальное поведение в сложных ситуациях.

Примеры практического и в том числе экономического содержания призваны, скорее всего, содержательно интерпретировать математические положения теории игр, чем указывать на фактические или возможные их приложения. От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам. Реальные конфликты обычно трудно поддаются формальному описанию, поэтому любая игра является упрощением исходной задачи, в ней отражаются лишь основные, первостепенные факторы, отражающие суть процесса или явления.

В зависимости от того, какими данными располагает исследователь, и какую задачу перед собой ставит, могут быть сформулированы различные теоретико-игровые модели. Различают три основных типа задач:

1. Нахождение оптимального исхода. В качестве исхода в общем случае может рассматриваться социально-экономическая ситуация. В зависимости от содержания задачи ситуацию можно описать наборами благ, получаемых каждым игроком (выигрышами), или исходом может быть избрание того или иного кандидата, принятие того или иного проекта, договора и т.д. При этом в общем случае надо найти коалиционную структуру и коалиционные стратегии, при которых оптимальный исход реализуется.

2. Нахождение оптимального исхода при фиксированной коалиционной структуре, то есть когда нам заведомо известно, что, например, образование коалиций, запрещено, невозможно или имеющаяся коалиционная структура не должна меняться по каким-либо политическим или экономическим соображениям. В этом случае общей задачей является нахождение правил принятия решений в коалициях (порядок вознаграждения ее членов), при которых данная коалиционная структура не распадется, и, значит, система будет функционировать согласно интересам и возможностям ее участников.

3. Нахождение устойчивой коалиционной структуры при заданных правилах принятия решений (конституции, нормативных актах, уставе предприятия и др.) в коалициях. Такие задачи часто встречаются при решении экономических и социальных проблем.

Формализованные модели конфликтов известны с давних пор: это игры в буквальном смысле слова - шахматы, карты, кости и т.п. Эти игры носят характер соревнования, протекающего по известным правилам. Терминология, заимствованная из практики таких игр, применима и для других конфликтных ситуаций, которые рассматривает теория игр.




1.1.1. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ


Задолго до появления ТИ широко использовали подобные упрощённые модели конфликтов – игры в буквальном смысле слова: шашки, шахматы, домино и т.д. Отсюда и название самой теории игр и различные термины.

ИГРОЙ называется всякая конфликтная ситуация, изучаемая в теории игр и представляющая собой упрощенную, схематизированную модель ситуации. От реальной конфликтной ситуации игра отличается тем, что не включает второстепенные, несущественные для ситуации факторы и ведется по определенным правилам, которые в реальной ситуации могут нарушаться

Всякая игра включает в себя три элемента: участников игры - игроков, правила игры, оценку результатов действий игроков.

Игроком (лицом, стороной, или коалицией) называется отдельная совокупность интересов, отстаиваемая в игре. Если данную совокупность интересов отстаивает несколько участников игры, то они рассматриваются как один игрок. Игроки, имеющие противоположные по отношению друг к другу интересы, называются противниками. В игре могут сталкиваться интересы двух или более противников. Одна реализация игры называется партией; выбор действия (в пределах правил) – ходом. Ходы бывают личные и случайные. Личный ход предполагает сознательный выбор того или иного действия, разрешенного правилами игры, а случайный – не зависит от воли игрока (например, он может быть определён подбрасыванием монеты или игральной кости и т.п.). Игры, в которых имеются личные ходы, называются стратегическими. Игры, состоящие только из случайных ходов, называют азартными. Характерный пример – игра в лото

Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации.

В зависимости от числа стратегий игры делятся на "конечные" и "бесконечные". Игра называется конечной, если у каждого игрока имеется в распоряжении только конечное число стратегий. В противном случае игра называется бесконечной.

Оптимальной стратегией игрока называется такая, которая обеспечивает ему наилучшее положение в данной игре, т.е. максимальный выигрыш. Если игра повторяется неоднократно и содержит, кроме личных, ещё и случайные ходы, оптимальная стратегия обеспечивает максимальный средний выигрыш.

Игра называется игрой с нулевой суммой, если сумма выигрышей всех игроков равна нулю, т.е. каждый игрок выигрывает только за счёт других. Самый простой случай – парная игра с нулевой суммой – называется антагонистической. Теория антагонистических игр – наиболее развитый раздел теории игр, с чёткими рекомендациями.
Антагонистические игры
Рассмотрим антагонистические игры более подробно.

Игру будем обозначать буквой G . В этой игре участвуют два игрока А и В, имеющих противоположные интересы: выигрыш одного равен проигрыше другого. Так как выигрыш игрока А равен выигрышу игрока В с обратным знаком, мы можем интересоваться только выигрышем а игрока А. Естественно, А хочет максимизировать, а В – минимизировать а. Для простоты отождествим себя с игроком А и будем его называть "мы", а игрока В "противник" (разумеется, никаких реальных преимуществ для игрока А из этого не вытекает). Пусть у нас имеется m возможных стратегий А1, А2, . . . ,Аm, а у противника – n – возможных стратегий В1, В2, . . ., Вn (такая игра называется игрой mn). Обозначим аij наш выигрыш в случае, если мы пользуемся стратегией Аi, а противник – стратегией Вj. Предположим, что для каждой пары стратегий Аi, Вj выигрыш (или средний выигрыш) аij нам известен. Тогда в принципе можно составить прямоугольную таблицу (матрицу), в которой перечислены стратегии игроков и соответствующие выигрыши (см. таблицу).







В1

В2

. . .

Вn

А1

а11

а12




а1n

А2

а21







а2n

. . .













Аm










аmn

Если такая таблица составлена, то говорят, что игра G приведена к матричной форме. Отметим, что само по себе приведение игры к такой форме уже может составить трудную задачу, а иногда и практически не выполнимую, из-за необозримого множества стратегий. Заметим, что если игра приведена к матричной форме, то многоходовая игра фактически сведена к одноходовой – от игрока требуется сделать только один ход: выбрать стратегию. Будем кратко обозначать матрицу игры (аij).



Рассмотрим пример. Игроки А и В одновременно и независима друг от друга записывает каждый одно из трёх чисел: 1, 2 или 3. Если сумма записанных чисел оказывается четной, то игрок В платит игроку А эту сумму; если же сумма чисел оказывается нечетной, то эту сумму выплачивает игрок А игроку В.

У игрока А три стратегии:

А1 – записать 1;

А2 – записать 2;

А3 – записать 3.

Стратегии игрока В аналогичны. Рассматриваемая игра есть игра 33. Платёжная матрица имеет три строки и три столбца. Эта матрица представлена на рис.1.







В1

В2

В3

А1

2

-3

4

А2

-3

4

-5

А3

4

-5

6

Рис. 1. Исходная платёжная матрица


В матрице на рис.1. одни элементы являются положительными, а другие отрицательными. Преобразуем полученную матрицу, прибавив к каждому её элементу значение 6. Преобразованная матрица представлена на рис.2. С точки зрения анализа оптимальных стратегий эта матрица эквивалентна исходной.





В1

В2

В3

А1

8

3

10

А2

3

10

1

А3

10

1

12

Рис.2. Преобразованная платёжная матрица


Принцип максимина

Будем анализировать эту игру, используя платёжную матрицу, показанную на рис.2. Предположим, что мы (игрок А) выбирает стратегию А1. Тогда в зависимости от того, какую стратегию изберёт противник, наш выигрыш будет равен либо 8, либо 3, либо 10. Итак, выбирая стратегию А1, мы в худшем случае получаем выигрыш 3. Если же выберем стратегию А2 или А3, то будем иметь в худшем случае выигрыш 1. Запишем минимальные возможные выигрыши для разных стратегий Аi в виде дополнительного столбца платёжной матрицы (рис.3). Ясно, что следует выбирать ту стратегию, где минимальный возможный выигрыш оказывается наибольшим (по сравнению с остальными стратегиями). В данном случае это стратегия А1. Выигрыш 3 является максимальным в тройке минимальных выигрышей (в тройке 3, 1, 1). Его называют максиминным выигрышем или, проще, максимином. Есть у него ещё одно название – нижняя цена игры.







В1

В2

В3




А1

8

3

10

3

А2

3

10

1

1

А3

10

1

12

1




10

10

12



Рис.3.


матрицы называют седловой точкой матрицы, а об игре говорят, что она имеет седловую точку. Аналогичным образом рассуждает противник. Если он выберет стратегию В1, то в худшем для себя случае позволит нам получить выигрыш 10. То же можно сказать и о стратегии В2. При выборе стратегии В3 худший (для противника) случай соответствует нашему выигрышу, равному 12. Числа 10, 10, 12 – максимальные значения наших выигрышей, отвечающие стратегиям противника В1, В2, В3 соответственно. Выпишем эти значения в виде дополнительной строи платёжной матрицы (см. рис.3). Ясно, что противник должен выбрать ту стратегию, где наш выигрыш оказывается наименьшим. Это есть либо стратегия В1, либо В2. Обе стратегии являются минимаксными., обе они дают противнику гарантию, что наш выигрыш не превысит минимакса, или, иначе, верхней цены игры, равной в данном случае 10.

Наша максиминная стратегия, равно как и минимаксная стратегия противника, является наиболее осторожной, "перестраховочной" стратегией. Принцип осторожности, диктующий игрокам выбор таких стратегий, называют принципом минимакса.



Подведём итоги. Антагонистические игры, в которых каждый игрок имеет конечное множество стратегий, называются матричными играми. Для задания такой игры достаточно выписать так называемую платежную матрицу, в которой строки соответствуют стратегиям первого игрока, а столбцы - стратегиям второго игрока. Элементами матрицы служат выигрыши первого игрока.

Означает ли всё это, что теория игр рекомендует придерживаться только минимаксных (максиминных) стратегий? Ответ на этот вопрос зависит от того, имеет или не имеет платёжная матрица игры седловую точку.


Игра с седловой точкой.

Рассмотрим некоторую игру 33, платёжная матрица которой дана на рис.4. Здесь как максиминный, так и минимаксный выигрыши равны 4. Иными словами, в данной игре нижняя и верхняя цена игры совпадают, обе равны 4.. Выигрыш 4 является одновременно и максимальным из минимальных выигрышей для стратегий А1, А2, А3 и минимальным из максимальных выигрышей для стратегий В1, В2, В3. В геометрии точку на поверхности, являющуюся одновременно минимумом по одной оси координат и максимумом по другой, называют седловой точкой. По аналогии с геометрией элемент а22=4 рассматриваемой здесь платёжной







В1

В2

В3




А1

2

3

7

2

А2

5

4

6

4

А3

6

2

1

1




6

4

7



Рис.4. Платёжная матрица с седловой точкой


Достаточно посмотреть внимательно на матрицу, показанную на рис.4, чтобы понять, что каждый из игроков должен придерживаться максиминной (минимаксной) стратегии. Эти стратегии являются оптимальными в игре с седловой точкой. Любое отклонение от них будет невыгодно для игрока, допустившего отклонение.

Если же игра не имеет седловой точки (см. рис. 3), то ни одна из стратегий Аi или Вi не является оптимальной.

Как быть, если игра не имеет седловой точки? Если каждый игрок вынужден выбирать одну-единственную чистую стратегию, то делать нечего: надо руководствоваться принципом минимакса. Другое дело, если можно свои стратегии "смешивать", чередовать случайным образом с какими-то вероятностями. Применение смешанных стратегий мыслится таким образом: игра повторяется много раз; перед каждой партией игры, когда игроку предоставляется личный ход, он "передоверяет" свой выбор случайности, "бросает жребий", и берёт ту стратегию, которая выпала.

Смешанные стратегии в теории игр представляют модель изменчивой, гибкой тактики, когда ни один из игроков не знает, как поведёт себя противник в данной партии. Такая тактика (правда, обычно безо всяких математических обоснований) часто применяется в карточных играх.



2.Принятие решений в условиях частичной неопределенности. Элементы теории статистических решений

Предметом рассмотрения данного раздела служат статистические модели принятия решений, трактуемые как статистические игры или игры с природой при использовании дополнительной статистической информации о ее стратегиях. Характерная черта статистической игры - возможность получения информации в результате некоторого статистического эксперимента для оценки распределения вероятностей стратегий природы. Исследование механизма случайного выбора стратегии природой позволяет принять оптимальное решение, которое будет наилучшей стратегией в игре с неантагонистическим противником человека - природой.

В рассмотренных разделах теории игр предполагалось, что оба противника (или больше двух) активно противодействуют друг другу, что оба они достаточно умны, чтобы искать и найти свою оптимальную стратегию, и осторожны, чтобы не отступать от нее. Такое положение дает возможность предсказывать поведение игроков. Неопределенность была лишь в выборе противником конкретной чистой стратегии в каждой отдельной партии.

Но возможен случай, когда неопределенность в игре вызвана не сознательным противодействием противника, а незнанием условий, в которых будет приниматься решение, случайных обстоятельств. Такие игры называются "играми с природой".

Игра человека с природой тоже отражает конфликтную ситуацию, возникающую при столкновении интересов в выборе решения. Но "стихийным силам природы" нельзя приписать разумные действия, направленные против человека и тем более какой-либо "злой умысел". Таким образом, корректнее говорить о конфликтной ситуации, вызванной столкновением интересов человека и неопределенностью действий природы.

Действия природы могут, как наносить ущерб, так и приносить прибыль. Поведение природы можно оценить статистическими методами, определить присущие ей закономерности. В зависимости от степени знания этих закономерностей, определяющих поведение природы, различаются игры с природой в условиях определенности и игры с природой в условиях неопределенности.

Во-первых, поведение природы известно полностью (заданы вероятностями). Во-вторых - действия природы не известны, или изучены частично.

К явлениям природы, влияющим на результат решения, относят не только погодные и сезонные явления (дождь, засуху, урожай, неурожай), но и проявление любых, не зависящих от нас обстоятельств: например, задержки на транспорте.

Поиском решений в таких ситуациях и занимается теория статистических решений.

Человек, играя с природой, стремиться максимизировать свой выигрыш, поэтому, если он осторожный игрок (а теория игр рассматривает именно таких игроков), он должен при выборе своей стратегии руководствоваться тем, что неизвестные или известные ему закономерные действия природы приведут к наименее благоприятным последствиям. Именно поэтому такие игры можно рассматривать как игры двух лиц с нулевой суммой, которые были уже нами рассмотрены.

Формализация задачи происходит следующим образом: у активного игрока (человека) возможные действия по-прежнему называются стратегиями, а возможные действия пассивного игрока (природы) - состояниями или условиями природы.

В качестве первого игрока всегда выступает человек, поэтому в матрице записывается его выигрыш. Так как нас интересует оптимальная стратегия человека и его гарантированный выигрыш, то в игру достаточно определить максиминную стратегию первого игрока и нижнюю цену игры. Определение верхней цены игры имеет смысл, если данная игра повторяется многократно и оптимальная стратегия может быть смешанной.




2.1.Игры с природой в условиях определенности.


Если у человека, выступающего против природы, есть статистические данные о закономерностях в конкретных проявлениях природы, то задача легко может быть решена вероятностными методами.

Таким образом, если вероятности состояний природы известны и не изменяются со временем (стационарны), определяется решение, которое дает наибольшее математическое ожидание выигрыша против известной стратегии природы - состояния или условия.

Пример. Фирма купила станок за 100 ден. ед. Для его ремонта можно купить специальное оборудование за 50 ед. или обойтись старым оборудованием. Если станок выходит из строя, его ремонт с помощью спецоборудования обходится в 10 ед., без спецоборудования - в 40 ед. Известно, что в течение срока эксплуатации станок выходит из строя не более трех раз: вероятность того, что станок не сломается - 0,3; сломается 1 раз - 0,4; сломается 2 раза - 0,2; сломается 3 раза - 0,1. Требуется определить целесообразность приобретения специализированного ремонтного оборудования.

Формализация. Первый игрок имеет две чистые стратегии: покупать и не покупать специализированное ремонтное оборудование. У природы - второго игрока - четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша - затраты фирмы на покупку и ремонт станка, задается платежной матрицей:






Выход станка из строя


Ремонтное оборудование

ни разу


1 раз

2 раза

3 раза

не купить

-100

-140

-180

-220

купить

-150

-160

-170

-180


Решение. Рассмотрим сначала эту задачу как антагонистическую игру.

В матрице методом минимакса находим седловую точку: (2,4), таким образом, x* = ( 0, 1 ), y* = ( 0, 0, 0, 1 ), v* = - 180 ден. ед.



Ответ: нужно купить специализированное оборудование.

Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: у = ( 0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.

Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161 , а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит v(x') = - 100 0,3 - 140 0,4 - 180 0,2 - 220 0,1 = - 144 .

Таким образом, первому игроку выгодно играть не оптимально!



Ответ: не покупать специализированное оборудование.

Существенное различие между значениями v(x*) и v(x') объясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 ден. единиц выигрыша.



2.2.Игры с природой в условиях неопределенности.

Если распределение вероятностей будущих состояний природы не известно, вся информация о природе сводится к перечню ее возможных состояний.



Пример. Игра "Поставщик".

Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед. Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции. Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем. Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед. Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его количество на складе превысит допустимую норму, равную одной партии.

Какой стратегии должен придерживаться завод в сложившейся ситуации?

Формализация. У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транспорт, 3) послать к поставщику представителя и транспорт, 4) купить и привезти материал-заменитель от другого поставщика.

Составим таблицу расчетов:







Затраты и убытки фирмы-изготовителя

Ситуация

Стоимость материала

Недовыпуск продукции

Транспорт

Командировочные расходы

Издержки хранения

Общая сумма

1 1

- 100

0

0

0

0

- 100

1 2

0

- 400

0

0

0

- 400

2 1

- 100

0

- 50

0

0

- 150

2 2

- 50

- 200

- 50

0

0

- 300

3 1

- 100

0

- 50

- 50

0

- 200

3 2

- 80

- 80

- 50

- 50

0

- 260

4 1

- 250

0

- 50

0

- 30

- 330

4 2

- 150

0

- 50

0

0

- 200


Решение. На основе полученных результатов вычислений можно составить платежную матрицу:







min

max

- 100

- 400

- 400




- 150

- 300

- 300




- 200

- 260

- 260

- 260

- 330

- 200

- 330





Ответ. Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транспорт.

1. Рассмотренный способ поиска оптимального решения называется критерием Вальда (Максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:

vW = maxi minj aij = -260 ед.

Применяя этот критерий, мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход.

2. Максимаксный критерий. Самый благоприятный случай:

vM = maximaxj aij = -100 ед.

Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма.

2.3.Критерий пессимизма-оптимизма Гурвица.

Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей:

vH = maxi [ maxi aij + (1-) minj aij ], где  - “степень оптимизма” , 0  1.

При  = 0 критерий Гурвица тождественен критерию Вальда, а при  =1 совпадает с максиминным решением.

На выбор значения степени оптимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма  ближе к нулю.

Влияние степени оптимизма на выбор решения в задаче “Поставщик”.






Степень оптимизма

Решение




0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9


А1

1 стратегия

-370

-340

-310

-280

-250

-220

-190*

-160*

-130*

А2

2 стратегия

-285

-270

-255

-240

-225*

-210*

-195

-180

-165

А3

3 стратегия

-254*

-248*

-242*

-236*

-230

-224

-218

-212

-206

А4

4 стратегия

-317

-304

-281

-278

-265

-252

-239

-226

-213

Величина vH для каждого значения  отмечена. При   4/9 критерий Гурвица рекомендует в задаче “Поставщик” решение А3, при 4/9  2/3 - решение А2. В остальных случаях А1. А4 не выгодно во всех случаях.



2.4.Критерий Сэвиджа (критерий минимакса риска).


На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем в 1954 году и получил название принципа Сэвиджа. Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.

По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.

При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.

Для решения задачи строится так называемая “матрица рисков”, элементы которой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального варианта решения.



Риском игрока rij при выборе стратегии i в условиях (состояниях) природы j называется разность между максимальным выигрышем, который можно получить в этих условиях и выигрышем, который получит игрок в тех же условиях, применяя стратегию i.

Если бы игрок знал заранее будущее состояние природы j, он выбрал бы стратегию, которой соответствует max элемент в данном столбце: maxi aij, тогда риск: rij = maxi aij - aij.

Критерий Сэвиджа рекомендует в условиях неопределенности выбирать решение, обеспечивающее минимальное значение максимального риска:

vS = mini maxj rij = mini maxj (maxi aij - aij).

Для задачи “Поставщик” минимакс риска достигается сразу при двух стратегиях А2 и А3:








max

min

0

200

200




50

100

100

100

100

60

100

100

230

0

130



2.5.Критерий Лапласа.


В ряде случаев представляется правдоподобным следующее рассуждение: поскольку неизвестны будущие состояния природы, постольку можно считать их равновероятными. Этот подход к решению используется в критерии “недостаточного основания” Лапласа.

Для решения задачи для каждого решения подсчитывается математическое ожидание выигрыша (вероятности состояний природы полагаются равными qj = 1/n, j = 1:n), и выбирается то решение, при котором величина этого выигрыша максимальна.

vL = maxi 1/n aij = 1/n maxi aij.

Решением игры “Поставщик” по критерию Лапласа является вторая стратегия:







max

-250




-225

-225

-230




-265




Гипотеза о равновероятности состояний природы является довольно искусственной, поэтому принципом Лапласа можно пользоваться лишь в ограниченных случаях. В более общем случае следует считать, что состояния природы не равновероятны и использовать для решения критерий Байеса-Лапласа.

2.6.Критерий Байеса-Лапласа.


Этот критерий отступает от условий полной неопределенности - он предполагает, что возможным состояниям природы можно приписать определенную вероятность их наступления и, определив математическое ожидание выигрыша для каждого решения, выбрать то, которое обеспечивает наибольшее значение выигрыша:

vBL = maxi  aij qj.

Этот метод предполагает возможность использования какой-либо предварительной информации о состояниях природы. При этом предполагается как повторяемость состояний природы, так и повторяемость решений, и прежде всего, наличие достаточно достоверных данных о прошлых состояниях природы. То есть, основываясь на предыдущих наблюдениях прогнозировать будущее состояние природы (статистический принцип).

Возвращаясь к нашей игре “Поставщик” предположим, что руководители фирмы-потребителя, прежде чем принять решение, проанализировали, насколько точно поставщик ранее выполнял сроки поставок, и выяснили, что в 25 случаях из 100 сырье поступало с опозданием.

Исходя из этого, можно приписать вероятность наступления первого состояния природы вероятность qj = 0,75 = (1-0,25), второго - qj = 0,25. Тогда согласно критерию Байеса-Лапласа оптимальным является решение А1.


Стратегии

 aij qj

А1

- 175*

А2

-187,5

А3

- 215

А4

- 297,5

Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий, однако и этого достаточно, чтобы проблема выбора решения стала неоднозначной:


Решение

Критерии

Стратегии

Вальда

maxmax

Гурвица

Сэвиджа

Лапласа

Байеса-Л

А1




*

*







*

А2







*

*

*




А3

*




*

*







А4


















Из таблицы видно, что от выбранного критерия (а в конечном счете - от допущений) зависит и выбор оптимального решения.

Выбор критерия (как и выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хотя бы частичной информации относительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы, применяют метод Байеса-Лапласа, либо проводят эксперимент, позволяющий уточнить поведение природы.

3.Литература


1. Аллен Р. Математическая экономия. М., Изд.ин.лит.,1963

2. Вентцель Е.С. Исследование операций. М.: Советское радио, 1972

3. Вильямс Дж. Д. Совершенный стратег. - М.: ИЛ,1960

4. Карлин С. Математические методы в теории игр, программировании и экономике М.: Мир, 1964

5. Кофман А., Фор Р. Займемся исследованием операций. М: Мир, 1966

6. Ланге О. Оптимальные решения. М. Прогресс, 1967 .

7 Мак-Кинси Дж. Введение в теорию игр. М., Физматгиз,1966

8. Оуэн Г. Теория игр. М., Мир 1971

9. Р.Л. Кини, Х. Райфа. Принятие решений при многих критериях: предпочтения и замещения. М.: Радио и связь, 1981

10. Р.Штойер. Многокритериальная оптимизация. Теория, вычисления, приложения. М.: Радио и связь, 1992

11. Вопросы анализа и процедуры принятия решений. М.: Мир, 1976

12. Статистические модели и многокритериальные задачи принятия решений М.: Статистика, 1979.

13. Р.Л. Кини. Теория принятия решений. - В кн. Исследование операций. М.: Мир, 1981 г.

14. Воробьев Н.Н. Теория игр для экономистов-кибернетиков, М.: Наука, 1985.

15. Крушевский А.В. Теория игр. Киев: Вища школа, 1977.

16. Дюбин Г.Н., Суздаль В.Г. Введение в прикладную теорию игр. М.: Наука, 1981

17. Мешковой Н.П., Закиров Р.Ш. Теория игр, конспект лекций. Челябинск, ЧПИ, 1974

18. Э.Й.Вилкас в сб. Современные направления теории игр. Вильнюс. Мокслас, 1976



19. А.Д.Школьников Основы теории игр. Л, Изд. Горного института, 1970

20. Смоляков. Всегда существующее решение кооперативных игр и его применение к анализу рынков. М.: ВНИИСИ, 1978.

Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©dogmon.org 2017
обратиться к администрации

    Главная страница