4.2. принятие решений в условиях полной неопределенности
4.2. принятие решений в условиях полной неопределенности
Неопределенность, связанную с отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной» или «дурной».
В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица.
Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей (97) или связанной с ней матрицы рисков (98).
Критерий максимакса. С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оптимизма. Наилучшим признается решение, при котором достигается максимальный выигрыш, равный M = max max aj .
Нетрудно увидеть, что для матрицы А наилучшим решением будет А і, при котором достигается максимальный выигрыш 9.
Следует отметить, что ситуации, требующие применения такого критерия, в экономике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «или пан, или пропал».
Максиминный критерий Вальда. С позиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник типа тех, которые противодействуют в стратегических играх (см. тему 3). Выбирается решение, для которого достигается значение W = max min агі.
1< г< m 1< j < n '
Для платежной матрицы А (3.1) нетрудно рассчитать:
для первой стратегии (г=1) mrin а, = 1;
для второй стратегии (г=2) min а, = 3;
для третьей стратегии (г=3) min а, = 2.
Тогда W = max min а, = 3, что соответствует второй стратегии А2 игрока 1 .
В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший (W = 3). Это перестраховочная позиция крайнего пессимиста, рассчитанная на худший случай. Такая стратегия приемлема, например, когда игрок не столь заинтересован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Выбор такой стратегии определяется отношением игрока к риску.
Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей А (97), а матрицей рисков R (98):
S = min max rij.
1< i< m 1< j < n '
Для матрицы R (98) нетрудно рассчитать:
для первой стратегии (i=1) max rij = 4;
для второй стратегии (i=2) max rij = 6;
для третьей стратегии (i=3) max Гц = 7.
Минимально возможный из самых крупных рисков, равный 4, достигается при использовании первой стратегии А j .
Критерий пессимизма — оптимизма Турвица.
Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом. Согласно этому критерию, стратегия в матрице А выбирается в соответствии со значением
И, = max pmin aij + (i-p)maxaij
A 1 <i <m у 1< j<n 4 1<j<n ij
где p коэффициент пессимизма (0 < р < 1).
При p = 0 критерий Гурвица совпадает с максимаксным критерием, а при p = 1 с критерием Вальда.
Покажем процедуру применения данного критерия для матрицы А (97) при р = 0,5:
для первой стратегии
(i = 1) 0,5| min aH + max aH 1 = 0,5(1 + 9) = 5;
для второй стратегии
(i = 2) 0,5| min ati + max ati I = 0,5(3 + 8) = 5,5;
^ 1<j< 4 ij 1< j<4 ij 1
для третьей стратегии
(i = 3) 0,5| min a„ + max a„ I = 0,5(2 + 6) = 4
I 1< j < 4 ij 1< j < 4 ij 1
Тогда ИА=max^0,5| min aij +max aij !!> = 5,5, т.е. оптимальной является вторая страА 1<i<3 [ ^ 1<j<4 ij 1<j<4 ij
тегия А 2.
Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
HR= min<! p max rij + (1 p)min rij
R 1<i<my 1<j<n ij 1<j<n ij
При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из
всех возможных рисков (min rti); при р = 1 по критерию минимаксного риска Сэвиджа.
i /j
В случае, когда по принятому критерию рекомендуются к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию, например, в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Данная идея отвечает подходу, рассмотренному в пункте 1.2 (см. рис. 1). Еще раз подчеркнем, что здесь стандартного подхода нет. Выбор может зависеть от склонности к риску ЛПР.
В заключение приведем результаты применения рассмотренных выше критериев на примере следующей матрицы выигрышей:
П1 П2 П3 П4 > | |||
Ai A2 A3 v A4 | 20 30 15 15 75 20 35 20 25 80 25 25 85 5 45 5 j |
Для игрока 1 лучшими являются стратегии:
по критерию Вальда А 3;
по критерию Сэвиджа А 2 и А 3;
по критерию Гурвица (при р = 0,6) А 3;
по критерию максимакса А 4.
Поскольку стратегия А 3 фигурирует в качестве оптимальной по трем критериям
выбора из четырех испытанных, степень ее надежности можно признать достаточно высокой для того, чтобы рекомендовать эту стратегию к практическому применению.
Таким образом, в случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях попытаться получить дополнительную информацию, например, путем проведения исследований или экспериментов. В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны. Хотя применение математических методов в играх с природой не дает абсолютно достоверного результата и последний в определенной степени является субъективным (вследствие произвольности выбора критерия принятия решения), оно тем не менее создает определенное упорядочение имеющихся в распоряжении ЛПР данных: определяются множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях состояния «среда решение». Такое упорядочение представлений о проблеме само по себе способствует повышению качества принимаемых решений.
Обсуждение Моделирование рисковых ситуаций
Комментарии, рецензии и отзывы