1. ОБЩАЯ МЕТОДИКА ФОРМИРОВАНИЯ КРИТЕРИЕВ
Сутьпредлагаемой методики формирования критериев заключается в реализации следующихпунктов.
1) Извыигрышей аij, i=1,…,m; j=1,…,n, игрока А составляем матрицу А, предполагая,что она удовлетворяет указанным выше условиям: m³2, n³2 и она несодержит доминируемых (в частности, дублируемых) строк.
Выигрышиаij игрока А, представленные в виде матрицы А, дают возможность лучшегообозрения результатов выбора стратегий Аi, i=1,…,m, игроком А при каждомсостоянии природы Пj, j=1,…,n.
2)Фиксируем распределение удовлетворяющих условию (1) вероятностей qj=p(Пj),j=1,…,n, состояний природы Пj, j=1,…n, разумеется, если они известны. Такимобразом, пункт 2 участвует в методике формирования критерия в случае принятиярешения в условиях риска.
3) Наосновании пунктов 1 и 2 выбираем натуральное число l, 1£l£n, иопределенным образом строим матрицуВ=
j
Bi 1 2 … l B1 b11 b12 … b1l B2 b21 b22 … b2l … … … … … Bm bm1 bm2 … bml
размера m xl. Построение конкретной матрицы В порождается содержательной идеейформируемого критерия.
4) Выбираемl из чисел l1,…, ll, удовлетворяющих условиям
/> (2)
Назовем ихкоэффициентами формируемого критерия. Они призваны играть роль количественныхоценок некоторых субъективных проявлений игрока А (лица, принимающего решение),а именно степени доверия к распределению вероятностей состояний природы истепени его пессимизма (оптимизма) при принятии решений.
5)Используя матрицу В и коэффициенты l1,…, ll, каждой стратегии Аi, i=1,…,m, игрокаА поставим в соответствие число
/> (3)
котороеназовем показателем эффективности Аi.
Такимобразом, показатель эффективности Gi стратегии Аi, i=1,…,m, учитываетопределенным образом выигрыши игрока А при этой стратегии, вероятностисостояний природы (если они известны) и его субъективные проявления при выборенаиболее эффективной стратегии.
6)Определим цену игры G в чистых стратегиях как максимальный показательэффективности стратегий Аi, i=1,…,m, т.е.
/> (4)
7)Определим оптимальную стратегию.
Оптимальнойстратегией назовем стратегию Аk с максимальным показателем эффективности,другими словами, — стратегию, показатель эффективности Gk которой совпадает сценой игры G:Gk= G. (5)
Понятно,что такое определение оптимальной стратегии не влечет ее единственности.
Отметим,что по логике этого пункта игрок А, выбирая оптимальную стратегию,максимизирует показатель Gi (см. (5)). Это обстоятельство оправдывает то, чтоэтот показатель мы назвали (в пункте 5) показателем эффективности.
2. ФОРМИРОВАНИЕ НЕКОТОРЫХ ИЗВЕСТНЫХ КРИТЕРИЕВ-ЧАСТНЫЕ СЛУЧАИ ОБЩЕЙМЕТОДИКИ
КритерийБайеса ([1], [2], [5], [7]).
1) Пусть Аявляется матрицей выигрышей игрока А.
2) Известнывероятности qj=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, удовлетворяющиеусловию (1). Следовательно, речь идет о принятии решения в условиях риска.
3) Полагаемl=n и матрицу В выбираем равной матрице А, т.е.
bij=aij длявсех i=1,…,m и j=1,…,n.
4)Коэффициенты l1,…,ln, выбираем равными соответствующим вероятностям q1,…,qn,т.е. ll=qi, i=1,…,n. Этим самым игрок А выражает полное доверие к истинностираспределения вероятностей q1,…,qn, состояний природы.
Из (1)следует, что коэффициенты lj, j=1,…,n удовлетворяют условию (3).
5)Показатель эффективности стратегии Аi по критерию Байеса обозначим через Вi инаходим его по формуле (3):
/>. (6)
Очевидно,что Вi – средневзвешенный выигрыш при стратегии Аi с весами q1,…,qn.
Еслистратегию Аi трактовать как дискретную случайную величину, принимающую значениявыигрышей при каждом состоянии природы, то вероятности этих выигрышей будутравны вероятностям состояний природы и тогда Вi есть математическое ожиданиеэтой случайной величины (см. (6)).
6) Ценаигры по критерию Байеса, обозначаемая нами через В, определяется по формуле(4):
/>
7)Оптимальной среди чистых стратегий по критерию Байеса является стратегия Аk,для которой показатель эффективности максимален:
Вk=В.
КритерийЛапласа ([1], [2], [5], [7]).
1) Пусть А– матрица выигрышей игрока А.
2) Исходяиз теоретических, либо из практических соображений, констатируется, что ниодному из возможных состояний природы Пj, j=1,…,n, нельзя отдать предпочтения.Потому все состояния природы считают равновероятностными, т.е. qj=n-1, j=1,…,n.Этот принцип называют принципом «недостаточного основания» Лапласа. Вероятностиqj=n-1, j=1,…,n, удовлетворяют условию (1).
Посколькувероятности состояний природы известны: qj=n-1, j=1,…,n, то мы находимся вситуации принятия решения в условиях риска.
3) Пустьl=n, а в качестве матрицы В можно взять матрицу, получающуюся из матрицы А,если каждую строку последней заменить на произвольную перестановку ееэлементов. В частности, можем положить В=А. В общем же случае элементы матрицыВ имеют вид bij=aikj(i), i=1,…, m; j=1,…,n, где aik1(i), aik2(i),…,aikn(i) –некоторая перестановка элементов ai1, ai2,…,ain i-й строки матрицы А.
4) Пустькоэффициенты lj=n-1, j=1,…,n. Очевидно, они удовлетворяют условию (2).
Выборкоэффициентов lj, j=1,…,n, таким образом подтверждает полное доверие игрока А кпринципу недостаточного основания Лапласа.
5) Поформуле (3) показатель эффективности стратегии Аi по критерию Лапласа,обозначаемый нами через Li, равен:
/>. (7)
Это естьсредний арифметический выигрыш при стратегии Аi.
6) Ценаигры по критерию Лапласа, обозначаемая нами через L, по формуле (4):
/> (8)
7)Оптимальной стратегией Аk по критерию Лапласа является стратегия с максимальнымпоказателем эффективности:
Lk=L.
Заметим,что, как следует из (7) и (8), показатель эффективности Li будет максимальнымтогда и только тогда, когда максимальной будет сумма />, и потому вкачестве показателя эффективности стратегии Аi можно рассмотреть число />,а в качестве цены игры – число />.
Тогдаоптимальной будет стратегия, сумма выигрышей при которой максимальна.
КритерийВальда ([1] – [7]).
1)Предположим, что А – матрица выигрышей игрока А.
2)Вероятности состояний природы неизвестны и нет возможности получить о нихкакую-либо статистическую информацию. Поэтому игрок А находится в ситуациипринятия решения в условиях неопределенности.
3) Пустьl=1 и
/> (9)
т.е.матрица В представляет собой вектор столбец размера m x 1.В=
/>
4) Пустькоэффициент l1=1. Очевидно, условие (2) выполняется.
5)Обозначим показатель эффективности стратегии Аi по критерию Вальда через Wi. Всилу (9) и значения коэффициента l1=1, по формуле (3) имеем:
/> (10)
Такимобразом, показатель эффективности стратегии Аi по критерию Вальда естьминимальный выигрыш игрока А при применении им этой стратегии.
6) Ценаигры по критерию Вальда, обозначим ее через W, находится по формуле (4):
/>
7)Оптимальной среди чистых стратегий по критерию Вальда является стратегия Аk смаксимальным показателем эффективности:
Wk=W.
Другимисловами, оптимальной среди чистых стратегий по критерию Вальда считается тачистая стратегия, при которой минимальный выигрыш является максимальным средиминимальных выигрышей всех чистых стратегий. Таким образом, оптимальнаястратегия по критерию Вальда гарантирует при любых состояниях природы выигрыш,не меньший максимина:
/>
В силу(10), критерий Вальда является критерием крайнего пессимизма игрока А, аколичественным выражением этого крайнего пессимизма является значениекоэффициента l1, равное 1. Игрок А, принимая решение, действует по принципунаибольшей осторожности.
Хотяарабская пословица и гласит: «Кто боится собственной тени, тому нет места подсолнцем», — тем не менее этот критерий уместен в тех случаях, когда игрок А нестолько хочет выиграть, сколько не хочет проиграть. Использование принципаВальда в обиходе подтверждается такими поговорками как «Семь раз отмерь – одинраз отрежь», «Береженого Бог бережет», «Лучше синица в руках, чем журавль внебе».
КритерийХоджа-Лемана [7].
1)Предположим, что матрицей выигрышей игрока А является матрица А.
2) Известнывероятности qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, удовлетворяющиеусловию (1).
Такимобразом, игроку А надлежит принимать решение в условиях риска.
3) Пустьl=2,
/> (11)
· показатель эффективности стратегии Аi по критерию Вальда,
/> (12)
· показатель эффективности стратегии Аi по критерию Байеса.
Матрица Впримет видВ=
/>
т.е. bi1=Wi, bi2=Bi, i=1,…,m.
4)Коэффициенты l1, l2 выбираются следующим образом:l1=1-l, l2=l, где lÎ[0, 1]. (13)
Очевидно,что эти коэффициенты удовлетворяют условию (2).
5) Поформуле (3), с учетом (11), (12), и (13), показатель эффективности стратегии Аiпо критерию Ходжа-Лемана равен:Gi=libi1+l2bi2=(1-l)Wi+lBi=(1-l)aij+ i=1,…,m. (14)
В правойчасти формулы (14) коэффициент lÎ[0, 1] есть количественный показательстепени доверия игрока А данному распределению вероятностей qi=p(Пj), j=1,…,n,состояний природы Пj, j=1,…,n, а коэффициент (1-l) характеризует количественностепень пессимизма игрока А. Чем больше доверия игрока А данному распределениювероятностей состояний природы, тем меньше пессимизма и наоборот.
6) Ценуигры по критерию Ходжа-Лемана находим по формуле (4):
/>
7)Оптимальной стратегией по критерию Ходжа-Лемана является стратегия Аk снаибольшим показателем эффективности:
Gk=G.
Отметим,что критерий Ходжа-Лемана является как-бы промежуточным критерием междукритериями Байеса и Вальда. При l=1, из (14) имеем:Gi=Bi и потому критерийХоджа-Лемана превращается в критерий Байеса. А при l=0, из (14): Gi=Wi и,следовательно, из критерия Ходжа-Лемана получаем критерий Вальда.
КритерийГермейера [7].
1) Пустьматрица А является матрицей выигрышей игрока А.
2) Данывероятности qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, удовлетворяющиеусловию (1).
Т.о. игрокА находится в ситуации принятия решений в условиях риска
3) Положимl=1 и
/> (15)
Такимобразом, матрица В представляет собой вектор столбецВ=
/>
размера m x1.
4) Полагаемl1=1. Условие (2), очевидно, выполняется.
5)Показатель эффективности стратегии Аi по критерию Гермейера определяем поформуле (3) с учетом (15) и того, что l1=1:
/> (16)
Если игрокА придерживается стратегии Аi, то вероятность выигрыша aij при этой стратегии ипри состоянии природы Пj равна, очевидно, вероятности qj этого состоянияприроды. Поэтому формула (16) показывает, что показатель эффективностистратегии Аi по критерию Гермейера есть минимальный выигрыш при этой стратегиис учетом его вероятности.
6) Ценаигры по критерию Гермейера определяется по формуле (4):
/>
7)Оптимальной стратегией по критерию Гермейера считается стратегия Аk снаибольшим показателем эффективности:
Gk= G
Заметим, чтокритерий Гермейера можно интерпретировать как критерий Вальда, применимый кигре с матрицей
/>
КритерийГермейера так же, как и критерий Вальда является критерием крайнего пессимизмаигрока А, но, в отличие от критерия Вальда, игрок А, принимая решение смаксимальной осмотрительностью, учитывает вероятности состояний природы.
В случаеравномерного распределения вероятностей состояний природы: qj=n-1, j=1,…,n,показатель эффективности стратегии Аi, в силу формулы (16), будет равенGi=n-1aij и, следовательно, критерий Гермейера эквивалентен критерию Вальда,т.е. стратегия, оптимальная по критерию Гермейера, оптимальна и по критериюВальда, и наоборот.
Критерийпроизведений [7].
1) Пустьматрицей выигрышей игрока А является матрица А, все элементы которойположительны:
aij>0,i=1,…,m; j=1,…,n.
2) Известнывероятности qj=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, и удовлетворяютусловию (1).
3) Пустьl=1 и
/> (17)
Значитматрица В является вектор-столбцомВ=
/>
размера m x1.
4) Пустьl1=1. Условие (2) выполняется.
5)Показатель эффективности стратегии Аi по критерию произведений в соответствии сформулами (3) и (17) равен
/>.
6) Ценаигры по критерию произведений вычисляется по формуле (4):
/>
7)Оптимальной стратегией по критерию произведений является стратегия Аk снаибольшим показателем эффективности:
Gk=G.
Отметим,что для критерия произведений является существенным положительность всехсостояний вероятностей состояний природы и всех выигрышей игрока А.
Максимаксныйкритерий ( [1].-[7] ).
1) Пусть А– матрица выигрышей игрока А.
2)Вероятность состояний неизвестны. Решение принимается в условиях неопределенности.
3) Пустьl=1 и
/> (18)
Значит,матрица В является вектор- столбцомВmx1=
/>
размера m x1.
4)Коэффициент l1 выбираем равным 1: l1=1. При этом условие (2), очевидно,выполняется.
5)Показатель эффективности стратегии Аi по максимаксному критерию обозначим черезМi и определим его по формуле (3) с учетом (18) и того, чтоl1=1:
/> (19)
Такимобразом, показатель эффективности стратегии Аi по максимаксному критерию естьнаибольший выигрыш при этой стратегии.
6) Ценаигры по максимаксному критерию, обозначаемая нами через М, определяется поформуле (4):
/>
Очевидно,что это есть наибольший элемент матрицы А.
7)Оптимальная стратегия по максимаксному критерию есть стратегия Аk с наибольшимпоказателем эффективности:
Mk=M.
Из формулы(19) заключаем, что максимаксный критерий является критерием крайнего оптимизмаигрока А. Количественно это выражается тем, что l1=1. Этот критерийпротивоположен критерию Вальда. Игрок А, пользуясь максимаксным критерием,предполагает, что природа П будет находиться в благоприятнейшем для негосостоянии, и, как следствие отсюда, ведет себя весьма легкомысленно, с«шапкозакидательским» настроением, поскольку уверен в наибольшем выигрыше.Вместе с тем, в некоторых случаях этим критерием пользуются осознанно,например, когда перед игроком А стоит дилемма: либо получить наибольшийвыигрыш, либо стать банкротом. Бытовое отражение подобных ситуацийиллюстрируется поговорками: «Пан или пропал», «Кто не рискует, тот невыигрывает» и т.п.
Оптимальнаястратегия по максимальному критерию гарантирует игроку А возможность выигрыша,равного максимаксу.
/>.
Критерийпессимизма-оптимизма Гурвица с показателем оптимизма lÎ[0; 1] ([1] –[7]).
1) Пусть А– матрица выигрышей игрока А.
2)Вероятности состояний природы неизвестны и нет возможности получить о нихкакую–либо надежную статистическую информацию.
Такимобразом, решение о выборе оптимальной стратегии будет приниматься в условияхнеопределенности.
3) Положимl=2. Элементы матрицы ВВ=
/>
размера m x2 определяются следующим образом:
/>. (20)
4)Коэффициенты l1 и l2 выбираем следующим образом:l1=1-l; l2=l; lÎ[0, 1] (21)
Тогда,очевидно, условие (2) выполняется.
5)Обозначим показатель эффективности стратегии Аi, по критериюпессимизма-оптимизма Гурвица через Нi. Тогда по формуле (3) с учетом (20) и(21):
/> (22)
В формуле(22) l — показатель оптимизма, а (1-l) – показатель пессимизма игрока А привыборе им оптимальной стратегии. Чем ближе к единице показатель оптимизма, темближе к нулю показатель пессимизма, и тем больше оптимизма и меньше пессимизма.И наоборот. Если l=0,5, то и 1-l=0,5, т.е. показатели оптимизма и пессимизмаодинаковы. Это означает, что игрок А при выборе стратегии ведет себянейтрально.
Такимобразом, число l выбирается в пределах от 0 до 1 в зависимости от склонностиигрока А к оптимизму или пессимизму.
6) Ценаигры по критерию Гурвица Н определяется из формулы (5):
/>
7)Оптимальная стратегия Аk по критерию Гурвица соответствует показателюэффективности
Hk=H
КритерийГурвица является промежуточным между критерием Вальда и максимаксным критериеми превращается в критерий Вальда при l=0 и — в максимаксный критерий при l=1.
Обобщенныйкритерий Гурвица с коэффициентами l1,…, ln ([4], [5]).
1) Пусть А– матрица выигрышей игрока А.
2)Вероятности состояний природы неизвестны. Так что решение принимается вусловиях неопределенности.
3) МатрицаВ получается из матрицы А перестановкой элементов каждой ее строки в неубывающемпорядке:
bi1£bi2£…£bin,i=1,…,m.
Такимобразом, в 1-м столбце матрицы В стоят минимальные, а в n-м столбцемаксимальные выигрыши стратегий. Другими словами, в 1-м столбце матрицы В стоятпоказатели эффективности стратегий по критерию Вальда, а в n-м столбце –показатели эффективности стратегий по максимаксному критерию.
4)Коэффициенты l1,…, ln выбираются удовлетворяющими условиям (2) соответственноразличной степени склонности игрока А к оптимизму. При этом показателемпессимизма игрока А называется число
/> если n – число четное, (23) если n – число нечетное,
где /> целаячасть числа />, а показателем оптимизма игрока Аназывается число
/> , если n – число четное, , если n – число нечетное.
Очевидно,что lр+l0=1.
5)Показатель эффективности стратегии Аi по обобщенному критерию Гурвицаопределяется по формуле (3):
/>
6) Ценуигры по обобщенному критерию Гурвица определим по формуле (4):
/>
7)Оптимальные стратегии находятся стандартно: Аk – оптимальная стратегия, еслиGk=G.
Отметим,что обобщенный критерий Гурвица учитывает все выигрыши при каждой стратегии,что необходимо для более полной картины эффективности стратегий. Отметим также,что некоторые из приведенных выше критериев являются частными случаямиобобщенного критерия Гурвица.
Отметим,что если В=А, то коэффициенты lj, j=1,…,n, можно формально интерпретировать каквероятности состояний природы и в, таком случае, обобщенный критерий Гурвицасовпадает с критерием Байеса.
Еслиlj=n-1, j=1,…,n, то обобщенный критерий Гурвица превращается в критерийЛапласа.
Если l1=1,l2=…=ln=0, то обобщенный критерий Гурвица представляет собой критерий Вальда.
Приl1=…=ln-1=0, ln=1, из обобщенного критерия Гурвица получаем максимаксныйкритерий.
Еслиl1=1-l, l2=…=ln-1=0, ln=l, где lÎ[0, 1], то обобщенный критерий Гурвицаявляется критерием Гурвица.
Если В=А иqi=p(Пj), j=1,…,n – вероятности состояний природы, удовлетворяющие условиям(1), то выбрав коэффициенты lj, j=1,…,n, следующим образом: l1=1-l+lq1, lj=lqj,j=2,…,n, где lÎ[0, 1], мы из обобщенного критерия Гурвица получимкритерий Ходжа Лемана.
3. ЗАДАЧА В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЁННОСТИ
Допустим,инвестор принимает решение о строительстве жилья определенного типа в некоторомместе. Инвестор действует в условиях неопределенности (информационнойнепрозрачности) на рынке жилья. Чтобы сформировать представление о ситуации нарынке жилья на момент завершения строительства ему необходимо учесть цены нанедвижимость, конкуренцию на рынке жилья, соотношение предложения и спроса,курсы валют и многое другое. Статистические данные свидетельствуют о том, чтоодной из главных составляющих стоимости жилья является место его расположения.
Рассмотримматематическую модель данной ситуации. Мы имеем игру с природой, где игрок А –инвестор, природа П – совокупность возможных ситуаций на рынке жилья на момент завершениястроительства, из которых можно сформировать, например, пять состояний П1, П2,П3, П4, П5 природы. Известны приближенные вероятности этих состоянийq1=p(П1)»0,30; q2=p(П2)»0,20; q3=p(П3)»0,15; q4=p(П4)»0,10; q5=p(П5)»0,25.Предположим, что игрок А располагает четырьмя (чистыми) стратегиями А1, А2, А3,А4, представляющими собой выбор определенного места для постройки жилья.Множество этих мест ограничено градостроительными решениями, стоимостью землии т.д. Инвестиционная привлекательность проекта определяется как процентприроста дохода по отношению к сумме капитальных вложений, оценка которыхизвестна при каждой стратегии и каждом состоянии природы. Эти данныепредставлены в следующей матрице выигрышей игрока А: А=
Пj
Ai П1 П2 П3 П4 П5 (24) А1 2 7 3 15 6 А2 4 6 11 3 5 А3 6 4 9 10 5 А4 3 8 7 9 5 qj 0,30 0,20 0,15 0,10 0,25
размера 4 х5, в последней, дополнительной строке которой указаны вероятности состоянийприроды. Матрица (24) не содержит доминируемых (в частности, дублируемых) строки все ее элементы положительны.
Инвесторупредстоит выбрать участок земли так, чтобы наиболее эффективно использоватькапиталовложения.
Подсчитаемпоказатели эффективности стратегий
· по критериям Байеса, Гермейера и критерию произведений при условии,что инвестор А доверяет данному распределению вероятностей состояний природы,
· по критерию Лапласа, если инвестор А не доверяет данномураспределению вероятностей состояний природы и не может отдать предпочтения ниодному из рассматриваемых состояний природы,
· по критерию Ходжа- Лемана с коэффициентом доверия к вероятностямсостояний природы, например, l=0,4,
· по критерию Вальда, максимаксному критерию, критериюпессимизма-оптимизма Гурвица с показателем оптимизма, например, l=0,6, и пообобщенному критерию Гурвица с коэффициентами, например, l1=0,35; l2=0,24;l3=0,19; l4=0,13; l5=0,09.
Результатыподсчета показателей эффективности и оптимальные стратегии представлены вследующей таблице:
Таблицапоказателей эффективности и оптимальных стратегийСтратегии Критерии Байеса Лапласа Вальда
Ходжа-Лемана
l=0,4 Гермейгера Произ-ведений Макси-максный
Гурвица
l=0,4
Обобщенный Гурвица с коэффиц
l1=0,35
l2=0,24
l3=0,19
l4=0,13
l5=0,09 А1 5,45 6,6 * 2 3,38 0,45 0,8505 15 * 7,2 * 4,82 А2 5,6 5,8 3 4,04 0,3 0,891 11 6,2 4,73 А3 5,95 * 6,6 * 4 * 4,78 * 0,8 1,944 * 10 6,4 5,57 * А4 5,7 6,4 3 4,08 0,9 * 1,701 9 5,4 5,43 Оптимал. стратегии А3 А1, А3 А3 А3 А4 А3 А1 А1 А3
Заметим,что, поскольку, в критерии Ходжа- Лемана показатель доверия игрока Араспределению вероятностей состояний, указанных в последней строке матрицы(24), равен l=0,4, то показатель пессимизма игрока А равен 1-l=0,6.
В критерииГурвица показатель оптимизма игрока А равен l=0,4 и, следовательно, показательего пессимизма также равен 1-l=0,6.
Вобобщенном критерии Гурвица по формуле (23) показатель пессимизма
/>= 0,35+0,24+0,5×0,19=0,685
и,следовательно, показатель оптимизма l0=1-0,685=0,315.
Такимобразом, во всех примененных критериях, учитывающих индивидуальные проявленияигрока А к пессимизму и оптимизму, игрок А более склонен к пессимистическойоценке ситуации, чем к оптимистической, примерно с одинаковыми показателями.
Врезультате применения девяти критериев мы видим, что в качестве оптимальнойстратегии А1 выступает 3 раза, стратегия А3 – 6 раз и стратегия А4 – 1 раз. Поэтому,если у инвестора А нет никаких обоснованных серьезных возражений, то в качествеоптимальной можно рассматривать стратегию А3.