Решение игры в смешанных стратегиях 2

--PAGE_BREAK--1.2 Элементы теории игры
В общем случае решение игры представляет довольно трудную задачу, причем сложность задачи и объем необходимых для решения вычислений резко возрастает с увеличением . Однако это трудности не носят принципиального характера и связаны только сочень большим объемом расчетов, который в ряде случаев может оказаться практически невыполнимым. Принципиальная сторона метода отыскания решения остается при любом одной и той же.

Проиллюстрируем это на примере игры . Дадим ей геометрическую интерпретацию — уже пространственную. Три наши стратегии , изобразим тремя точками на плоскости ; первая лежит в начале координат (рис.1). вторая и третья — на осях Ох и Оу на расстояниях 1 от начала.

рис 1.

Через точки проводятся оси I-I, II-IIи III-III, перпендикулярные к плоскости. На оси I-Iоткладываются выигрыши при стратегии на осях II-IIи III-III— выигрыши при стратегиях . Каждая стратегия противника изобразится плоскостью, отсекающей на осях I-I, II-IIи III-III, отрезки, равные выигрышам

при соответствующих стратегия и стратегия . Построив, таким образом, все стратегии противника, мы получим семейство плоскостей над треугольником (рис2) .

рис 2
Для этого семейства также можно построить нижнюю границу выигрыша, как мы это делали в случае, и найти на этой границе точку Nс максимальной высотой нал плоскостью. Эта высота и будет ценой игры .

Частоты стратегий в оптимальной стратегии будут определяться координатами (x
, у) точки N, а именно:

Однако такое геометрическое построение даже для случая нелегко осуществимо и требует большой затраты времени и усилий воображения. В общем же случае игры оно переносится в — мерное пространство и теряет всякую наглядность, хотя употребление геометрической терминологии в ряде случаев может оказаться полезным. При решении игрна практике удобнее пользоваться не геометрическими аналогиями, а расчетными аналитическими методами, тем более, что для решения задачи на вычислительных машинах эти методы единственно пригодны.

Все эти методы по существу сводятся к решению задачи путем последовательных проб, но упорядочение последовательности проб позволяет построить алгоритм, приводящий к решению наиболее экономичным способом.

Здесь мы вкратце остановимся на одном расчетном методе решения игр — на так называемом методе «линейного программирования».

Для этого дадим сначала общую постановку задачи о нахождении решения игры . Пусть дана игра с т стратегиями игрока А иn
стратегиями игрока В и задана платежная матрица

Требуется найти решение игры, т. е. две оптимальные смешанные стратегии игроков А и В

где (некоторые из чисел и могут быть равными нулю).

Наша оптимальная стратегия S
*
A
должна обеспечивать нам выигрыш, не меньший , при любом поведении противника, и выигрыш, равный , при его оптимальном поведении (стратегия S
*
B
).Аналогично стратегия S
*
B
должна обеспечивать противнику проигрыш, не больший , при любом нашем поведении и равный при нашем оптимальном поведении (стратегия S
*
A
).

Величина цены игры в данном случае нам неизвестна; будем считать, что она равна некоторому положительному числу. Полагая так, мы не нарушаем общности рассуждений; для того чтобы было > 0, очевидно, достаточно, чтобы все элементы матрицы были неотрицательными. Этого всегда можно добиться, прибавляя к элементам достаточно большую положительную величину L; при этом цена игры увеличится на L, а решение не изменится.

Пусть мы выбрали свою оптимальную стратегию S
*
A

. Тогда наш средний выигрыш при стратегии противника будет равен:

Наша оптимальная стратегия S
*
A
обладает тем свойством, что при любом поведении противника обеспечивает выигрыш не меньший, чем ; следовательно, любое из чисел не может быть меньше . Получаем ряд условий:

(1)

Разделим неравенства (1) на положительную величину и обозначим :

Тогда условие (1) запишется виде

(2)

где — неотрицательные числа. Так как величины удовлетворяют условию

(3)

Мы хотим сделать свой гарантированный выигрыш максимально возможным; очевидно, при этом правая часть равенства (3) принимает минимальное значение.

Таким образом, задача нахождения решения игры сводится к следующей математической задаче: определить неотрицательные величины, удовлетворяющие условиям (2), так, чтобы их сумма

была минимальной.

Обычно при решении задач, связанных с нахождением экстремальных значений (максимумов и минимумов), функцию дифференцируют и приравнивают производные нулю. Но такой прием в данном случае бесполезен, так как функция Ф, которую нужно обратить в минимум, линейна, и ее производные по всем аргументам равны единице, т. е. нигде не обращаются в нуль. Следовательно, максимум функции достигается где-то на границе области изменения аргументов, которая определяется требованием неотрицательности аргументов и условиями (2). Прием нахождения экстремальных значений при помощи дифференцирования непригоден и в тех случаях, когда для решения игры определяется максимум нижней (или минимум верхней) границы выигрыша, как мы. например, делали при решении игр .Действительно, нижняя граница составлена из участков прямых линий, и максимум достигается не в точке, где производная равна нулю (такой точки вообще нет), а на границе интервала или в точке пересечения прямолинейных участков.

Для решения подобных задач, довольно часто встречающихся на практике, в математике разработан специальный аппарат линейного программирования.

Задача линейного программирования ставится следующим образом.

Дана система линейных уравнений:

(4)

Требуется найти неотрицательные значения величин удовлетворяющие условиям (4) и вместе с тем обращающие в минимум заданную однородную линейную функцию величин (линейную форму):

Легко убедиться, что поставленная выше задача теории игр является частным случаем задачи линейного программирование при

С первого взгляда может показаться, что условия (2) не эквивалентны условиям (4), так как вместо знаков равенства они содержат знаки неравенства. Однако от знаков неравенства легко избавиться, вводя новые фиктивные неотрицательные переменные и записывая условия (2) в виде:

(5)

Форма Ф, которую нужно обратить в минимум, равна

Аппарат линейного программирования позволяет путем сравнительно небольшого числа последовательных проб подобрать величины , удовлетворяющие поставленным требованиям. Для большей ясности мы здесь продемонстрируем применение этого аппарата прямо на материале решения конкретных игр.

продолжение
--PAGE_BREAK--1.3 Симплекс метод (минимум)
Симплекс метод — универсальный метод для решения линейной системы уравнений или неравенств и линейного функционала.

Общая идея симплексного метода (метода последовательного улучшения плана) для решения ЗЛП (задачи линейного программирования) состоит

-умение находить начальный опорный план;

-наличие признака оптимальности опорного плана;

-умение переходить к нехудшему опорному плану.

Пусть ЗЛП представлена системой ограничений в каноническом виде:

.

Говорят, что ограничение ЗЛП имеет предпочтительный вид, если при неотрицательной правой части левая часть ограничений содержит переменную, входящую с коэффициентом, равным единице, а в остальные ограничения равенства — с коэффициентом, равным нулю.

Пусть система ограничений имеет вид

Сведем задачу к каноническому виду. Для этого прибавим к левым частям неравенств дополнительные переменные   . Получим систему, эквивалентную исходной:

,

которая имеет предпочтительный вид

.

В целевую функцию дополнительные переменные вводятся с коэффициентами, равными нулю .

Пусть далее система ограничений имеет вид

Сведём её к эквивалентной вычитанием дополнительных переменных   из левых частей неравенств системы. Получим систему

Однако теперь система ограничений не имеет предпочтительного вида, так как дополнительные переменные входят в левую часть (при ) с коэффициентами, равными –1. Поэтому, вообще говоря, базисный план не является допустимым. В этом случае вводится так называемый искусственный базис. К левым частям ограничений-равенств, не имеющих предпочтительного вида, добавляют искусственные переменные . В целевую функцию переменные , вводят с коэффициентом М в случае решения задачи на минимум и с коэффициентом -М для задачи на максимум, где М — большое положительное число. Полученная задача называется М-задачей, соответствующей исходной. Она всегда имеет предпочтительный вид.

Пусть исходная ЗЛП имеет вид
      (1)

    (2)

         (3)

причём ни одно из ограничений не имеет предпочтительной переменной. М-задача запишется так:

     (4)

           (5)

, ,          (6)

Задача (4)-(6) имеет предпочтительный план. Её начальный опорный план имеет вид

Если некоторые из уравнений (2) имеют предпочтительный вид, то в них не следует вводить искусственные переменные.

Теорема. Если в оптимальном плане

         (7)

М-задачи (4)-(6) все искусственные переменные , то план является оптимальным планом исходной задачи (1)-(3).

Для того чтобы решить задачу с ограничениями, не имеющими предпочтительного вида, вводят искусственный базис и решают расширенную М-задачу, которая имеет начальный опорный план

Решение исходной задачи симплексным методом путем введения искусственных переменных называется симплексным методом с искусственным базисом.

Если в результате применения симплексного метода к расширенной задаче получен оптимальный план, в котором все искусственные переменные , то его первые n компоненты дают оптимальный план исходной задачи.

Теорема. Если в оптимальном плане М-задачи хотя бы одна из искусственных переменных отлична от нуля, то исходная задача не имеет допустимых планов, т. е. ее условия несовместны.

Признаки оптимальности.

Теорема. Пусть исходная задача решается на максимум. Если для некоторого опорного плана все оценки неотрицательны, то такой план оптимален.

Теорема. Если исходная задача решается на минимум и для некоторого опорного плана все оценки   неположительны, то такой план оптимален.

Для привидения системы ограничений неравенств к каноническому виду, необходимо в системе ограничений выделить единичный базис.

I. Ограничения вида «0»- ресурсные ограничения. Справа находится то что мы используем на производстве, слева — то что получаем. При таких ограничения вводят дополнительные переменные с коэффициентом «+1», образующие единичный базис. В целевую функцию эти переменные войдут с коэффициентом «0».

II. Ограничения вида «=». Часто бывает, что несмотря на то что ограничения имеют вид равенства, единичный базис не выделяется или трудно выделяется. В этом случае вводятся искусственные переменные для создания единичного базиса — Yi. В систему ограничений они входят с коэффициентом «1». а в целевую функцию с коэффициентом «M», стремящимся к бесконечности (при Fmin— «+M», при Fmax— «-M»).

III. Ограничения вида «0» — Плановые ограничения. Дополнительные переменные (X), несущие определенный экономический смысл — перерасход ресурсов или перевыполнение плана, перепроизводство, добавляются с коэффициентом «-1», в целевую функцию — с коэффициентом «0». А искусственные переменные (Y) как в предыдущем случае.

продолжение
--PAGE_BREAK--1.4 Алгоритм решения задач теории игр
Обозначим некоторые определения.

Седловой точкой называется Аij, которая является наименьшим элементом в своей строке и наибольшим элементом в столбце.

Доминирующая строка – все элементы этой строки не превосходят соответствующих элементов другой строки.

Доминирующий столбец – все элементы не меньше соответствующих элементов какого-либо другого столбца.

Доминирующие столбцы и строки можно удалить из матрицы.
Алгоритм решения

1.     Проверить наличие седловой точки. Если есть седловая точка, то пишем ответ, если нет — продолжаем решение дальше

2.     Удаляем доминирующие строки доминирующие столбцы. Их може6т быть несколько. На их место в оптимальной стратегии соответствующие компоненты будут равны 0

3.     Решаем матричную игру (линейное программирование, графическое решение, приближенное решение)

В своей задаче я решаю матричную игру линейным программированием. (Симплекс метод)

Алгоритм решения симплекс методом (на максимум):

1.     Привести задачу линейного программирования к каноническому виду.

2.     Найти начальное опорное решение с базисом из единичных векторов и коэффициенты разложений векторов условий по базису опорного решения. Если опорное решение отсутствует, задача не имеет решения ввиду несовместности системы ограничений.

3.     Вычислить оценки разложений векторов условий по базису опорного решения и заполнить симплексную таблицу.

4.     Если выполняется признак единственности оптимального решения, то решение задачи заканчивается.

5.     Если выполняется условие существования множества оптимальных решений, то путем простого перебора найти все оптимальные решения.

6.     Если имеют место условия неограниченности целевой функции, то задача не имеет решения.

7.     Если пункты 4—6 алгоритма не выполняются, найти новое опорное решение и перейти к пункту 3.

2 СПЕЦИАЛЬНАЯ ЧАСТЬ (РАСЧЕТНАЯ) 2.1 Исходные данные
Тема: Решение игры в смешанных стратегиях

       2       -1      2       1

А = 1       3       -1      0

       4       -2      2       -1

Найти оптимальную стратегию и цену игры, заданной платежной матрицей А.
2.2 Постановка задачи. Математическая модель
Математическая модель— это упрощенное описание реальности с помощью математических понятий. Математическая модель выражает существенные черты объекта или процесса языком уравнений и других математических средств.

Седловой точкой называется Аij, которая является наименьшим элементом в своей строке и наибольшим элементом в столбце.

Доминирующая строка – все элементы этой строки не превосходят соответствующих элементов другой строки.

Доминирующий столбец – все элементы не меньше соответствующих элементов какого-либо другого столбца.

Доминирующие столбцы и строки можно удалить из матрицы.

Любой задаче линейного программирования называемой исходнойили прямой,можно поставить в соответствие другую задачу,которая называется двойственной или сопряженной. Обе эти задачи образуют пару двойственных (или сопряженных) задач. Каждая из задач является двойственной к другой задаче рассматриваемой пары.

Моя задача представляет собой матрицу. Что бы ее решить сначала построим математическую модель и решим симплексным методом.

В моей матрице есть доминирующий столбец. Это последний столбец матрицы так как сказано из определения все элементы не меньше соответствующих элементов какого-либо другого столбца. Это столбец доминирует над последним столбцом.

       2       -1      2       1

А = 1       3       -1      0

       4       -2      2       -1

Поэтому мы его вычеркиваем и составляем симметричные задачи по новой получившейся матрице А

-1     2       0

А* = 3      -1      0

       -2     2       -1

Использовать метод линейного программирования следует тогда, когда все элементы, хотя бы одной строки матрицы строго положительны. В этом случае задача будет иметь оптимальный план из которых можно получить оптимальные стратегии, иначе в исходной задаче целевая функция может быть неограниченна, что противоречит теории Джона фон Неймана.

С = 2

Прибавляем это число к элементам матрицы А* и получаем матрицу А**

   1     4       3

А** = 5    1       2

          0     4       1

Коэффициенты при неизвестных в целевой функции и свободные члены неравенств должны быть равны 1

Составляем систему уравнений по данной матрице и целевую функцию (математическая модель).

F(x) = x1+ x2+ x3→ max

продолжение
--PAGE_BREAK--2.3 Анализ модели. Составление пары симметричных двойственных задач
В теории двойственности используются четыре пары двойственных задач (приведем их в матричной форме записи)

Правила составления двойственных задач:

1.Во всех ограничениях исходной задачи свободные члены должны находиться в правой части, а члены с неизвестными — в левой.

2. Ограничения-неравенства исходной задачи должны быть записаны так, чтобы знаки неравенств у них были направлены в одну сторону.

3. Если знаки неравенств в ограничениях исходной задачи «≤», то целевая функция Z(X) = с0+ с1 · x1+ с2 · x2 + … + сn· xnдолжна максимизироваться, а если «≥», то минимизироваться.

4. Каждому ограничению исходной задачи соответствует неизвестное в двойственной задаче; при этом неизвестное, отвечающее ограничению-неравенству, должно удовлетворять условию неотрицательности, а неизвестное, отвечающее ограничению-равенству, может быть любого знака.

5. Целевая функция двойственной задачи имеет вид

где с0— свободный член целевой функции Z
(
X
) исходной задачи, b1, b2, …, bm,— свободные члены в ограничениях исходной задачи, при этом bi— свободный член именно того ограничения исходной задачи, которому соответствует неизвестная yi, ay1, y2, …, ym— неизвестные в двойственной задаче.

6. Целевая функция F
(
Y
) двойственной задачи должна оптимизироваться противоположным по сравнению с Z
(
X
) образом, т.е. если Z
(
X
) → max, то
F
(
Y
)→ min, и если Z
(
X
)→ min, то F
(
Y
) → max.

7. Каждому неизвестному хj
,
j
= 1, 2, ..., п исходной задачи соответствует ограничение в двойственной задаче. Совокупность этих п ограничений (вместе с условиями неотрицательности неизвестных yi, соответствующих ограничениям-неравенствам исходной задачи) образует систему ограничений двойственной задачи. Все ограничения двойственной задачи имеют вид неравенств, свободные члены которых находятся в правых частях, а члены с неизвестными yi
у2, ..., ут— в левых. Все знаки неравенств имеют вид «≥», если F
(
Y
) → min, и «≤», если
F
(
Y
) → max.

Коэффициенты, с которыми неизвестные yl
у2, …, утвходят в ограничение, соответствующее неизвестному xj
, совпадают с коэффициентами при этом неизвестном х. в ограничениях исходной задачи, а именно: коэффициент при yiсовпадает с тем коэффициентом при хj
с которым хj
входит в ограничение исходной задачи, соответствующее неизвестному yi
.

Двойственность

1) Составляем матрицу из полученной математической модели

  7      6        2        1

А = 1       3        6        1

         0      2        5        1

         1      1        1        F
2) Транспонируем матрицу A

  7      1        0        1

А-1 = 6      3        2        1

         2      6        5        1

         1      1        1        Z
3) Составляем двойственную задачу

Z= y1+ y2+y3 → Min
Вот и получили пару симметричных двойственных задач. Задача на максимум и на минимум



F(x) = x1 + x2 + x3 → max                       Z(x) = y1 + y2 +y3 → min

продолжение
--PAGE_BREAK--2.4 Решение симплекс методом

x1≥ 0, x2≥ 0, x3≥ 0

x0

x1

x2

x3

x4

x5

x6

x4

1

1

4

3

1

1/4

x5

1

5

1

2

1

1/5

x6

1

4

1

1

f

-1

-1

-1

X0

X1

X
2

X
3

X
4

X
5

X
6

x0

x1

x2

x3

x4

x5

x6

X4

4/5

19/5

13/5

1

-1/5

4/19

X1

1/5

1

1/5

2/5

1/5

x6

1

4

1

1

1/4

f

1/5

-4/5

-3/5

1/5

Вторую таблицы рассчитаем аналогичным способом.

x0

x1

x2

x3

x4

x5

x6

x2

4/19

1

13/19

5/19

-1/19

X1

3/19

1

5/19

-1/19

4/19

x6

3/19

-23/19

-20/19

4/19

1

f

7/19

-1/19

4/19

3/19

Решив симплекс методом матрицу мы получим

X*= (3/19; 4/19; 0)

Y*= (4/19; 3/19; 0)

F(X*) = G(Y*) = 7/19

Из решения двойственных задач получим цену игры и оптимальные стратегии игроков для матрицы А**

Для матрицы А* оптимальный план остается такой же

V= V”– С = 19/7– 2= 5/7

Оптимальная стратегия P*и Q*получаются из оптимальных стратегий P*~и Q*~приписав нули на место удаленных строк и столбцов.

V = 5/7

Целевая функция равна 7/19

продолжение
--PAGE_BREAK--

Не сдавайте скачаную работу преподавателю!

Данный реферат Вы можете использовать для подготовки курсовых проектов.

Доработать Узнать цену написания по вашей теме

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Заказать работу:

!	Курсовая работа
!	Дипломная работа
!	Реферат
!	Решение задач
!	Отчет по практике
!	Контрольная работа

Пишем реферат самостоятельно:

!	Как писать рефераты Практические рекомендации по написанию студенческих рефератов.
!	План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
!	Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
!	Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
!	Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:

→	Виды рефератов Какими бывают рефераты по своему назначению и структуре.

Другие популярные рефераты:

Реферат	Механические волны
Реферат	Обратная матрица
Реферат	Инверсия и ее применение
Реферат	Социокультурная динамика межпоколенных взаимодействий
Реферат	Расследование преступлений в сфере компьютерной информации
Реферат	Туристско-краеведческая характеристика Калининградской области
Реферат	Организация административно-хозяйственной службы гостиницы
Реферат	Диагностика психологической готовности ребенка к школе 2
Реферат	Модель современного менеджера
Реферат	Условия формирования военно-административной системы Южного Зауралья в XVII - первой половине XIX века

Сейчас смотрят :

Реферат	Hamlet Essay Research Paper Frailty thy name
Реферат	А. В. Буряк метод финансовых коэффициентов как инстурмент оценки эффективности деятельности украинских банков
Реферат	Применение теории нечетких множеств к финансовому анализу предприятий
Реферат	«Сернурский муниципальный район»
Реферат	«Сердцем – поляк…» Польша
Реферат	Алиментные обязательства членов семьи 2
Реферат	Можно ли зачать ребенка по желанию?
Реферат	Анализ развития Рунета
Реферат	Социально-демографические проблемы на примере Брянской области
Реферат	Сергей Сергеевич Прокофьев (Доклад)
Реферат	Внимание и его основные свойства. Виды внимания. Развитие внимания у детей
Реферат	Оценка экономической и экологической эффективности природоохранной деятельности на ВМП "Авитек" г. Киров
Реферат	Проблемные вопросы русской литературы
Реферат	Будова і життєві функції комах
Реферат	«Старые сказки о главном»

Реферат по предмету "Математика"

Решение игры в смешанных стратегиях 2

Другие популярные рефераты:

Сейчас смотрят :