1. Цель работы.. 2
2. Задание. 3
3. Краткие теоретические сведения. 4
4. Реализация программного средства.12
4.1 Проектирование. 12
4.2 Листинг программного кода. 12
5. Пример работы программы.. 20
Выводы.. 21
Используемая литература. 22
Используемые программные средства. 22
Необходимо разработать программное средство для решения матричных игр.
1. Задать матрицу игры вручную и случайным образом.
2. Найти оптимальные стратегии игроков, используя итерационный метод и методом чистых стратегий.
3. Сделать возможность сохранять матрицу игры и загружать из файла.
Постановка общей задачи теории игр
Теория игр – математическая теория конфликтных ситуаций. Экономические соревнования, спортивные встречи, боевые операции – примеры конфликтных ситуаций. Простейшие модели конфликтных ситуаций – это салонные и спортивные игры.
В игре могут сталкиваться интересы двух противников (игра парная или игра двух лиц), интересы n
(n
> 2) противников (игра множественная или игра n
лиц). Существуют игры с бесконечным множеством игроков.
Стратегией игрока называется система правил, однозначно определяющих выбор поведения игрока на каждом ходе в зависимости от ситуации, сложившейся в процессе игры. В зависимости от числа возможных стратегий игры делятся на конечные и бесконечные.
Процесс игры состоит в выборе каждым игроком i
одной своей стратегии
игрок i
получает выигрыш
Игры, в которых целью каждого участника является получение по возможности большего индивидуального выигрыша, называются бескоалиционными в отличие от коалиционных, в которых действия игроков направлены на максимизацию выигрышей коллективов (коалиции) без дальнейшего разделения выигрыша между участниками.
По определению бескоалиционной игрой называется система
в которой I
и
Бескоалиционная игра называется игрой с постоянной суммой, если существует такое постоянное C
, что
Ситуация s
в игре называется приемлемой
для игрока i
, если этот игрок, изменяя в ситуации s
свою стратегию si
на какую-либо другую si
'
, не может увеличить своего выигрыша.
Ситуация s
,
приемлемая для всех игроков, называется ситуацией равновесия.
Процесс нахождения ситуации равновесия в бескоалиционной игре есть процесс решения игры.
Матричные игры
Игра называется парной, если в ней сталкиваются интересы двух противников. Игра называется с нулевой суммой, если один игрок выигрывает столько, сколько второй проигрывает в той же партии.
Каждая фиксированная стратегия, которую может выбрать игрок, называется его чистой стратегией.
Матричной называют парную игру с нулевой суммой при условии, что каждый игрок имеет конечное число чистых стратегий.
Пусть первый игрок имеет m
чистых стратегий, а второй – n
.
Парная игра с нулевой суммой задается ' формально системой чисел – матрицей
-ю строку (i
-ю стратегию), а второй игрок j
-й столбец (j
-ю стратегию). Матрица
Задача первого игрока – максимизировать свой выигрыш.
Задача второго игрока – максимизировать свой выигрыш – сводится к минимизации проигрыша второго, что эквивалентно задаче минимизации выигрыша первого игрока.
Чистые стратегии
Гарантированный выигрыш первого игрока, применяющего чистую i
-ю стратегию,
Число
0
, при которой достигается
стратегией первого игрока. Аналогично,
0
– минимаксной
стратегией второго игрока.
Всегда
в чистых стратегиях; число
). Игра имеет седловую точку в чистых стратегиях тогда и только тогда, когда существует элемент матрицы
Любая пара (i
0
, j
0
), обладающая свойством (10.1), называется седловой точкой
.
Смешанные стратегии
Если обозначить через x
1
, x
2
, …, xm
вероятности (частоты), с которыми первый игрок выбирает соответственно первую, вторую, . . ., m
-ю чистую стратегию, так что через
1
, y
2
, …, yn
вероятности, с которыми второй игрок выбирает первую, вторую, ,.., n
-ю свою чистую стратегию, причем
=(x
1
, x
2
, …, xm
) и y
=(y
1
, y
2
, …, yn
) называются смешанными стратегиями первого и второго игроков соответственно. Каждый игрок имеет бесчисленное множество смешанных стратегий. Множество смешанных стратегий первого игрока обозначим через s
1
и множество смешанных стратегий второго игрока – через s
2
.
Задача первого игрока состоит в выборе такой стратеги
Если первый игрок применяет стратегию
(x
, y
)первого игрока равен
ВыигрышM
(x
, y
) называют функцией игры.
Например, в задаче с матрицей
первый игрок имеет две чистые стратегии
Если первый игрок применяет смешанную стратегию
Если же первый игрок применяет стратегию
Седловая точка в смешанных стратегиях
Пара смешанных стратегий (х*
, у*
) называется седловой точкой
функции М
(х
, у
), если
Каждая матричная игра с нулевой суммой имеет решение в смешанных стратегиях, т. е. существуют такие смешанные стратегии х
* и y
* первого и второго игроков соответственно, что выполняется условие (10.2). Гарантированный выигрыш первого игрока, применяющего смешанную стратегию
Стратегия х
*, при которой гарантированный выигрыш первого игрока достигает максимального значения, называется оптимальной стратегией
первого игрока:
Гарантированный проигрыш второго игрока
y* – оптимальная стратегия второго игрока, если
Гарантированный выигрыш первого игрока, применяющего свою оптимальную стратегию, равен гарантированному проигрышу второго игроку, применяющего свою оптимальную стратегию:
Сведение задачи теория игр к задаче линейного программирования
Задача максимизации гарантированного выигрыша первого игрока и задача минимизации гарантированного проигрыша второго игрока сводятся к паре взаимно двойственных задач линейного программирования:
Задача первого игрока | Задача второго игрока |
Процесс решения задач упрощается, если перейти к Переменным
Имеем:
Задача первого игрока | Задача второго игрока |
Оптимальные стратегии игроков не изменятся, если матрицу игры
.
Методы решения задач теории игр во многом зависят от условий задачи и от матрицы А
выигрышей первого игрока.
Если матрица А
имеет седловую точку, то решение игры сводится к нахождению седловой точки матрицы А.
Оптимальные стратегии игроков определяются при этом координатами (i
,j
) седловой точки матрицы А,
а цена игры элементом
Если задача теории игр не имеет решения в чистых стратегиях, то может быть решена итерационным методом.
Итерационный метод.
Разыгрывается мысленный эксперимент, в котором игроки А и В применяют против друг
друга свои стратегии. Эксперимент состоит из последовательности партий. А выбирает стратегию
Аi, игрок В уже знает об этом и отвечает своей стратегией Вj, наиболее выгодной для него в сложившейся ситуации. Далее, первый игрок выбирает дальнейшие стратегии основываясь на предыдущей игре. Таким образом, на каждом шаге итерационного процесса игрок отвечает на шаг другого той своей стратегией, которая является оптимальной относительно всех предыдущих ходов. Если партии продолжать достаточно долго, то средний выигрыш стремится к цене игры, а частоты – к вероятностям оптимальных стратегий. Главным достоинством этого метода является независимость его сложности от размерности игры.
4. Реализация программного средства
Среда разработки: С++ BuilderXE
Язык программирования: C++
Список модулей с кратким описанием:
1) Mainform.cpp – это главный модуль в котором, реализованы функции: расчёта в чистых стратегиях, сохранение/загрузка и ввод исходных данных .
2) Iter. cpp – это вспомогательный модуль в котором реализован итерационный метод решения матричной игры.
Модуль
Mainform
.
cpp
:
//---------------------------------------------------------------------------
#include <vcl.h>
#pragma hdrstop
#include "Series.hpp"
#include "Iter.h"
#include "pic.h"
#include "mainform.h"
#include <fstream.h>
#include <iostream>
//---------------------------------------------------------------------------
#pragma package(smart_init)
#pragma resource "*.dfm"
TForm1 *Form1;
//---------------------------------------------------------------------------
__fastcall TForm1::TForm1(TComponent* Owner)
: TForm(Owner)
{
}
//---------------------------------------------------------------------------
void __fastcall TForm1::RaschetClick(TObject *Sender) // расчёт
{
double MaxMin=0, MinMax=0;
double MinRow[100];
double MaxCol[100];
int i, j, n, m;
double A0[100][100];
n = StrToInt(Edit4->Text);
m = StrToInt(Edit5->Text);
for (i = 0; i < m; i++) {
for (j = 0; j < n; j++) {
//перевод значений из таблицы в массив double матрицы A0:
A0[j][i]=StrToFloat(StringGrid1->Cells[i+1][j+1]);
}
}
//--------------------- расчёт в чистых стратегиях -----------------------------
for (i = 0; i < n; i++) {
MinRow[i]=A0[i][0];
}
for (i = 0; i < m; i++) {
MaxCol[i]=A0[0][i];
}
//очистим стрингриды 2 и 3:
for (register int i = 0; i < StringGrid2->RowCount; i++)
{
StringGrid2->Rows[i]->Clear();
}
for (register int i = 0; i < StringGrid3->RowCount; i++)
{
StringGrid3->Rows[i]->Clear();
}
StringGrid2->Cells[0][0]="Min";
StringGrid3->Cells[0][0]="Max";
// расчёт минимумов и максимумов
for (i = 0; i < n; i++) {
for (j = 0; j < m; j++) {
//поиск минимального значения в строках :
if (A0[i][j] <= MinRow[i]) {
MinRow[i] = A0[i][j];
}
}
//вывод минимумов строк в СтрингГрид2 :
StringGrid2->Cells[0][i+1] = MinRow[i];
}
for (j = 0; j < m; j++) {
for (i = 0; i < n; i++) {
//поиск максимального значения в столбцах :
if (A0[i][j] >= MaxCol[j]){
MaxCol[j] = A0[i][j];
}
}
//вывод максимумов столбцов в СтрингГрид3 :
StringGrid3->Cells[j+1][0] = MaxCol[j];
}
//найдём максимин
MaxMin = MinRow[0];
for (i = 0; i < n; i++) {
if (MinRow[i] >= MaxMin ){MaxMin = MinRow[i];}
}
Edit2->Text=MaxMin;
//найдём минимакс
MinMax = MaxCol[0];
for (i = 0; i < m; i++) {
if (MaxCol[i] <= MinMax ){MinMax = MaxCol[i];}
}
Edit3->Text=MinMax;
if (MinMax == MaxMin) {
ShowMessage("Игра решена в чистых стратегиях");
Edit1->Text = MinMax;
} else {ShowMessage("Игра не решается в чистых стратегиях, попробуете решить её итерационным методом");}
//------------------------------------------------------------------------------
}
//------------------------------------------------------------------------------
void __fastcall TForm1::Button1Click(TObject *Sender)
{
Form2->Show();
}
//---------------------------------------------------------------------------
void __fastcall TForm1::Button2Click(TObject *Sender)
{
int i, j, n, m;
double A0[100][100];
n = StrToInt(Edit4->Text);
m = StrToInt(Edit5->Text);
//очищаем СтрингГрид1:
for (register int i = 0; i < StringGrid1->RowCount; i++){
StringGrid1->Rows[i]->Clear();
}
for (i = 0; i < n; i++) {
StringGrid1->Cells[0][i+1]="A"+String(i+1);
}
for (i = 0; i < m; i++) {
StringGrid1->Cells[i+1][0]="B"+String(i+1);
}
}
//---------------------------------------------------------------------------
void __fastcall TForm1::SaveClick(TObject *Sender)
{
int n,m;
n = StrToInt(Edit4->Text);
m = StrToInt(Edit5->Text);
// сохранение в файл
SaveTextFileDialog1->Execute();
SaveTextFileDialog1->FileName;
ofstream myfile(SaveTextFileDialog1->FileName.t_str());
for (int i = 0; i < n; i++) {
for (int j = 0; j < m; j++) {
myfile << StrToFloat(StringGrid1->Cells[j+1][i+1]);
myfile << " ";
}
myfile << "\n";
}
myfile.close();
}
//---------------------------------------------------------------------------
void __fastcall TForm1::Button4Click(TObject *Sender)
{
int n,m;
n = StrToInt(Edit4->Text);
m = StrToInt(Edit5->Text);
//Загрузкафайла
int a;
if (OpenDialog1->Execute()){
OpenDialog1->FileName;
ifstream loadfile(OpenDialog1->FileName.c_str());
for(int i=0; i<n; i++){
for(int j=0; j<m; j++){
loadfile >> a;
StringGrid1->Cells[j+1][i+1] = IntToStr(a);
}
//StringGrid1[i+1][j+1]=ch;
}
loadfile.close();
}
}
//---------------------------------------------------------------------------
void __fastcall TForm1::Button5Click(TObject *Sender)
{
int i, j, n, m;
double A0[100][100];
n = StrToInt(Edit4->Text);
m = StrToInt(Edit5->Text);
//Создаём рандомную матрицу
for (i = 0; i < n; i++) {
for (j = 0; j < m; j++) {
A0[i][j] = RandomRange(1, 10);
}
}
//Матрицу в СтрингГрид1:
for (i = 0; i < n; i++) {
for (j = 0; j < m; j++) {
StringGrid1->Cells[j+1][i+1]=String(A0[i][j]);
}
}
}
1) Пример случайно заданной матрицы решённой в чистых стратегиях:
2) Пример платёжной матрицы не решаемой в чистых стратегиях:
3) Пример матрицы игры решаемой итерационным методом:
В результате проделанной работы было разработано программное средство для решения матричных задач методом чистых стратегий и итерационным методом.
1)Гейл Д. Теория линейных экономических моделей. М.: Изд–во иностранной литературы, 1968.
2)Петросян Л.А. Зенкевич Н.А. Семина Е.А. Теория игр : Учеб. пособие – М.: ВЫСШ. ШК.; : УНИВЕРСИТЕТ, 1998. – 300 с.
3) Орлов, А.И. Теория принятия решений. Учебное пособие / А.И.Орлов.- М.:
Издательство ≪Март≫, 2004. - 656 с
С++ BuilderXE
Контрольная работа | Концепция информатизации Российской Федерации |
Контрольная работа | Причины агрессивного поведения. Методы работы с агрессивными детьми |
Контрольная работа | Алгоритм выбора и реализации предпринимательской идеи |
Контрольная работа | Современные методы арт-терапии |
Контрольная работа | Системы управления взаимоотношения с клиентами |
Контрольная работа | Учет материальных затрат в бухгалтерском учете |
Контрольная работа | Геополитическое положение России |
Контрольная работа | Особенности вознаграждения работников в организации |
Контрольная работа | Виды запасов |
Контрольная работа | Психоанализ |
Контрольная работа | Экологическая политика и природоохранная деятельность России |
Контрольная работа | Развитие политической мысли |
Контрольная работа | Реабілітаційна установа або реабілітаційний заклад |
Контрольная работа | Понятия (основные и междисциплинарные): воспитание, обучение, образование, педагогический процесс, формирование, развитие. Воспитание и самовоспитание, их взаимосвязь |
Контрольная работа | Конституция СССР 1924 г. |