Методы решения матричных игр

Автор работы: Пользователь скрыл имя, 07 Ноября 2012 в 17:14, реферат

Описание

Математическая теория игр является составной частью исследования операций. Она применяется в различных областях человеческой деятельности, таких как экономика и менеджмент, промышленность и сельское хозяйство, военное дело и строительство, торговля и транспорт, связь и т.д.
Зачастую человек осуществляя какую-либо деятельность, сталкивается с проблемой принятия решения в условиях множества факторов, влияющих на само решение. Эффективней всего в подобных случаях пользоваться матричными играми, которые помогают упростить сложившуюся ситуацию и полностью оценить важность каждого фактора.

Содержание

1 ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕОРИИ ИГР…………………………...3
1.1 Предмет и задачи теории игр... ………………………………………3
1.2 Решение матричной игры в чистых стратегиях………………….......7
1.3 Решение матричной игры в смешанных стратегиях………………..10
1.4 Решение игр графическим методом…………………………………12
1.5 Сведение матричной игры к задаче линейного программирования…………………………………………………………..…...18
1.6 Игры с природой……………………………………………………....21

Работа состоит из  1 файл

Документ Microsoft Word.docx

— 227.69 Кб (Скачать документ)

Определение. Матрица, составленная из величин aij, , ,

 

 

называется платежной  матрицей, или матрицей игры. Каждый элемент платежной матрицы aij, , равен выигрышу А (проигрышу В), если он выбрал стратегию Аi, , а игрок В выбирал стратегию Вj,

Пример. В игре участвуют первый и второй игроки, каждый из них может записать независимо от другого цифры 1, 2 и 3. Если разность между цифрами, записанная игроками, положительна, то первый игрок выигрывает количество очков, равное разности между цифрами, и, наоборот, если разность отрицательна, то выигрывает второй игрок. Если разность равна нулю, то игра заканчивается вничью.

У первого игрока три стратегии (варианта действия): А1 (записать 1), А2 (записать 2), А3 (записать 3); у второго игрока также три стратегии: В1, В2, В3 (табл.1).

 

Таблица 1

 

В1 = 1

В2 = 2

В3 = 3

А1 = 1

0

– 1

– 2

А2 = 2

1

0

– 1

А3 = 3

2

1

0


 

Задача первого игрока –  максимизировать свой выигрыш. Задача второго игрока –  минимизировать свой проигрыш или минимизировать выигрыш  первого игрока. Платежная матрица  имеет вид:

 

.

 

Задача каждого из игроков  –  найти наилучшую стратегию  игры, при этом предполагается, что  противники одинаково разумны, и каждый из них делает все, чтобы получить наибольший доход.

Найдем наилучшую стратегию  первого игрока. Если игрок А выбрал стратегию Аi, , то в худшем случае (например, если его ход известен В) он получит выигрыш:

.

 Предвидя такую возможность, игрок А должен выбрать такую стратегию, чтобы максимизировать свой минимальный выигрыш.

 

.

Определение. Величина a – гарантированный выигрыш игрока А называется нижней ценой игры. Стратегия Aiопт, обеспечивающая получение выигрыша a, называется максиминной.

Если первый игрок будет  придерживаться своей максиминной  стратегии, то у него есть гарантия, что он в любом случае выиграет не меньше a.

Аналогично определяется наилучшая стратегия второго  игрока. Игрок В при выборе стратегии Вj, в худшем случае получит проигрыш . Он выбирает стратегию Bjопт, при которой его проигрыш будет минимальным и составит:

 

.

 

Определение. Величина b – гарантированный проигрыш игрока В называется верхней ценой игры. Стратегия Bjопт, обеспечивающая получение проигрыша b, называется минимаксной.

Если второй игрок будет  придерживаться своей минимаксной  стратегии, то у него есть гарантия, что он в любом случае проиграет  не больше b.

Фактический выигрыш игрока А (проигрыш игрока В) при разумных действиях партнеров ограничен верхней и нижней ценой игры. Для матричной игры справедливо неравенство a £ b.

Определение 4. Если a = b =v, т.е.

 

= ,

то выигрыш  игрока А (проигрыш игрока В) определяется числом v. Оно называется ценой игры.

Определение. Если a = b =v, то такая игра называется игрой с седловой точкой, элемент матрицы аiопт jопт = v, соответствующий паре оптимальных стратегий (Aiопт, Bjопт), называется седловой точкой матрицы. Этот элемент является ценой игры.

Седловой точке соответствуют  оптимальные стратегии игроков. Их совокупность –  решение игры, которое обладает свойством: если один из игроков придерживается оптимальной  стратегии, то второму отклонение от своей оптимальной стратегии  не может быть выгодным.

Определение 6. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.

Найдем решение игры рассмотренного выше примера:

 

a = a3 – нижняя цена игры.

 

b = b3 – верхняя цена игры.

Так как a = b = 0, матрица игры имеет седловую точку.

Оптимальная стратегия первого  игрока –  А3, второго –  B3. Из таблицы видно, что отклонение первого игрока от оптимальной стратегии уменьшает его выигрыш, а отклонение второго игрока от В3 увеличивает его проигрыш.

Наличие седловой точки в  игре –  это далеко не правило, скорее, исключение. Существует разновидность  игр, которые всегда имеют седловую точку и, значит, решаются в чистых стратегиях. Это так называемые игры с полной информацией.

Определение. Игрой с полной информацией называется такая игра, в которой каждый игрок при каждом личном ходе знает всю предысторию ее развития, т.е. результаты всех предыдущих ходов.

Примерами игр с полной информацией могут служить шашки, шахматы, "крестики-нолики" и т.д.

Теорема. Каждая игра с полной информацией имеет седловую точку и, значит, имеет решение в чистых стратегиях.

В каждой игре с полной информацией  существует пара оптимальных стратегий, дающая устойчивый выигрыш, равный цене игры v. Если решение игры известно, сама игра теряет смысл. Например, шахматная игра либо кончается выигрышем белых, либо выигрышем черных, либо ничьей, только чем именно – мы пока неизвестно (к счастью для любителей шахмат). Прибавив еще: вряд ли будет известно в обозримом будущем, так как число стратегий так велико, что крайне трудно привести шахматную игру к матричной форме и найти в ней седловую точку.

1.3 Решение матричной игры в смешанных  стратегиях

 

Если платежная матрица не имеет седловой точки, т.е. a <b и , то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении двух и более стратегий с определенными частотами.

Определение. Сложная стратегия, состоящая в случайном применении всех стратегий с определенными частотами, называется смешанной.

В игре, матрица которой имеет размерность m ´ n, стратегии первого игрока задаются наборами вероятностей (x1, x2,..., xm), с которыми игрок применяет свои чистые стратегии. Эти наборы можно рассмотреть как m– мерные векторы, для координат которых выполняются условия:

, xi ³ 0, .

 

Аналогично для второго  игрока наборы вероятностей определяют n– мерные векторы (y1, y2,..., yn), для координат которых выполняются условия:

 

= 1, yj ³ 0, .

 

Выигрыш первого игрока при  использовании смешанных стратегий  определяют как математическое ожидание выигрыша, т.е. он равен

 

.

 

Теорема. (Неймана. Основная теорема теории игр) Каждая конечная игра имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий. Применение оптимальной стратегии позволяет получить выигрыш, равный цене игры: a £ v £ b. Применение первым игроком оптимальной стратегии опт должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры. Поэтому выполняется соотношение

 

, .

 

Аналогично для второго  игрока оптимальная стратегия  опт должна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры, т.е. справедливо соотношение

 

, .

 

Если платежная матрица не содержит седловой точки, то задача определения смешанной стратегии тем сложнее, чем больше размерность матрицы. Поэтому матрицы большой размерности целесообразно упростить, уменьшив их размерность путем вычеркивания дублирующих (одинаковых) и не доминирующих стратегий.

Определение. Дублирующими называются стратегии, у которых соответствующие элементы платежной матрицы одинаковы.

Определение. Если все элементы i– й строки платежной матрицы больше соответствующих элементов k– й строки, то i– я стратегия игрока А называется доминирующей над k– й стратегией. Если все элементы j– го столбца платежной матрицы меньше соответствующих элементов k– го столбца, то j– я стратегия игрока В называется доминирующей над k– й стратегией.

Пример. Рассмотрим игру, представленную платежной матрицей

 

.

a = max (2, 2, 3,2) = 3, b = min (7, 6, 6, 4,5) = 4, a ¹ b, .

 

Все элементы стратегии А2 меньше элементов стратегии А3, т.е. А2 заведомо невыгодна для первого игрока и ее можно исключить. Все элементы А4 меньше А3, исключаем А4.

 

.

 

Для второго игрока: сравнивая В1 и В4, исключаем В1; сравнивая В2 и В4, исключаем В2; сравнивая В3 и В4, исключаем В3. В результате преобразований получим матрицу

 

.

a = max (2,3) = 3, b = min (4,5) = 4, a ¹ b, .

 

 

 

 

1.4 Решение игр графическим методом

 

Графический метод применим к играм, в которых хотя бы один игрок имеет только две стратегии.

Первый случай. Рассмотрим игру (2 ´ 2) с матрицей

 

 

без седловой точки. Решением игры являются смешанные стратегии игроков (x1, x2) и (y1, y2), где x1 – вероятность применения первым игроком первой стратегии, x2 – вероятность применения первым игроком второй стратегии, y1 – вероятность применения вторым игроком первой стратегии, y2 – вероятность применения вторым игроком второй стратегии. Очевидно, что

 

x1 + x2 = 1, y1 + y2 = 1.

 

Найдем решение игры графическим  методом. На оси ОX отложим отрезок, длина которого равна единице. Левый конец (x = 0) соответствует стратегии первого игрока А1, правый (x = 1) – стратегии А2. Внутренние точки отрезка будут соответствовать смешанным стратегиям (x1, x2) первого игрока, где x1 =1 – x2. Через концы отрезка проведем прямые, перпендикулярные оси ОX, на которых будем откладывать выигрыш при соответствующих чистых стратегиях. Если игрок В применяет стратегию В1, то выигрыш при использовании первым игроком стратегий А1 и А2 составит соответственно а11 и а21. Отложим эти точки на прямых и соединим их отрезком В1В1. Если игрок А применяет смешанную стратегию, то выигрышу соответствует некоторая точка М, лежащая на этом отрезке (см. рис.1).


 

                                                              В1     а21

 

                               М

 

                     В1

             а11

          

                                              х2                        х11                         Х

Рисунок 1. Графическое описание задачи

 

Аналогично строится отрезок В2В2, соответствующий стратегии В2 игрока В.

Определение. Ломаная линия, составленная из частей отрезков, интерпретирующих стратегии игрока В, расположенная ниже всех отрезков, называется нижней границей выигрыша, получаемого игроком А.

Определение. Стратегии, части которых образуют нижнюю границу выигрыша, называются активными стратегиями.

В игре (2 ´ 2) обе стратегии являются активными.

 


 

 

                                                                   В1 а21

                       В2

                 а12                  К

                                                                   В2 а22

                       В1

                а11                                 v

 

 

               О      х2        N       х1            1            Х

Рисунок 2. Графическое описание задачи

 

Ломаная В1КВ2 является нижней границей выигрыша, получаемого игроком А. (см. рис.2) Точка К, в которой он максимален, определяет цену игры и ее решение. Найдем оптимальную стратегию первого игрока. Запишем систему уравнений:

 

 

Приравнивая выражения для v из уравнений системы и учитывая, что

 

x1 + x2 = 1,

 

получим

 

, ,                          (1)

 

.                                           (2)

 

Составляя аналогичную систему

 

 

и учитывая условие:

 

y1 + y2 = 1,

можно найти оптимальную  стратегию игрока В:

.                                          (3)

 

Пример. Найти решение игры, заданной матрицей

 

.

Информация о работе Методы решения матричных игр