Антагонистические и матричные игры

Автор работы: Пользователь скрыл имя, 31 Июля 2011 в 13:48, реферат

Описание

Задача теории состоит в том, что является:

1) оптимальным поведением в игре.

2) исследование свойств оптимального поведения

3) определение условий, при которых его использование осмысленно (вопросы существования, единственности, а для динамических игр и вопросы именной состоятельности).

4) построение численных методов нахождения оптимального поведения.

Содержание

Введение 3
Глава 1. Игровые модели 5
1.1. Теория игр 5
1.2. Классификация игровых моделей 10
Глава 2. Антагонистические и матричные игры 16
2.1. Антагонистические игры 16
2.2. Матричные игры 20
Заключение 23
Список литературы 26

Работа состоит из  1 файл

Анкогнистичные матричные игры.doc

— 133.50 Кб (Скачать документ)

     В-четвертых, необходимо описать сами интересы (цели) сторон. Это значит, что для каждой коалиции интересов из  Wu и на множестве всех ситуаций g должно быть указано бинарное отношение предпочтения Rk  , понимаемое как отношение нестрогого предпочтения. Как обычно отношение нестрогого предпочтения  порождает отношение безразличия   Ik=RkÇRk-1  , а также отношение строгого предпочтения  Pk=Rk\Ik (=Rk\Rk-1) .

     На  основе сказанного формальным представлением о конфликте можно считать  систему

     Г=<W, >, где

     W, и Wu произвольные множества             

       и  Rk Ì g´g ,  K Î Wu

     Системы такого вида будем называть играми.

     Остается  математически сформулировать представление  об оптимальности принимаемых решений. Это, однако, оказывается существенно  более трудным, чем обрисованная выше математизация понятия принятия решений и конфликта. Основная причина этого состоит в том, что пока еще не выработано достаточно содержательных представлений об оптимальности. Начнем с того почти тривиального соображения, что всякое содержательное представление об оптимальности в условиях конфликта состоит в правиле выбора для каждого конфликта (из определенного класса) некоторого множества его исходов, которые при этом и объявляются оптимальными. В математической форме это выглядит следующим образом: оптимальность это отображение j, которое каждой игре Г принадлежащей некоторому классу игр G, ставит в соответствие некоторое подмножество множества ее исходов g:  

                                        jГ Ì g , ГÎ G

     Соответствие  j при этом называется принципом оптимальности для класса игр G      , а множество исходов jГ- реализацией этого принципа для игры  Г  , или решением игры    в смысле принципа оптимальности.  Другими словами можно сказать, что оптимальной считается такая ситуация, в которой каждый игрок получает свой “максимальный” выигрыш, а именно: когда один игрок получает максимальный выигрыш, а второй - минимизирует свой проигрыш.

     В наиболее чистом виде сущность теории игр, как теории математических моделей принятия оптимальных решений в условиях конфликтов, воплощается в теории бескоалиционных игр, в которых множества коалиций действия и коалиций интересов совпадают; те и другие в этом случае называются игроками.

     В свою очередь в классе бескоалиционных  игр присутствуют свои подклассы. Рассмотрим некоторые важные подклассы бескоалиционных игр.

     Бескоалиционная игра Г называется конечной, если конечны все множества стратегий gi игроков iÎI. Конечные игры составляют простейший, но важный класс игр.

     Конечная  бескоалиционная игра называется биматричной, если множество I в ней состоит из двух игроков (т.е. I={1,2}). Такое название объясняется возможностью следующего естественного описания игр этого класса. Если составить две таблицы, в которых входы по строкам будут соответствовать стратегиям игрока 1, а входы по столбцам - стратегиям игрока 2, то в этих таблицах клетки будут соответствовать ситуациям игры. Если заполнить клетки первой таблицы значениями функции выигрыша игрока 1, а клетки второй таблицы - значениями функции выигрыша игрока 2, то получим пару матриц, полностью описывающих игру. Эти матрицы называются матрицами выигрышей в биматричной игре4.

     Биматричная игра с m´n - матрицами выигрышей игроков называется m´n - биматричной. Биматричную игру с матрицами выигрышей А и В будем обозначать через Г(А,В) или ГА,В, i - я строка любой матрицы обозначается через Мi. , j - ый столбец - М.j .

     Бескоалиционная игра Г называется игрой с постоянной суммой, если для каждой ее ситуации xÎg будет выполняться условие

      , где  Hi - функция выигрыша или платежа.

     Игра  Г называется игрой с нулевой суммой, если константа с =0 (модель в которой стороны ведут расчеты только между собой и платежи не поступают со стороны и не уходят на сторону).

     Бескоалиционная игра с нулевой суммой, в которой имеется только два игрока (первый игрок выбирает стратегию в множестве Х, второй  - в множестве Y, при этом каждый не знает, что выбирает другой) I={1,2} называется антагонистической. Цель первого игрока: Н ® max, цель второго игрока: Н ® min. Таким образом, в любой антагонистической игре выигрыш одного из игроков численно равен проигрышу другого:  H1(x1,x2)=-H2(x1,x2). Цена игры определяется, как суммарный платеж каждому игроку.

        Антагонистическая биматричная игра называется матричной.

     Неантагонистические игры - модели,  в которых присутствуют частично противоположные и частично совпадающие интересы “играющих” сторон.

     Дискретные  игры - игры, в которых множество стратегий дискретно.

     Игры  с полной информацией - игры, в которых все ходы противника заранее известны.

     Определение: Пара (x0,y0) Î X´Y называется седловой точкой, если F(x,y0) £

                                                                                                                             "xÎX

     F(x0,y0) £ F(x0,y)

      "yÎY

     Или по-другому: sup F(x,y0)=F(x0,y0)=inf F(x0,y),

                                      xÎX                            yÎY

     или max F(x,y0)=F(x0,y0)=minF(x0,y).

              xÎX                             yÎY

     Игровой смысл понятия седловой точки: игроки выбрали стратегии x0, y0, следовательно 1-ому игроку невыгодно отклоняться от x0, 2-ому игроку невыгодно отклоняться от y0. Т.е. это устойчивая точка.

     Определение: Г имеет решение, если функция  выигрыша F имеет седловую точку  на произведении X´Y. При этом x0,y0 называются оптимальными стратегиями.

 

      Глава 2. Антагонистические и матричные игры

     2.1. Антагонистические игры

 

     Задача  принятия решения, рассматриваемая  в рамках системного подхода, содержит три основные компоненты: в ней  выделены система, управляющая подсистема и среда. Теперь мы переходим к изучению задач принятия решения, в которых на систему воздействует не одна, а несколько управляющих подсистем, каждая из которых имеет свои цели и возможности действий. Такой подход к принятию решений называется теоретико-игровым, а математические модели соответствующих взаимодействий называются играми. Ввиду различия целей управляющих подсистем, а также определенных ограничений на возможности обмена информацией между ними, указанные взаимодействия носят конфликтный характер. Поэтому всякая игра представляет собой математическую модель конфликта. Ограничимся случаем, когда управляющих подсистем две. Если цели систем противоположны, конфликт называется антагонистическим, а математическая модель такого конфликта называется антагонистической игрой.5

     В теоретико-игровой терминологии 1-я  управляющая подсистема называется игроком 1, 2-я управляющая подсистема - игроком 2, множества их альтернативных действий называются множествами стратегий этих игроков. Пусть Х - множество стратегий игрока 1, Y - множество стратегий игрока 2. Состояние системы однозначно определяется выбором управляющих воздействий подсистемами 1 и 2, то есть выбором стратегий xX и yY. Пусть F(x,y)- оценка полезности для игрока 1 того состояния системы, в которое она переходит при выборе игроком 1 стратегии х и игроком 2 стратегии у. Число F(x,y) называется выигрышем игрока 1 в ситуации (x,y), а функция F - функцией выигрыша игрока 1. Выигрыш игрока 1 одновременно является проигрышем игрока 2 , то есть величиной, которую первый игрок стремится увеличить, а второй – уменьшить. Это и есть проявление антагонистического характера конфликта: интересы игроков полностью противоположны (то, что выигрывает один, проигрывает другой).

     Антагонистическую игру естественно задать системой Г=(Х, Y, F).

     Заметим, что формально антагонистическая  игра задается фактически так же, как  и задача принятия решения в условиях неопределенности - если отождествить управляющую подсистему 2 со средой. Содержательное различие между управляющей  подсистемой и средой состоит в том, что поведение первой носит целенаправленный характер. Если при составлении математической модели реального конфликта у нас есть основание (или намерение) рассматривать среду как противника, цель которого - принести нам максимальный вред, то такую ситуацию можно представить в виде антагонистической игры. Другими словами, антагонистическую игру можно трактовать как крайний случай ЗПР в условиях неопределенности, характеризуемый тем, что среда рассматривается как противник, имеющий цель. При этом мы должны ограничить виды гипотез о поведении среды.

     Наиболее  обоснованной здесь является гипотеза крайней осторожности, когда, принимая решение, мы рассчитываем на самый худший для нас возможный вариант  действий среды.

     Антагонистические игры, в которых один или оба игрока имеют бесконечное множество стратегий называются бесконечными. С теоретической точки зрения это отличие малосущественно, т.к. игра остается антагонистической, и проблема состоит в использовании более сложного аппарата исследования.

     Пример .(Одновременная игра преследования  на плоскости.)

     Пусть S1 и S2 - множества на плоскости. Игра Г заключается в следующем. Пусть 1-ый игрок выбирает некоторую точку хÎS1, а игрок 2 - точку yÎS2. При совершении выбора игроки 1 и 2 не имеют информации о действиях противника, поэтому подобный выбор удобно интерпретировать как одновременный. Точки хÎS1, yÎS2 являются в этом случае стратегиями игроков 1 и 2 соответственно. Таким образом, множества стратегий игроков совпадают с множествами S1 и S2 на плоскости.

     Целью игрока 2 является минимизация расстояния между ним и вторым игроком (игрок 1 преследует противоположную цель). Поэтому под выигрышем H(x,y) игрока 1 в этой игре будем понимать евклидово  расстояние r(x,y) между точками xÎS1 и yÎS2, т.е. H(x,y)= r(x,y), xÎS1 и yÎS2. Выигрыш игрока 2 полагается равным выигрышу игрока 1, взятому с противоположным знаком(т.к. игра антагонистическая).

Информация о работе Антагонистические и матричные игры