Решение и геометрическая интерпретация игр
Игра
является наиболее простым случаем конечных игр. В этой игре каждый игрок имеет только две стратегии. В случае, если игрок
имеет седловую точку,
то его решение очевидно. Рассмотрим случай, когда игра не имеет седловой точки, т.е.
. Требуется найти оптимальные стратегии игроков
и
и цену игры
.
Т.к. в игре нет седловой точки, то обе стратегии игроков являются активными. В соответствии с теоремой об активных стратегиях, если 1 игрок будет применять свою оптимальную стратегию, то, независимо о действий второго игрока, его выигрыш будет цены игры
. Пусть
. Если 2-ой игрок применяет стратегию
, то выигрыш первого игрока определяется из уравнения
Если 2 применяет
, то выигрыш 1
Т.к.
, то получим систему. Ее решение
Аналогично определяется оптимальная стратегия 2 игрока
из системы уравнений
Дадим геометрическую интерпретацию игры
с матрицей
В системе координат
на оси абсцисс отложим от начала координат отрезок длинной равной единице.
Левый конец отрезка соответствует стратегии
, а правый (x = 1) – стратегии
.
Все промежуточные точки отрезка будут изображать смешанные стратегии
игрока. Длина отрезка
равна вероятности
стратегии
. Длина
равна
стратегии
. Через
и
проведем два перпендикуляра к оси абсцисс – ось I-I и ось II-II.
На I-I будем откладывать выигрыш при стратегии
, а на II-II – при
.
Если игрок 2 применит стратегию
, то при
выигрыш равен
, а при
равен
.
Отложим эти точки на осях I-I и II-II и обозначим их
.
, что соответствует одноименной стратегии 2-го игрока.
Любой смешанной стратегии
соответствует выигрыш, величина которого равна абсциссе
точки М на прямой
. Эту прямую будем называть стратегией
. Аналогично можно построить стратегию
.
Задача состоит в определении оптимальной стратегии
, при которой наш минимальный выигрыш обращался бы в максимум.
Построим нижнюю границу выигрыши при стратегиях
, т.е. ломанную
. На этой ломанной будет лежать минимальный выигрыш A при любой смешанной стратегии. В точке М имеем максимальную цену игры
. Если игра имеет седловую точку, то соответствующий график показан на рис. 2:
рис. 2
Здесь нижняя граница совпадает с отрезком
. Возможна так же ситуация показанная на рис. 3:
рис. 3
Здесь оптимальная чистая стратегия
.
Пример: Имеется игра
,
,
, т.е. игра не имеет седловых точек
Решение 2 х m и n x 2
В играх порядка 2
первый игрок имеет две стратегии, а второй – m стратегий. Платежная матрица имеет вид
Причем у нее нет седловых точек.
Необходимо найти такие смешанные стратегии
и
и цену игры
, которые удовлетворяют соотношениям
Что означают неравенства (1) и (2). Пусть игрок 1 применяет свою оптимальную стратегию
, а его противник применяет чистую стратегию
. Т.к.
это цена игры, то она определяет нижний придел выигрыша при любых стратегиях второго игрока, в том числе смешанных. Аналогично можно объяснить неравенство (2) – верхний предел проигрыша 2-го игрока.
Не доказывая, отметим, что любая конечная игра
имеет решение, в котором число активных стратегий каждого игрока не превосходит
.Следовательно, у игры 2
или
всегда имеется решение, содержащее не более двух активных стратегий у каждого из игроков. Если найти эти активные стратегии игроков, то игра
или
превращается в игру
. Решение таких игр мы рассматривали.
Введем обозначение для левой части неравенств (1)
,
где
– средний выигрыш первого игрока при условии, что он применяет свою смешанную стратегию, а второй – свою j чистую стратегию. Каждому значению
соответствует прямая линия прямоугольной системы координат.
Цель второго игрока минимизировать выигрыш первого за счет своих альтернатив. Поэтому 2 игрок должен определить такие j, которые обеспечивают
где
– нижняя граница множества ограничений (показана жирной линий).
Цель первого игрока максимизировать свой выигрыш за счет выбора
, т.е. вычислить
В результате определяется оптимальная стратегия первого игрока
и пара альтернативных стратегий 2 игрока, которые при пересечение образуют точку
. В нашем случае это
и
. В результате мы свели задачу размерности
, к задаче
с платежной матрицей
Решая полученную игру найдем
и
.
Пример: Выбор с/х культуры. С/х предприятие имеет возможность выращивать две культуры. Прибыль от реализации выращенной культуры зависит от объема полученного урожая. Урожай первой культуры выше при сухо погоде, а второй – при более влажной. В летний период можно рассматривать следующие стратегии погоды:
- Лето жаркое сухое
- Лето жаркое влажное
- Лето теплое влажное
- Лето теплое сухое
- Лето прохладное сухое
- Лето прохладное влажное
Стратегии предприятия
- Выращивать первую культуру
- Выращивать вторую культуру
Предприятие 1 игрок
Погода 2 игрок
Расчеты прибыли предприятия в млн. руб. в зависимости от состояния погоды представлены в виде платежной матрицы
Определить оптимальные стратегии поведения с/х предприятия. В этой игре нет седловой точки. Будем использовать графический метод.
– вероятность применения первым игроком стратегии
– смешанная стратегия погоды. Средний выигрыш первого игрока.
Эти зависимости показаны на графике.
Активными стратегиями “погоды” является 4-ая и 6-ая. Поэтому решение игры сводится к решению следующей системы уравнений
Решение:
,
,
,
.
Решение игр m x n
Пусть задана игра
с платежной матрицей
. Пусть 1-ый задался целью выиграть не менее
при любо стратегии противника. Причем
должно быть максимальным. Тогда его задача состоит в определении оптимального решения в смешанных стратегиях
, для которого выполнялось бы
Все
можно считать положительными, в противном случае можно добиться этого, прибавив ко всем элементам матрицы положительную константу. Такая прибавка никак не влияет на стратегию игроков. Установите игроков с положительной платежной матрицей нижняя цена игры положительна. Мы можем прейти к новым переменным
, а задача 1-го игрока сводится к нахождению вектора
Мы применим к задаче линейного программирования с n переменными и m стратегиями.
Второй игрок стремится проиграть не более, чем
. Причем
нужно минимизировать. Можно показать, что задача сводится к нахождению вектора
Если сопоставить задачи первого и второго игрока, то можно увидеть, что они образуют двойственную пару задач линейного программирования. Из свойств решения двойственных задач следует
– цена игры