Решение матричных игр двух лиц с нулевой суммой.
Принцип минимакса.
Рассмотрим игру
с платежной матрицей
Следует определить наилучшую стратегию игрока I среди стратегий
,
и игрока II среди стратегий
,
.
Определение наилучших стратегий игроков основано на принципе, который предполагает, что противники, участвующие в игре, одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.
Найдем наилучшую стратегию игрока I. Допустим, что он выбрал i-ю стратегию (i –ю строку матрицы (1)). Тогда он получит меньше, чем
– наименьшее число в этой строке. Причем это будет в том случае, если игрок II каким-то образом раскроет стратегию игрока I. Из сказанного следует, что I игрок, если он не желает рисковать, т.е. играть не оптимально, должен действовать следующим образом – определить наименьшие элементы всех строк и выбрать ту из них, в которой это число наибольшее. В этом случае он гарантирует себе выигрыш равный наибольшему из меньших чисел всех строк. Этот выигрыш равен
Число
это “низкий выигрыш” игрока I и его называют
нижним значением
или
нижней ценой игры.
Как же рассуждает второй игрок? “Если я выберу j-ую стратегию (j-ый столбец), то самый лучший выигрыш у игрока I будет
– наибольшее число этого столбца. Чтобы рисковать, я должен выбрать столбец, в котором это число наименьшее. В результате I игрок не сможет получить больше, чем
Число
представляет собой ”верхний выигрыш” игрока I и называется
верхним значение
или
верхней ценой игры.
Можно показать, что для всякой матричной игры выполняется условие
. Если
, то такие игры называются
играми с седловой точкой.
Из неравенства
следует, что
. Это фактически означает, игрок I мог бы рассчитывать на выигрыш
.
Рассмотрим два примера:
Пример 1:
,
,
, вторая строка максиминная стратегия. 2 - ой столбец – минимаксная стратегия.
В этом примере применение минимаксной стратегии приводит к выигрышу 1 игрока равному
, а
достается второму игроку.
Пример 2:
,
,
, 1 строка – максиминная стратегия. 1 столбец – минимаксная стратегия.
Применение в этой игре минимаксных и максиминных стратегий приводит к выигрышу 1 игрока равному
, т.е.
достается ему.
Из приведенных примеров видно, что при
применение минимаксных и максиминных стратегий не приводит к определенному результату. В связи с этим возникает неопределенность в действиях игроков. Например, в первом примере 1 игрок отклоняясь от максиминной стратегии может выиграть 2 > 1(второй игрок при этом придерживается минимаксными стратегиями).
Поэтому при
минимаксная и максиминная стратегии не являются оптимальными.
Рассмотрим
– величина, которую себе гарантирует первый игрок, совпадает с той величиной, больше которой 2 игрок не позволит ему получить.
Пример 3:
,
,
. Отклонение одностороннее от минимаксной и максиминной стратегий невыгодно игрокам.
Опр.: Если
, то минимаксная или максиминная стратегии называются
оптимальными стратегиями игроков,
называется
значениями
или
ценой игры.
Опр.: Стратегии
и
н0азываются
минимальными в игре
,
,
, если
Пара
,
называется
седловой точкой
игры.
Можно доказать следующую теорему:
теорема: для того чтобы игра A имела седловую точку, необходимо и достаточно
Это равенство называется
правилом оптимальной игры
или
принципом минимакса.
В примере 3 значение игры равно элементу матрицы, минимальному в своей строке и максимальному в своем столбце. Если в матрице нет такого элемента, то игра не имеет седловой точки. Необходимо отметить, что в игре может быть несколько седловых точек.
Пример 4:
,
,
. Здесь нет седловых точек! По субъективной оценке игрока I его первая стратегия лучше второй в два раза. Тогда он может смешивать с вероятностями 2/3 и 1/3, т.е. выбрать не первую и не вторую, а вектор
. В этом случае средний выигрыш первого игрока составит
Число 1/3 называется ожидаемым выигрышем игрока I при использовании смешанной стратегии
. Этот результат соответствует розыгрышу игры из большого числа партий.
Первый игрок может смешивать свой стратегии с любыми вероятностями
. В результате, вместо двух первоначальных стратегий (1,0) и (0,1) оказывается бесконечное множество стратегий вида
.
Аналогично может рассмотреть свои возможности второй игрок
. Если
, то ожидаемый выигрыш в нашем примере равен
В общем случае для игры
под смешанной стратегией 1 игрока будем понимать вектор
. Аналогично обозначим смешанную стратегию 2-го игрока
. При этом выполняется условие
и
. Очевидно, каждая чистая стратегия является частичным случаем смешанной: все стратегии, кроме данной, имеют вероятности равные нулю, а данный единице.
Величина ожидаемого выигрыша игрока I при применении смешанных стратегий равна математическому ожиданию
где
– матрица столбец.
В основной теореме теории игр утверждается, что любая конечная игра двух лиц с нулевой суммой имеет по крайней мере одно решение в смешанных стратегиях, которые обозначим
,
. Это решение позволяет добиваться величины среднеожидаемого выигрыша
. Величина
называется
ценой игры
и удовлетворяет неравенству
следовательно, каждый игрок при многократном повторении игры, придерживаясь смешанных стратегий, получает для себя более выгодный результат.
Определение оптимального решения игры в смешанных стратегиях это нахождение
,
.Предположим, что
и
найдены. В общем случае, некоторые из чисел
могут быть равными нулю. Это означает, что в оптимальную смешанную игрока входят не все оптимальную смешанную стратегию с отличными от нуля вероятностями. Сформулируем без доказательства теорему об активных стратегиях, имеющую важное значение для решения игр.
Теорема: Если один из игроков придерживается своей оптимальной смешанной стратегией, то выигрыш остается неизменным и равным цене игры
, независимо от того, что делает другой игрок, если только тот не выходит за пределы своих активных стратегий.