7.2 Моделирование конфликтов в теории игр

При управлении производством очень часто приходится принимать решения, не имея достаточной информа­ции, то есть в условиях неопределенности и риска.

Методами обоснования решений в условиях неопре­деленности и риска занимается математическая теория игр.

В теории игр рассматриваются такие ситуации, когда имеются два участника выполнения операции, каждый из которых преследует противоположные цели. В ка­честве участников могут выступать коллективы, кон­курирующие предприятия и т. д. Во всех случаях пред­полагается, что операция проводится против разумного противника (конкурента), преследующего свои собст­венные цели и сознательно противодействующего до­стижению цели другим участником.

Так как цели противоположны, а результат меро­приятия каждой из сторон зависит от действий кон­курента, то эти действия называют конфликтными ситуациями. В конфликтной ситуации сталкиваются про­тивоположные интересы двух участников. Формализо­ванная (схематизированная) модель конфликтной ситуации называется игрой. Результат игры – победа или поражение, которые не всегда имеют количествен­ное выражение, можно выразить (условно) числами (например, в шахматах: 1, 0, 1/2).

Игра называется игрой с нулевой суммой, если один из игроков выигрывает ровно столько, сколько проиг­рывает другой.

Развитие игры во времени представляется как ряд последовательных «ходов». Ходы могут быть сознатель­ные и случайные. Случайный ход - результат, полу­чаемый не решением игрока, а каким-либо механизмом случайного выбора (покупательский спрос, задержка с поставкой материалов и т. п.). Сознательный ход - выбор игроком одного из возможных вариантов действия (стратегии) и принятие решения о его осуществлении.

Возможные варианты (исходы) игры сводятся в пря­моугольную таблицу (табл.15) – платежную матрицу, в которой строки соответствуют различным стратегиям игрока , столбцы – стратегиям игрока . Для условности предположим, что игрок – выигрывает, а игрок – проигрывает.

В результате выбора игроками любой пары стратегий и (, ) однозначно определяется исход  игры .

Цель теории игр – выработка рекомендаций для различного поведения игроков в конфликтной ситуации, то есть выбор оптимальной стратегии для каждого из них.

Для нахождения оптимальной стратегии необходимо проанализировать все возможные стратегии и рассчи­тывать на то, что разумный противник на каждую из них будет отвечать такой, при которой выигрыш игрока минимален. Обычно минимальные числа в каждой стро­ке обозначаются  и выписываются в виде добавочного столбца матрицы (табл. 16).

Они обозначают минимально-возможный выигрыш игрока при соответствующей стратегии . В каждой строке будет свое . Так как игрок выигрывает, то предпочтительной для игрока является стратегия, при которой  обращается в максимум, то есть  или ,

Где

– максиминный выигрыш (максимин), а соот­ветствующая ей стратегия – максиминная.

Таблица 15 – Платежная матрица

Таблица 16 – Платежная матрица с добавочными столбцом и строкой

Если придерживаться максиминной стратегии, то при любом поведении стороны (конкурента) гаран­тирован выигрыш, во всяком случае, не меньше . Поэтому  называют также ценой игры - тот гаран­тированный минимум, который можно обеспечить при наиболее осторожной (перестраховочной) стратегии.

Очевидно, что аналогичные распределения можно провести и для конкурента , который должен рас­смотреть все свои стратегии, выделяя для каждой из них максимальные значения проигрыша:  (последняя строка матрицы).

Из всех значений находят минимальное:

,

Которое дает минимаксный выигрыш или минимакс.

Такая – стратегия является минимаксной, придерживаясь которой сторона гарантирует, что в любом случае проиграет не больше . Поэтому называют верхней ценой игры.

Если , то число называют чистой ценой игры или седловой точкой.

Для игры с седловой точкой нахождение решения состоит в выборе пары максиминной и минимаксной стратегий, которые являются оптимальными, так как любое отклонение от этих стратегий приводит к умень­шению выигрыша первого игрока и увеличению про­игрыша второго игрока по сравнению с ценой игры .

Однако не все матрицы имеют седловую точку. Тогда решение находят, применяя смешанные стратегии, то есть, чередуя случайным образом несколько чистых стра­тегий (гибкая тактика).

Вектор, каждая из компонент которого показывает относительную частоту использования игроком соответ­ствующей чистой стратегии, называют смешанной стра­тегией данного игрока.

Из этого определения следует, что сумма компонент этого вектора равна единице, а сами компоненты не отрицательны.

Обычно смешанную стратегию первого игрока обо­значают как вектор

, а второго игрока - как вектор , где

, , .    (36)

Если u° – оптимальная стратегия первого игрока, – оптимальная стратегия второго игрока, то число   – называют ценой игры.

Для того чтобы число - было ценой игры, а и – оптимальными стратегиями, необходимо и до­статочно выполнение неравенств:

   , (),    (37)

 , ().    (38)

Если один из игроков применяет оптимальную сме­шанную стратегию, то его выигрыш равен цене игры вне зависимости от того, с какими частотами будет применять второй игрок стратегии, вошедшие в оптимальную, в том числе и чистые стратегии.

Внимание к седловым точкам в теории игр традиционно. Объясняется это недоверием к максимину, как к принципу оптимального выбора в том случае, когда нет седловой точки. Поэтому естественно стремление заполнить промежуток между максимином и минимаксом путем применения смешанных стратегий.

Однако не следует забывать, что:

1) применение смешанных стратегий рисковано, когда игра не повторяется;

2) если игра повторяется, надо иметь уверенность, что у про­тивника нет информации о конкретных решениях другого игрока;

3) противник не обязан применять смешанные стратегии, равно как и стремиться к цели, противоположной цели другого игрока.

Обозначим смешанную стратегию первого игрока , , где – вероятность применения -й стратегии, ,. Пусть смешанная стратегия второго игрока , , – вероятность при­менения -й стратегии, , . и определяют матема­тическое ожидание платежа:

.

Теорема фон Неймана. Любая матричная игра имеет седловую точ­ку в смешанных стратегиях.

Доказательство. Множества и ограничены и замкнуты, так как , , а функция непрерывна по и . Линейна по при фиксированных , следовательно, вогнута по при фиксированных . Аналогично выпукла по при фиксированных . и выпуклы.

Действительно, рассмотрим такие и , что , , тогда , .

Складывая, получим.

Кроме того,

.

Следовательно, при и тоже смешанная стратегия.

Применяя фундаментальную теорему, получим то, что требуется доказать:

.

Опираясь на доказанную теорему, можно быть уверенным, что ре­шение игры в смешанных стратегиях всегда существует (если только вообще их можно применять). В теории игр доказывается теорема, указывающая на эквивалентность решения матричной игры в смешанных стратегиях и двойственной задачи линейного программирования.

Пусть и оптимальные смешанные стратегии, - цена игры, тогда

.

Из Теоремы фон Неймана следует, что

,, (39)

,, (40)

.

Обозначим .

Поделим (39) на , получим

, , , .

Из этой задачи линейного программирования можно получить оптимальные стратегии первого игрока (оперирующей стороны).

Аналогично, если , получится задача линейного программирования для получения оптимальных стратегий второго игрока:

, , , .

© 2011-2024 Контрольные работы по математике и другим предметам!