Метод платежной матрицы. Платежная матрица игры

ПРАКТИЧЕСКАЯ РАБОТА №3

Модели теории игр

Понятие об игровых моделях

Теория игр занимается разработкой различного рода рекомендаций по принятию решений в условиях конфликтной ситуации. Формируя конфликтные ситуации математически, их можно представить как игру двух, трёх и более игроков, каждый из которых преследует цель максимизации своего выигрыша за счет другого игрока. Математическая модель конфликтной ситуации называется игрой , стороны, участвующие в конфликте, – игроками , а исход конфликта – выигрышем . Для каждой формализованной игры вводятся правила , т.е. система условий, определяющая:

1. варианты действий игроков;

2. объем информации каждого игрока о поведении партнеров;

3. выигрыш, к которому приводит каждая совокупность действий.

Как правило, выигрыш может быть задан количественно (например, проигрыш – 0, выигрыш – 1, ничья – ½). Игра называется парной , если в ней участвуют два игрока, и множественной , если число игроков больше двух. Игра называется игрой с нулевой суммой , если выигрыш одного из игроков равен проигрышу другого. Выбор и осуществление одного из предусмотренных правилами действий называется ходом игрока. Ходы могут быть личными и случайными. Личный ход – сознательный выбор игроком одного из возможных действий (ход в шахматной игре), случайный ход – случайно выбранное действие (выбор карты из перетасованной колоды).

Стратегией игрока называется совокупность правил, определяющих выбор его действия при при каждом личном ходе в зависимости от сложившейся ситуации. Игра называется конечной , если у игрока имеется конечное число стратегий, и бесконечной – в противном случае.

Для того, чтобы решить игру, или найти решение игры , следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, т.е. один из игроков должен получить максимальный выигрыш , когда второй придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш , если первый придерживается своей стратегии. Такие стратегии называются оптимальными. Целью теории игр является определение оптимальной стратегии для каждого игрока . При выборе оптимальной стратегии естественно предполагать, что оба игрока ведут себя разумно с точки зрения своих интересов.

Платежная матрица. Нижняя и верхняя цена игры

Рассмотрим парную конечную игру. Пусть игрок А располагает m личными стратегиями, которые обозначим А 1 , А 2 ,…,А m . Пусть у игрока B имеется n личных стратегий, обозначим их B 1 , B 2 ,…,B n . Говорят, что игра имеет размерность m ´ n . В результате выбора игроками любой пары стратегий А i и B j однозначно определяется исход игры, т.е. выигрыш a ij игрока А (положительный или отрицательный) и проигрыш (-a ij ) игрока В . Матрица Р=(a ij) , элементами которой являются выигрыши, соответствующие стратегиям А i и B j , называется платежной матрицей или матрицей игры .

B j A i	B 1	B 2	…	B n
A 1	a 11	a 12	…	a 1n
A 2	a 21	a 22	…	a 2n
…	…	…	…	…
A m	a m1	a m 2		a mn

Пример – игра «Поиск»

Игрок А может спрятаться в убежище 1 – обозначим эту стратегию за А 1 или в убежище 2 – стратегия А 2 . Игрок В может искать первого игрока в убежище 1 –стратегия В 1 , либо в убежище 2 – стратегия В 2 . Если игрок А находится в убежище 1 и его там обнаруживает игрок В , т.е. осуществляется пара стратегий (А 1 ,В 1) , то игрок А платит штраф, т.е. a 11 =–1. Аналогично получаем a 22 =–1. Очевидно, что стратегии (А 1 ,В 2) и (А 2 ,В 1) дают игроку А выигрыш 1, поэтому a 12 =a 21 =1. Таким образом, получаем платежную матрицу

Рассмотрим игру m ´ n с матрицей Р=(a ij) и определим наилучшую среди стратегий игрока А . Выбирая стратегию А i , игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий В j , для которой выигрыш для игрока А минимален (игрок В стремится «навредить» игроку А ).

Обозначим через a i наименьший выигрыш игрока А при выборе им стратегии А i для всех возможных стратегий игрока В (наименьшее число в i -й строке платежной матрицы), т.е. .

Среди всех чисел a i выберем наибольшее: . Назовем a нижней ценой игры , или максимальным выигрышем (максимином ). Это гарантированный выигрыш игрока А при любой стратегии игрока В . Следовательно, .

Стратегия, соответствующая максимину, называется максиминной стратегией . Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А ; выбирая стратегию B j , он учитывает максимально возможный при этом выигрыш для A. Обозначим .

Среди всех чисел выберем наименьшее иназовем b верхней ценой игры , или минимаксным выигрышем (минимаксом ). Это гарантированный проигрыш игрока В при любой стратегии игрока А . Следовательно, .

Стратегия, соответствующая минимаксу, называется минимаксной стратегией . Принцип, диктующий игрокам выбор наиболее осторожных минимаксной и максиминной стратегий, называется принципом минимакса .

Статистические игры

Во многих задачах, приводящихся к игровым, неопределенность вызвана отсутствием информации об условиях, в которых осуществляется действие. Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности, которую принято называть «природой». Такие игры называют играми с природой (статистическими играми).

Задача

После нескольких лет эксплуатации промышленное оборудование оказывается в одном из следующих состояний: В 1 – оборудование может использоваться в очередном году после профилактического ремонта; В 2 – для безаварийной работы оборудования в дальнейшем следует заменить отдельные его детали и узлы; В 3 – оборудование требует капитального ремонта или замены.

В зависимости от сложившейся ситуации В 1 ,В 2 ,В 3 руководство предприятия может принять такие решения: А 1 – отремонтировать оборудование силами заводских специалистов, что требует соответствующих затрат а 1 =6, а 2 =10, а 3 =15 ден.ед; А 2 – вызвать специальную бригаду ремонтников, расходы в этом случае составят b 1 =15, b 2 =9, b 3 =18 ден.ед; А 3 – заменить оборудование новым, реализовав устаревшее оборудование по его остаточной стоимости. Совокупные затраты в результаты этого мероприятия будут равны соответственно с 1 =13, с 2 =24, с 3 =12 ден.ед.

Задание

1. Придав описанной ситуации игровую схему, выявить ее участников, указать возможные чистые стратегии сторон.

2. Составить платежную матрицу, пояснив смысл элементов a ij матрицы (почему они отрицательные?).

3. Выяснить, какое решение о работе оборудования в предстоящем году целесообразно рекомендовать руководству предприятия, чтобы минимизировать потери при следующих предположениях: а) накопленный на предприятии опыт эксплуатации аналогичного оборудования показывает, что вероятности указанных состояний оборудования равны соответственно q 1 =0,15; q 2 =0,55; q 3 =0,3 (примените критерий Байеса); б) имеющийся опыт свидетельствует о том, что все три возможных состояния оборудования равновероятны (примените критерий Лапласа); в) о вероятности оборудования ничего определенного сказать нельзя (примените критерии Вальда, Сэвиджа, Гурвица). Значение параметра g=0,8 в критерии Гурвица задано.

Решение

1) Описанная ситуация представляет собой статистическую игру.

В качестве статистика выступает руководство предприятия, которое может принять одно из следующих решений: отремонтировать оборудование своими силами (стратегия А 1), вызвать ремонтников (стратегия А 2); заменить оборудование новым (стратегия А 3).

Второй играющей стороной – природой будем считать совокупность факторов, влияющих на состояние оборудования: оборудование может использоваться после профилактического ремонта (состояние В 1); нужно заменить отдельные узлы и детали оборудования (состояние В 2): потребуется капитальный ремонт или замена оборудования (состояние В 3).

2) Составим платежную матрицу игры:

Элемент платежной матрицы а ij показывает затраты руководства предприятия, если при выбранной стратегии А i оборудование окажется в состоянии В j . Элементы платежной матрицы отрицательны, так как при любой выбранной стратегии руководству предприятия придется нести расходы.

а) накопленный на предприятии опыт эксплуатации аналогично оборудования показывает, что вероятности состояний оборудования равны q 1 =0,15; q 2 =0,55; q 3 =0,3.

Платежную матрицу представим в виде:

Стратегии статистика, A i	Состояния природы B j
B 1	B 2	B 3
A 1	-6	-10	-15	-10,9
A 2	-15	-9	-18	-12,6
A 3	-13	-24	-12	-18,75
q j	0,15	0,55	0,3

где , (i=1,3)

По критерию Байеса за оптимальную принимается та чистая стратегия А i , при которой максимизируется средний выигрыш статистика, т.е. обеспечивается =max .

Оптимальной стратегией по Байесу является стратегия А 1 .

б) имеющийся опыт свидетельствует о том, что все три возможных состояния оборудования равновероятны, т.е. = 1/3.

Средние выигрыши равны:

1/3*(-6-10-15) = -31/3 » -10,33;

1/3*(-15-9-18) = -42/3 = -14;

1/3*(-13-24-12) = -49/3 » -16,33.

Оптимальной стратегией по Лапласу является стратегия А 1 .

в) о вероятностях оборудования нельзя сказать ничего определенного.

По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.

= max (-15, -18, -24) = -15.

Таким образом, оптимальной является стратегия А 1 .

Построим матрицу рисков , где .

Лекция 9. Понятие об игровых моделях. Платежная матрица.

§ 6 ЭЛЕМЕНТЫ ТЕОРИИ ИГР

6.1 Понятие об игровых моделях.

Математическая модель конфликтной ситуации называется игрой , стороны, участвующие в конфликте, – игроками, а исход конфликта – выигрышем .

Для каждой формализованной игры вводятся правила , т.е. система условий, определяющая: 1) варианты действий игроков; 2) объем информации каждого игрока о поведении партнеров; 3) выигрыш, к которому приводит каждая совокупность действий. Как правило, выигрыш (или проигрыш) может быть задан количественно; например, можно оценить проигрыш нулем, выигрыш – единицей, а ничью – 1/2. Количественная оценка результатов игры называется платежом .

Игра называется парной , если в ней участвуют два игрока, и множественной , если число игроков больше двух. Мы будем рассматривать только парные игры. В них участвуют два игрока А и В, интересы которых противоположны, а под игрой будем понимать ряд действий со стороны А и В.

Игра называется игрой с нулевой суммой, или антагонистиче ской , если выигрыш одного из игроков равен проигрышу другого, т.е. сумма выигрышей обеих сторон равна нулю. Для полного задания игры достаточно указать величину одного изних. Если обозначить а – выигрыш одного из игроков, b – выигрыш другого, то для игры с нулевой суммой b = –а , поэтому достаточно рассматривать, например а.

Выбор и осуществление одного из предусмотренных правилами действий называется ходом игрока. Ходы могут быть личными и случайными . Личный ход – это сознательный выбор игроком одного из возможных действий (например, ход в шахматной игре). Набор возможных вариантов при каждом личном ходе регламентирован правилами игры и зависит от всей совокупности предшествующих ходов с обеих сторон.

Случайный ход – это случайно выбранное действие (например, выбор карты из перетасованной колоды). Чтобы игра была математически определенной, правила игры должны для каждого случайного хода указывать распределение вероятностей возможных исходов.

Некоторые игры могут состоять только из случайных ходов (так называемые чисто азартные игры) или только из личных ходов (шахматы, шашки). Большинство карточных игр принадлежит к играм смешанного типа, т. е. содержит как случайные, так и личные ходы. В дальнейшем мы будем рассматривать только личные ходы игроков.

Игры классифицируются не только по характеру ходов (личные, случайные), но и по характеру и по объему информации, доступной каждому игроку относительно действий другого. Особый класс игр составляют так называемые «игры с полной информацией». Игрой с полной информацией называется игра, в которой каждый игрок при каждом личном ходе знает результаты всех предыдущих ходов,как личных, так и случайных. Примерами игр с полной информацией могут служить шахматы, шашки, а также известная игра «крестики и нолики». Большинство игр, имеющих практическое значение, не принадлежит к классу игр с полной информацией, таккак неизвестность по поводу действий противника обычно является существенным элементом конфликтных ситуаций.

Одним из основных понятий теории игр является понятие стратегии .

Стратегией игрока называется совокупность правил, определяющих выбор его действия при каждом личном ходе в зависимости от сложившейся ситуации. Обычно в процессе игры при каждом личном ходе игрок делает выбор в зависимости от конкретной ситуации. Однако в принципе возможно, что все решения приняты игроком заранее (в ответ на любую сложившуюся ситуацию). Это означает, что игрок выбрал определенную стратегию, которая может быть задана в виде списка правил или программы. (Так можно осуществить игру с помощью ЭВМ). Игра называется конечной , если у каждого игрока имеется конечное число стратегий, и бесконечной .– в противном случае.

Для того чтобы решить игру, или найти решение игры , следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности , т.е. один из игроков должен получать максимальный выигрыш, когда второй придерживается своей стратегии, В то же время второй игрок должен иметь минимальный проигрыш , если первый придерживается своей стратегии. Такие стратегии называются оптимальными . Оптимальные стратегии должны также удовлетворять условию устойчивости , т.е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре.

Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной партии, а средний выигрыш (проигрыш) во всех партиях.

Целью теории игр является определение оптимальной стратегии для каждого игрока.

6.2. Платежная матрица. Нижняя и верхняя цена игры

Конечная игра, в которой игрок А имеет т стратегий, а игрок В – п стратегий, называется игрой .

Рассмотрим игру
двух игроковА и В («мы» и «противник»).

Пусть игрок А располагает т личными стратегиями, которые обозначим
. Пусть у игрокаВ имеется n личных стратегий, обозначим их
.

Пусть каждая сторона выбрала определенную стратегию; для нас это будет , для противника. В результате выбора игроками любой пары стратегийи(
) однозначно определяется исход игры, т.е. выигрышигрокаА (положительный или отрицательный) и проигрыш
игрокаВ.

Предположим, что значения известны для любой пары стратегий (,). Матрица
,
, элементами которой являются выигрыши, соответствующие стратегиям и , называется платежной матрицей или матрицей игры. Строки этой матрицы соответствуют стратегиям игрока А, а столбцы – стратегиям игрока B . Эти стратегии называются чистыми.

Матрица игры
имеет вид:

Рассмотрим игру
с матрицей

и определим наилучшую среди стратегий
. Выбирая стратегию , игрок А должен рассчитывать, что игрок В ответит на нее той из стратегий , для которой выигрыш для игрока А минимален (игрок В стремится "навредить" игроку A ).

Обозначим через наименьший выигрыш игрокаА при выборе им стратегии для всех возможных стратегий игрокаВ (наименьшее число в i -й строке платежной матрицы), т.е.

(1)

Среди всех чисел (
) выберем наибольшее:
.

Назовем
нижней ценой нгры, или максимальным выигрышем (максмином). Это гарантированный выигрыш игрока А при любой стратегии игрока В. Следовательно,

. (2)

Стратегия, соответствующая максимину, называется максиминной стратегией . Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А, выбирая стратегию , он учитывает максимально возможный при этом выигрыш для А. Обозначим

. (3)

Среди всех чисел выберем наименьшее

и назовем верхней ценой игры илиминимаксным выигрышем (минимаксом). Эго гарантированный проигрыш игрока В . Следовательно,

. (4)

Стратегия, соответствующая минимаксу, называется минимаксной стратегией.

Принцип, диктующий игрокам выбор наиболее "осторожных" минимаксной и максиминной стратегий, называется принципом минимакса . Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника.

Теорема. Нижняя цена игры всегда не превосходит верхней цены игры
.

Если верхняя и нижняя цены игры совпадают, то общее значение верхней и нижней цены игры
называется чистой ценой игры, или ценой игры. Минимаксные стратегии, соответствующие цене игры, являются оптимальными стратегиями , а их совокупность – оптимальным решением или решением игры. В этом случае игрок А получает максимальный гарантированный (не зависящий от поведения игрока В) выигрыш v , а игрок В добивается минимального гарантированного (вне зависимости от поведения игрока А) проигрыша v . Говорят, что решение игры обладает устойчивостью , т.е. если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.

Если один из игроков (например А) придерживается своей оптимальной стратегии, а другой игрок (В) будет любым способом отклоняться от своей оптимальной стратегии, то для игрока, допустившего отклонение, это никогда не может оказаться выгодным; такое отклонение игрока В может в лучшем случае оставить выигрыш неизменным. а в худшем случае – увеличить его.

Наоборот, если В придерживается своей оптимальной стратегии, а А отклоняется от своей, то это ни в коем случае не может быть выгодным для А.

Пара чистых стратегий и дает оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент является одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой. В геометрии точку на поверхности, обладающую свойством: одновременный минимум по одной координате и максимум по другой, называют седловой точкой, по аналогии этот термин применяют в теории игр.

Игра, для которой
, называется игрой с седловой точкой. Элемент , обладающий этим свойством, седловой точкой матрицы.

Итак, для каждой игры с седловой точкой существует решение, определяющее пару оптимальных стратегий обеих сторон, отличающуюся следующими свойствами.

1) Если обе стороны придерживаются своих оптимальных стратегий, то средний выигрыш равен чистой цене игры v , одновременно являющейся ее нижней и верхней ценой.

2) Если одна из сторон придерживается своей оптимальной стратегии, а другая отклоняется от своей, то от этого отклоняющаяся сторона может только потерять и ни в коем случае не может увеличить свой выигрыш.

Класс игр, имеющих седловую точку, представляет большой интерес как с теоретической, так и с практической точки зрения.

В теории игр доказывается, что, в частности, каждая игра с полной информацией имеет седловую точку, и, следовательно, каждая такая игра имеет решение, т. е. существует пара оптимальных стратегий той и другой стороны, дающая средний выигрыш, равный цене игры. Если игра с полной информацией состоит только из личных ходов, то при применении каждой стороной своей оптимальной стратегии она должна всегда кончаться вполне определенным исходом, а именно, выигрышем, в точности равным цене игры.

Таблица, в которой показаны выплаты каждому участнику при двусторонней игре. Строки таблицы отражают результаты каждого выбора стратегии одним участником, а столбцы – результаты выбора другого. Может существовать одна матрица, показывающая выигрыш каждого игрока, а также альтернативный вариант, когда каждый квадрат в многомерной платежной матрице может содержать два числа, чтобы показать выплаты обоим игрокам. При игре с нулевой суммой выплаты второму игроку будут равны выплатам первому; таким образом, только один ряд необходимо записать подробно.

Конец работы -

Эта тема принадлежит разделу:

Ограничению риска в системе бизнеса носят название риск-менеджмент

Под риском понимают все внутренние и внешние предпосылки которые мо.. гут негативно повлиять на достижение стратегических целей в течение точно.. определенного отрезка времени наблюдения например периода оператив..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Виды рисков. Факторы, влияющие на возникновение рисков
Классификация: А) По характеру последствий: · Чистые (вызывают только убыток-риск пожара или наводнения); · Спекулятивные (могут приносить как убытки, та

Факторы, влияющие на возникновение рисков
Все рискообразующие факторы можно разделить на 2 группы: · внутренние факторы, возникающие в процессе деятельности предприятия; · внешние факторы, суще

Организация процесса управления рисками в организации
Первым этапом организации риск-менеджмента является определение цели риска и цели рисковых вложений капитала. Цель риска – это результат, который необходимо получить. Им может быть

Управление информационными рисками
Работа по минимизации информационных рисков заключается в предупреждении несанкционированного доступа к данным, а также аварий и сбоев оборудования. Для минимизации информационных рисков с

Карта рисков
Карта рисков – простой метод оценки рисков Представители разных отраслей экономики – зачастую задают, как консультантам по управлению рисками вопрос: есть ли простые и наг

Описание структуры карты рисков
На этой карте рисков вероятность или частота отображается по вертикальной оси, а сила воздействия или значимость - по горизонтальной оси. В этом случае вероятность появления риска увеличивае

Построение карты рисков
Производиться как в рамках внедрения системы управления рисками на уровне всей организации, что сложно, а зачастую и невозможно выполнить внутренними силами организации. Д

Основные шаги процесса самостоятельного картографирования рисков
1. первичное обучение 2. определение границ анализа 3. формирование состава команды 4. анализ сценариев и ранжирование 5. определение границы терпимости к риску

Методы управления рисками
Сами по себе методы риск-менеджмента достаточно разнообразны. Это связано с неоднозначностью понятия риска и наличием большого числа критериев их классификации. В следующем разделе

Параметрический метод
Он исходит из предположения о нормальном распределении вероятностей рассматриваемых факторов риска и требует в процессе построения модели расчёта VAR только оценки параметров этого

Моделирование по историческим данным
Метод исторического моделирования (historical simulation) основан на использовании исторических данных по изменениям факторов рыночного риска для получения распределения будущих колебаний стоимости

Метод Монте-Карло
из учебника: Метод Монте-Карло заключается в определении статистических моделей для активов портфеля и их моделировании посредством генерации случайных траекторий. З

Метод анализа сценариев
Метод анализа сценариев изучает эффект изменения капитала портфеля в зависимости от изменения величин рисковых факторов (напр., процентной ставки, волатильности) или параметров модели. Модел

Основные количественные характеристики рисков
Риск, которому подвергается предприятие, - это вероятная угроза разорения или несения таких финансовых потерь, которые могут остановить все дело. Поскольку вероятность неудачи присут

Выбор проектов на основе математического ожидания и среднего квадратического отклонения
Главной целью любого инвестора является получение ожидаемой прибыли от результатов инвестирования. Эта прибыль является ожидаемой в том смысле, что на этапе осуществления инвестирования ее величина

Закон нормального распределения (закон Гаусса)
Нормальное распределение (распределение Гаусса) используется при оценке надежности изделий, на которые воздействует ряд случайных факторов, каждый из которых незначительно влияет на результирующий

Типы математических игр
Кооперативные и некооперативные Игра называется кооперативной, или коалиционной, если игроки могут объединяться в группы, взяв на себя некоторые обязательства перед другими игроками и коор

Чистые стратегии в математической игре

Смешанные стратегии в математической игре
В теории игр страте́гия игрока в игре или деловой ситуации - это полный план действий при всевозможных ситуациях, способных возникнуть. Стратегия определяет действие игрока в любой момент игры

Вопрос №24
Основная теорема теории матричных игр, или теорема о минимаксе. Если – матрица

Вопрос №25
Графический метод применим к тем играм, в которых хотя бы один из игроков имеет две стратегии. Основные этапы нахождения решения игры 2×n или m×2: 1.Строят прямые, соо

Аналитическое решение смешанной игры
Чтобы найти оптимальную смешанную стратегию игрока А: и соответствующую цену игры ν, необходим

Методика мажорирования стратегий
Мажорирование представляет отношение между стратегиями, наличие которого во многих практических случаях дает возможность сократить размеры исходной платежной матрицы игры. Рассмотри

Использование дерева решений
На практике результат одного решения заставляет нас принимать следующее решение и т. д. Когда нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода пре

Функция полезности Неймана-Моргенштерна
Основные определения и аксиомы.Методология рационального принятия решений в условиях неопределенности, основанная на функции полезности индивида, опирается на пять аксиом, которые отражают м

Концепция рисковой стоимости VAR
Одной из основных задач финансовых институтов является оценка рыночных рисков, которые возникают вследствие флуктуации (благоприятном событии) цен акций, сырьевых товаров, обменных курсов, процентн

В зависимости от числа возможных стратегий игры делятся на "конечные" и "бесконечные".

Конечной называется игра, в которой у каждого игрока имеется только конечное число стратегий.

Конечная игра, в которой игрок А имеет m стратегий, а игрок В - n стратегий, называется игрой m´n .

Рассмотрим игру m´n двух игроков А и В ("мы" и "противник").

Будем обозначать наши стратегии A 1 , А 2 ,…, А m ; стратегии противника - B 1 , В 2 ,..., В n .

Пусть каждая сторона выбрала определенную стратегию; для нас это будет А i для противника. В j .

Если игра состоит только из личных ходов, то выбор стратегий A i , В j однозначно определяет исход игры - наш выигрыш. Обозначим его a ij .

Если игра содержит, кроме личных, случайные ходы, то выигрыш при паре стратегий А i , В j есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае естественной оценкой ожидаемого выигрыша является его среднее значение (математическое ожидание). Мы будем обозначать одним и тем же знаком a ij как сам выигрыш (в игре без случайных ходов), так и его среднее значение (в игре со случайными ходами).

Пусть нам известны значения a ij выигрыша (или среднего выигрыша) при каждой паре стратегий. Значения a ij можно записать в виде прямоугольной таблицы (матрицы), строки которой соответствуют нашим стратегиям (A i ), а столбцы - стратегиям противника (В j ). Такая таблица называется платежной матрицей или просто матрицей игры.

Матрица игры (платежная матрица) - таблица, в которой заданы стратегии игроков и платежи.

Матрица игры m´n имеет вид:

А В	B 1	B 2	…	B n
A 1	a 11	a 12	…	a 1 n
A 2	a 21	a 22	…	a 2 n
…	…	…	…	…
A m	a m1	a m2	…	a mn

Сокращенно мы будем обозначать матрицу игры

Рассмотрим несколько элементарных примеров игр.

Пример 1 . Два игрока А и В , не глядя друг на друга, кладут на стол по монете вверх гербом или вверх цифрой, по своему усмотрению. Если игроки выбрали одинаковые стороны (у обоих герб или у обоих цифра), то игрок А забирает обе монеты; иначе их забирает игрок В . Требуется проанализировать игру и составить ее матрицу.

Решение. Игра состоит только из двух ходов: наш ход и ход противника, оба личные. Игра не принадлежит к играм с полной информацией, так как в момент хода выполняющий его игрок не знает, что сделал другой.

Так как у каждого из игроков имеется только один личный ход, то стратегия игрока представляет собой выбор при этом единственном личном ходе.

У нас две стратегии: А 1 - выбирать герб и А 2 - выбирать цифру; у противника такие же две стратегии: В 1 герб и В 2 - цифра. Таким образом, данная игра есть игра 2´2. Будем считать выигрыш монеты за +1 . Матрица игры приведена ниже:

А В	B 1 (Г)	B 2 (Ц)
A 1 (Г)		–1
A 2 (Ц)	–1

На примере этой игры, как она ни элементарна, можно уяснить себе некоторые существенные идеи теории игр.

Предположим сначала, что данная игра выполняется только один раз. Тогда, очевидно, бессмысленно говорить о каких-либо "стратегиях" игроков более разумных, чем другие. Каждый из игроков с одинаковым основанием может принять любое решение. Однако при повторении игры положение меняется.

Действительно, допустим, что мы (игрок А) выбрали себе какую-то стратегию (скажем, А 1 ) и придерживаемся ее. Тогда уже по результатам первых нескольких ходов противник догадается о нашей стратегии и будет на нее отвечать наименее выгодным для нас образом, т.е. выбирать цифру. Нам явно невыгодно всегда применять какую-то одну стратегию; чтобы не оказаться в проигрыше, мы должны иногда выбирать герб, иногда - цифру. Однако, если мы будем чередовать гербы и цифры в какой-то определенной последовательности (например, через один), противник тоже может догадаться об этом иответить на эту стратегию наихудшим для нас образом. Очевидно, надежным способом, гарантирующим, что противник не будет знать нашей стратегии, будет такая организация выбора при каждом ходе, когда мы его сами наперед не знаем (это можно обеспечить, например, подбрасыванием монеты). Таким образом, мы путем интуитивных рассуждений подходим к одному из существенных понятий теории игр - к понятию "смешанной стратегии", т.е. такой, когда "чистые" стратегии - в данном случае А 1 и А 2 -чередуются случайно с определенными частотами. В данном примере из соображений симметрии заранее ясно, что стратегии А 1 и А 2 должны чередоваться с одинаковой частотой; в более сложных играх решение может быть далеко не тривиальным.

Пример 2 . Игроки А и В одновременно и независимо друг от друга записывают каждый одно из трех чисел: 1, 2 или 3.

Если сумма написанных чисел четная, то В платит А эту сумму в тенге; если она нечетная, то, наоборот, А платит В эту сумму. Требуется проанализировать игру и составить ее матрицу.

Решение . Игра состоит из двух ходов; оба - личные. У нас (А ) три стратегии: А 1 - писать 1; А 2 - писать 2; А 3 - писать 3. У противника (В ) - те же три стратегии. Игра представляет собой игру 3´3 с матрицей, приведенной ниже

А В	B 1	B 2	B 3
A 1		–3
A 2	–3		–5
A 3		–5

Очевидно, как и в предыдущем случае, на любую выбранную нами стратегию противник может ответить наихудшим для нас образом. Действительно, если мы выберем, например, стратегию А 1 противник будет всегда отвечать на нее стратегией В 2 ; на стратегию А 2 - стратегией В 3 ; на стратегию А 3 - стратегией В 2 . Таким образом, любой выбор определенной стратегии неизбежно приведет нас к проигрышу.

Пример 3 . В нашем распоряжении имеются три вида вооружения: А 1 , А 2 , А 3 ; у противника - три вида самолетов: B 1 , B 2 , В 3 . Наша задача - поразить самолет; задача противника - сохранить его непораженным. При применении вооружения А 1 самолеты B 1 , B 2 , В 3 поражаются соответственно с вероятностями 0,9, 0,4 и 0,2; при вооружении А 2 - с вероятностями 0,3, 0,6 и 0,8; при вооружении А 3 - с вероятностями 0,5, 0,7 и 0,2. Требуется сформулировать ситуацию в терминах теории игр.

Решение . Ситуация может рассматриваться как игра 3´3 с двумя личными ходами и одним случайным. Наш личный ход - выбор типа вооружения; личный ход противника - выбор самолета для участия в бою. Случайный ход - применение вооружения; этот ход может закончиться поражением или непоражением самолета. Наш выигрыш равен единице, если самолет поражен, и равен нулю в противном случае. Нашими стратегиями являются три варианта вооружения; стратегиями противника - три варианта самолетов. Среднее значение выигрыша при каждой заданной паре стратегий есть не что иное, как вероятность поражения данного самолета данным оружием. Матрица игры приведена ниже:

А В	B 1	B 2	B 3
A 1	0,9	0,4	0,2
A 2	0,3	0,6	0,8
A 3	0,5	0,7	0,2

Оптимальной стратегией игрока в теории игр называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что тоже самое, минимально возможный средний проигрыш). При выборе этой стратегии основой рассуждений является предположение, что противник является по меньшей мере таким же разумным, как и мы сами, и делает все для того, чтобы помешать нам добиться своей цели.

В теории игр все рекомендации вырабатывают, исходя именно из этих принципов; следовательно, в ней не учитываются элементы риска, неизбежно присутствующие в каждой реальной стратегии, а также возможные просчеты и ошибки каждого из игроков.

Теория игр, как и всякая математическая модель сложного явления, имеет свои ограничения. Важнейшим из них является то, что выигрыш искусственно сводится к одному единственному числу. В большинстве практических конфликтных ситуация при выработке разумной стратегии приходится принимать во внимание не один, а несколько численных параметров-критериев успешности мероприятия. Стратегия, являющаяся оптимальной по одному критерию, необязательно будет оптимальной по другим. Однако, сознавая эти ограничения и не придерживаясь слепо рекомендаций, получаемых игровыми методами, можно все же разумно использовать математический аппарат теории игр для выработки если не в точности "оптимальной", то, во всяком случае, "приемлемой" стратегии.

Хотя некоторые модели, используемые в производственном менеджменте, настолько сложны, что без компьютера обойтись невозможно, концепция моделирования проста.

По определению Шеннона: «МОДЕЛЬ - это представление объекта, системы или идеи в некоторой форме, отличной от самой целостности». Схема организации, к примеру, это и есть модель, представляющая ее структуру.

Главной характеристикой модели можно считать упрощение реальной жизненной ситуации, к которой она применяется. Поскольку форма модели менее сложна, а не относящиеся к делу данные, затуманивающие проблему в реальной жизни, устраняются, модель зачастую повышает способность руководителя к пониманию и разрешению встающих перед ним проблем.

Число всевозможных конкретных моделей науки управления почти так же велико, как и число проблем, для разрешения которых они были разработаны.

Практически любой метод принятия решений, используемый в управлении, можно технически рассматривать как разновидность моделирования. В дополнение к моделированию, имеется ряд методов, способных оказать помощь руководителю в поиске объективно обоснованного решения по выбору из нескольких альтернатив той, которая в наибольшей мере способствует достижению целей. К таким относится Платежная матрица.

Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям.

Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

По словам Н. Пола Лумбы: «Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу», как показано в таблице 1.

В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным Мескон Майкл, Альберт Майкл, Хедоури Франклин. Основы менеджмента./ Перевод с английского. - М.:Издательство «Дело», 1997. - http://www.tourlib.columb.net.ua/Lib/meskon.htm.

Таблица 1. Платежная матрица

В целом платежная матрица полезна, когда:

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события. Из предшествующего рассмотрения напомним, что вероятность варьирует от 1, когда событие определенно произойдет, до 0, когда событие определенно не произойдет. Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Если вероятность не была принята в расчет, решение всегда будет соскальзывать в направлении наиболее оптимистических последствий.

Например, если исходить из того, что инвесторы на удачной кинокартине могут иметь 500% на инвестированный капитал, а при вложении в торговую сеть - в самом благоприятном варианте всего 20%, то решение всегда должно быть в пользу кинопроизводства. Однако если взять в расчет, что вероятность большого успеха кинофильма весьма невысока, капиталовложения в магазины становятся более привлекательными, поскольку вероятность получения указанных 20% очень значительна. Если взять более простой пример, то выплаты при ставках в заезде на длинную дистанцию на скачках выше, поскольку выше вероятность, что не выиграешь вообще ничего Мескон Майкл, Альберт Майкл, Хедоури Франклин. Основы менеджмента./ Перевод с английского. - М.:Издательство «Дело», 1997. - http://www.tourlib.columb.net.ua/Lib/meskon.htm.

Вероятность прямо влияет на определение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений, умноженных на соответствующие вероятности.

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может установить, какой выбор наиболее привлекателен при заданных критериях. Он будет, конечно, соответствовать наивысшему ожидаемому значению (Таблица 2).

На основе платежной матрицы З = ||З ji || рассчитывается матрица рисков - =|| ji || . При этом риск ji для варианта деятельности x j и сочетания исходных данных определяется по формуле

Таблица 2. Платежная матрица З = ||З ji ||

Варианты деятельности	Сочетания исходных данных

Платежная матрица рисков служит информационной основой для сопоставления и выбора окончательного (предпочтительного) с точки зрения оптимальности варианта деятельности. Для осуществления такого выбора используются специальные правила принятия решения в условиях неопределенности и риска. К числу таких правил относятся:

1. Критерий Лапласа (минимумы среднеарифметических затрат З j).

2. Критерий Вальда (минимальных затрат или максимальной полезности).

3. Критерий Сэвиджа (минимального риска).

4. Критерий Гурвица.

1. Критерий Лапласа. По принципу недостаточного основания в условиях, когда невозможно выяснить вероятности для возникновения того или иного состояния внешней среды, им сопоставляют равные вероятности, находят средний эффект для каждого из рассматриваемых вариантов решения и выбирается тот из них, где средний эффект максимален:

2. Критерий Вальда (критерий наибольшей осторожности/ пессимиста). Для каждого из рассматриваемых вариантов решения Xi выбирается самая худшая ситуация (наименьшее из Wij) и среди них отыскивается гарантированный максимальный эффект:

3. Критерий Гурвица. Ориентация на самый худший исход является своеобразной перестраховкой, однако опрометчиво выбирать и излишне оптимистичную политику. Критерий Гурвица предлагает некоторый компромисс:

где параметр б принимает значение от 0 до 1 и выступает как коэффициент оптимизма.

К примеру, при б =0 (полный пессимизм) критерий Гурвица превращается в критерий Вальда, при б =0.5 расценивают равновероятно шансы на успех и неудачу, при б =0.2 - более осторожны и вероятность успеха считают меньшей (0.2), чем возможную неудачу.

4. Критерий Сэвиджа. Суть его - нахождение минимального риска. При выборе решения по этому критерию:

Dij = Wij- (Wij)

· матрице функции полезности (эффективности) сопоставляется новая матрица - матрица сожалений, элементы которой отражают убытки от ошибочного действия, т.е. выгоду, упущенную в результате принятия i>-го решения в j-м состоянии;

· по матрице D выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления

Вполне логично, что различные критерии приводят к различным выводам относительно наилучшего решения. Вместе с тем возможность выбора критерия дает свободу менеджерам, принимающим управленческие решения.

Любой критерий должен согласовываться с намерениями решающего задачу и соответствовать его характеру, знаниям и убеждениям М.А.Тынкевич. Экономико-математические методы (исследование операций). - Кемерово: КузГТУ, 2000..

Имеются и другие обобщенные критерии, являющиеся по существу комбинациями выше перечисленных критериев). Однако ни один из них не свободен от условностей и не обеспечивает однозначного выбора варианта деятельности. Поэтому окончательный выбор варианта - задача экспертов и специалистов.