5.1. Основные понятия теории игр

В рассмотренных ранее моделях «соперник» лица принимающего решения, которого мы называли «состоянием природы», никак не реагировал на возможные решения ЛПР, то есть последний был ему совершенно безразличен. Однако часто таким соперником является мыслящий субъект (или их группа), который осознанно выбирает вариант реализации ситуации. В экономике широко распространены ситуации, в которых фигурирует не один, а несколько участников, каждый из которых преследует собственные цели и принимает решения в соответствии с ними. Однако ни один из участников не контролирует ситуацию полностью, и конечный результат его деятельности зависит от решений, принятых другими участниками.

Примером может служить деятельность фирмы в условиях рынка. При определении плана выпуска ей недостаточно знать свои производственные возможности и цены, по которым она сможет реализовать свою продукцию. Чтобы принять обоснованное решение, фирме необходимо учитывать ряд "внешних" факторов: действия других фирм-конкурентов, величину покупательского спроса на ее продукцию и т.п. Все эти факторы неподконтрольны фирме, но оказывают большое влияние на эффективность ее работы. От них во многом зависит, получит она в результате своих действий прибыль или потерпит убытки. Другими примерами таких ситуаций служат отношения между продавцом и покупателем, адвокатом и прокурором, кредитором и дебитором, истцом и ответчиком и т.д. Конфликтные ситуации часто встречаются не только в экономике, но и в политике, военном деле и других сферах общественной жизни.

Ситуация, в которой имеется несколько участников с различными интересами, называется конфликтной ситуацией или конфликтом.

Конфликт имеет следующие характерные черты:

  1. Наличие заинтересованных сторон — участников конфликта. В этом качестве могут выступать потребители, фирмы, страны и т.д.
  2. Все участники конфликта имеют возможность принимать различные решения (выбирать разные объемы выпуска или потребления, определять структуру своего инвестиционного портфеля и т.д.).
  3. Каждый участник имеет собственные интересы (удовлетворение экономических или финансовых потребностей, вытеснение конкурентов с рынка сбыта и т.д.).

Ход событий в конфликте зависит от решений, принимаемых всеми его участниками. Поэтому поведение любого из них должно учитывать возможную реакцию со стороны других участников. Для конфликта характерно то, что ни одна из ее сторон не знает о том, какие решения будут приняты другими сторонами. Однако в тех случаях, когда интересы конфликтующих сторон не являются полностью противоположными, для получения лучших результатов им выгодно обмениваться информацией, договариваться между собой, объединять свои усилия (кооперироваться).

Математические методы анализа конфликтных ситуаций объединяются под названием теории игр.

Первые исследования в этой области математики проводили, изучая обычные игры (шахматы, бридж, покер и пр.), что сказалось на терминологии, используемой в теории игр.

Модель конфликтной ситуации называется игрой, а ее участники — игроками. От реального конфликта игра отличается тем, что ведется по определенным правилам. Они описывают допустимые действия каждого из игроков в той или иной ситуации, объем информации, которую может получить каждый игрок о действиях других игроков, а также возможные итоговые ситуации — исходы.

Необходимо различать абстрактное понятие игры, которое фактически представляет собой совокупность описывающих ее правил и ее конкретные реализации — партии. Партия состоит из последовательности "ходов" каждого из игроков. Ход — это выбор игроком одного из действий, предусмотренных правилами игры.

Ходы могут быть двух типов: личные и случайные. Выбирая личный ход, игрок действует сознательно и сделанный ход зависит только от принятого им решения. Например, любой ход в шахматах является личным. При случайном ходе выбор осуществляется игроком не после анализа возникшей ситуации, а в результате действия какого-либо механизма случайного выбора (бросание монеты или игральной кости).

Некоторые, так называемые "азартные" игры состоят только из случайных ходов (рулетка, игра в кости). Такие игры не изучаются теорией игр. В ней исследуются стратегические игры, в которых есть личные ходы, (возможно, наряду со случайными). Примерами стратегических игр среди обычных игр могут служить шахматы, преферанс, бридж.


Стратегия игрока - совокупность правил, определяющих его выбор в каждой из возможных ситуаций, в которой он должен сделать свой личный ход.

Стратегией игрока называется совокупность правил, определяющих его выбор в каждой из возможных ситуаций, в которой он должен сделать свой личный ход. Иными словами, игрок уже перед началом партии знает, какой ход он будет делать в любой ситуации (выбрал стратегию своего поведения).

Правила игры должны указывать, каким будет исход любой партии для каждого игрока, т.е. после окончания партии должны быть определены выигрыши (платежи) всех игроков. Обычно для каждого игрока считается известной его функция выигрыша или платежная функция, значение которой принимается за выигрыш игрока после завершения партии. Количественная оценка результатов игры называется выигрышем или платежом.

Одним из распространенных способов задания игры является указание множества игроков, а также описание множеств их стратегий и функций выигрыша. Игра, заданная таким способом, называется игрой в нормальной форме. В такой игре каждый игрок делает только один ход: выбирает некоторую стратегию. После того как все игроки выбрали свои стратегии, партия считается сыгранной, и каждый игрок получает причитающийся ему выигрыш.

Оптимальной стратегией игрока называется такая стратегия, которая обеспечивает ему в игре наилучший результат, т.е. максимальный выигрыш. Если играется серия партий, то оптимальная стратегия должна обеспечивать максимальный средний выигрыш.

Основная задача теории игр — определить оптимальные стратегии игроков в различных классах игр. При этом предполагается, что все игроки, стремясь достичь своих целей, действуют рационально и при выборе стратегий стремятся учесть возможные ответы своих противников. Эта гипотеза о рациональном поведении игроков является ключевой в теории игр.



5.2. Классификация игр

  1. По возможности образования коалиций.
  2. Если правила игры разрешают объединение группы участников (образование коалиции) для получения ими лучших результатов по сравнению с теми, которых они добились бы, действуя самостоятельно, то такая игра называется кооперативной. В противном случае игра называется бескоалиционной или некооперативной.
  3. По количеству стратегий.
  4. В зависимости от числа стратегий игры делятся на "конечные" и "бесконечные". Игра называется конечной, если у каждого игрока имеется в распоряжении конечное число стратегий, и бесконечной — в противном случае. 3. По числу игроков. В зависимости от числа участников игры они делятся на игры с двумя, тремя и более игроками.
  5. По свойствам функций выигрыша.
  6. Игра называется игрой с нулевой суммой, если в любой партии сумма выигрышей всех игроков равна нулю, т.е. каждый игрок может выиграть лишь за счет проигрыша других игроков. Если это условие не выполнено, то такая игра называется игрой с ненулевой суммой.
  7. По количеству ходов
  8. По этому признаку игры делятся на одноходовые, в которых партия заканчивается после того как каждый игрок сделал свой ход, и многоходовые, в которых выигрыш распределяется после нескольких ходов.


5.3. Представление антагонистической игры в виде платежной матрицы

Самым простым является случай, когда число игроков равно двум. Такая игра называется игрой двух лиц или парной. В парной игре с нулевой суммой выигрыш одного игрока всегда равен проигрышу второго. Такая игра называется антагонистической. В ней интересы участников полностью противоположны. Будем считать, что игра является конечной, т.е. каждый из игроков имеет конечное множество стратегий. Любую конечную антагонистическую игру можно привести к наиболее удобной для анализа матричной форме.

Рассмотрим конечную антагонистическую игру. Будем считать, что число стратегий первого игрока A равно m, а число стратегий второго игрока В равно n. Обозначим= {А1, А2,…, Аm} — множество стратегий игрока A, а = {B1, B2,… , Bn} — множество стратегий игрока B. Эти стратегии называют чистыми.

Партия в такой игре сводится к тому, что игроки выбирают свои стратегии, а затем подсчитываются их выигрыши. Отметим, что, выбирая свою стратегию, ни один из игроков точно не знает, какой выбор сделает его противник, хотя и может делать гипотезы относительно его поведения.

Обозначим Н(х, у) — выигрыш игрока А, если он выбрал стратегию х, а игрок В — стратегию у. Отметим, что понятие выигрыша в данном случае условно, так как если Н(х, у) < 0, то выигрыш игрока А на самом деле является его проигрышем, а проигрыш игрока В — его выигрышем.

Таким образом, на множестве всех пар (х, у), где определена функция Н, которая называется функцией выигрыша игрока А или просто функцией выигрыша.

Так как игра является антагонистической, то выигрыш игрока В составит величину -Н(х, у) или, что то же самое, его проигрыш будет равен Н(х, у). Ясно, что игроку А выгодно, чтобы значение Н(х, у) было как можно больше, а игрок В хочет сделать его как можно меньше. Таким образом, при выборе своих стратегий оба игрока имеют дело с одной и той же функцией Н, но игрок А стремится ее максимизировать, а игрок В — минимизировать.

Обозначим аij = Н(Ai, Bj) — выигрыш игрока А (проигрыш игрока В), если он использует стратегию Аi, а второй игрок — стратегию Bj. Тогда можно определить матрицу А размерности mxn, которая называется матрицей выигрышей или платежной матрицей.

В этой матрице строка с номером i соответствует стратегии Аi игрока А и содержит значения его выигрышей в зависимости от ответа игрока В. Столбец с номером j соответствует стратегии Вj игрока В и содержит его проигрыши в зависимости от ответа игрока А.

Если такая матрица составлена, то говорят, что игра приведена к матричной форме. К этой форме можно привести любую конечную антагонистическую игру. Поэтому такие игры называют матричными.

В дальнейшем мы обычно будем представлять стратегии игроков в платежной матрице в явном виде. Тогда она будет выглядеть так:

В1

В2

Вn

A1

a11

a12

a1n

A2

a21

a22

a2n

...

...

...

...

Am

am1

am2

amn

После приведения игры к матричной форме партия состоит в выборе игроком А строки, а игроком В — столбца этой матрицы. Выигрыш игрока А и, соответственно, проигрыш игрока В равен элементу, находящемуся на их пересечении.



5.4. Примеры матричных игр

Рассмотрим несколько конфликтных ситуаций, моделями которых являются матричные игры.

Пример 5.1 Две фирмы конкурируют на рынке. Первая фирма (игрок А) выпускает три вида продукции, а вторая фирма (игрок В) — четыре вида продукции. Каждая из них хотела бы продавать на рынке один из своих товаров. Однако их конкурентоспособность различна и в зависимости от того, какой товар будет продавать ее конкурент, это может привести как к получению прибыли, так и к убыткам. Предположим, что величина прибыли фирмы всегда равна убыткам ее конкурента, т.е. суммарная прибыль обеих фирм всегда равна нулю. Тогда описанную ситуацию можно смоделировать как антагонистическую игру. Будем считать, что выигрыш игрока (фирмы) равен размеру полученной им прибыли и известна матрица А = (аij) выигрышей первой фирмы в зависимости от ситуации, сложившейся на рынке.

В i-й строке этой матрицы находятся размеры аij прибыли (млн. руб.), которую получит первая фирма при продаже i-го товара, если вторая фирма будет представлена на рынке j-м товаром. Отрицательная величина аij говорит о том, что в данной ситуации первая фирма терпит убытки, а прибыль получает вторая фирма.

Игрок А (первая фирма) имеет три чистых стратегии {А1, А2, А3}, где Аi — продажа на рынке i-го вида продукции, соответствующие строкам матрицы А. Игрок В (вторая фирма) имеет четыре чистых стратегии {В1, В2, В3, В4}, где Bj — продажа на рынке j-го вида продукции, которые соответствуют столбцам матрицы А. Нужно определить оптимальную стратегию каждой из фирм.

Пример 5.2 Игроки одновременно показывают друг другу по одной монете. Если их выборы совпадают, т.е. оба игрока показывают "орел" или "решку", то игрок А выигрывает единицу. В противном случае такую же величину выигрывает игрок В. Предполагается, что игра повторяется несколько раз. Нужно определить, какой тактики должен придерживаться каждый игрок, чтобы максимизировать свой средний выигрыш.

В этой игре игрок А имеет только два возможных хода: показать "орел" (А1) или показать "решку" (А2). Они являются его чистыми стратегиями. Такие же чистые стратегии (В1 — "орел" и В2 — "решка") имеет и игрок В. Матрица этой игры имеет такой вид:

Игрок А выбирает строку, а игрок В — столбец матрицы А. Пусть, например, игрок А выбрал первую строку: показал "орел". Тогда, если игрок В выбрал первый столбец ("орел"), то игрок 1 выигрывает величину а11 = 1, а игрок 2 проигрывает эту величину.

Если же игрок В выбрал второй столбец ("решка"), то игрок 1 выигрывает величину а12 = -1, т.е. проигрывает первый игрок, а игрок В выигрывает 1. Аналогично определяется результат партии, если игрок А выберет вторую строку.

Контрольные вопросы

  1. Что такое конфликтная ситуация? Приведите пример.
  2. Что является математической моделью конфликтной ситуации?
  3. Какова основная задача теории игр?
  4. Что такое оптимальная стратегия игрока?
  5. Что такое функция выигрыша игрока?
  6. Какие способы задания игры вы знаете?
  7. По каким признакам классифицируют игры?
  8. Какими свойствами должна обладать игра, чтобы она считалась матричной?
  9. Приведите пример конфликтной ситуации, которую можно задать моделью матричной игры.