3.4.1. Основные понятия теории игр

В настоящее время многие решения проблем в производственной,экономической или коммерческой деятельности зависят от субъективных качеств лица, принимающего решение. При выборе решений в условиях неопределенности всегда неизбежен элемент произвола, а следовательно, и риска.

Задачами о принятии решений в условиях полной или частичной неопределенности занимается теория игр и статистических решений. Неопределенность может принимать форму противодействия другой стороны, которая преследует противоположные цели, препятствует теми или другими действиями или состояниями внешней среды. В таких случаях приходится учитывать возможные варианты поведения противоположной стороны.

Возможные варианты поведения обеих сторон и их исходов для каждого сочетания альтернатив и состояний можно представить в виде математической модели, которая называется игрой. Обе стороны конфликта не могут точно предсказать взаимные действия. Несмотря на такую неопределенность, принимать решения приходится каждой стороне конфликта.

Теория игр - это математическая теория конфликтных ситуаций. Основными ограничениями этой теории являются предположение о полной ("идеальной") разумности противника и принятие при разрешении конфликта наиболее осторожного " перестраховочного" решения.

Конфликтующие стороны называются игроками , одна реализация игры – партией, исход игры – выигрышем или проигрышем.

Ходом в теории игр называется выбор одного из предусмотренных правилами действия и его реализацию.

Личным ходом называют сознательный выбор игроком одного из возможных вариантов действия и его осуществление.

Случайным ходом называют выбор игроком, осуществляемый не волевым решением игрока, а каким либо механизмом случайного выбора (бросание монеты, сдача карт и т.п.) одного из возможных вариантов действия и его осуществление.

Стратегией игрока называется совокупность правил, определяющих выбор варианта действия при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в процессе игры

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры, содержащей личные и случайные ходы, обеспечивает игроку максимально возможный средний выигрыш (или, что то же самое, минимально возможный средний проигрыш).

В зависимости от причин, вызывающих неопределенность исходов, игры можно разделить на следующие основные группы:

- Комбинаторные игры, в которых правила в принципе дают возможность каждому игроку проанализировать все разнообразные варианты поведения и, сравнив эти варианты выбрать из них наилучший. Неопределенность здесь состоит в слишком большом количестве вариантов, которые надо проанализировать.

- Азартные игры, в которых исход оказывается неопределенным в силу влияния случайных факторов.

- Стратегические игры, в которых неопределенность исхода вызвана тем, что каждый из игроков, принимая решение, не знает, какой стратегии будут придерживаться другие участники игры, так как отсутствует информация о последующих действиях противника (партнера).

- Игра называется парной , если в игре участвуют два игрока.

- Игра называется множественной , если в игре участвуют больше двух игроков.

- Игра называется с нулевой суммой , если каждый игрок выигрывает за счет других, а сумма выигрыша и проигрыша одной стороны равны другой.

- Парная игра с нулевой суммой называется антагонистической игрой.

- Игра называется конечной , если у каждого игрока имеется только конечное число стратегий. В противном случае - игра бесконечная.

- Одношаговые игры, когда игрок выбирает одну из стратегий и делает один ход.

- В многошаговых играх игроки для достижения своих целей делают ряд ходов, которые могут ограничиваться правилами игры или могут продолжаться до тех пор, пока у одного из игроков не останется ресурсов для продолжения игры.

- Деловые игры имитируют организационно-экономические взаимодействия в различных организациях и предприятиях. Преимущества игровой имитации перед реальным объектом таковы:

Наглядность последействий принимаемых решений;

Переменный масштаб времени;

Повторение имеющегося опыта с изменением установок;

Переменный охват явлений и объектов.

Элементами игровой модели являются:

- Участники игры.

- Правила игры.

- Информационный массив, отражающий состояние и движение моделируемой системы.

Проведение классификации и группировки игр позволяет для однотипных игр найти общие методы поиска альтернатив в принятии решения, выработать рекомендации по наиболее рациональному образу действий в ходе развития конфликтных ситуаций в различных сферах деятельности.

3.4.2. Постановка игровых задач

Рассмотрим конечную парную игру с нулевой суммой. Игрок А имеет m стратегий (А 1 А 2 А m), а игрок В – n стратегий (В 1 , В 2 Вn). Такая игра называется игрой размерностью m х n. Пусть а ij - выигрыш игрока А в ситуации, когда игрок А выбрал стратегию А i , а игрок В выбрал стратегию В j . Выигрыш игрока в данной ситуации обозначим b ij . Игра с нулевой суммой, следовательно, а ij = - b ij . Для проведения анализа достаточно знать выигрыш только одного из игроков, допустим А.

Если игра состоит только из личных ходов, то выбор стратегии (А i , В j),однозначно определяет исход игры. Если игра содержит также случайные ходы, то ожидаемый выигрыш – это среднее значение (математическое ожидание).

Предположим, что значения а ij известны для каждой пары стратегий(А i , В j). Составим прямоугольную таблицу, строки которой соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В. Эта таблица называется платежной матрицей .

Цель игрока А максимизировать свой выигрыш, а цель игрока В минимизировать свой проигрыш.

Таким образом, платежная матрица имеет вид:

Задача состоит в определении:

1) Наилучшей (оптимальной) стратегии игрока А из стратегий А 1 А 2 А m ;

2) Наилучшей (оптимальной) стратегии игрока В из стратегий В 1 , В 2 Вn.

Для решения задачи применяется принцип, согласно которому участники игры одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.

3.4.3. Методы решения игровых задач

Принцип минимакса

Проанализируем последовательно каждую стратегию игрока А. Если игрок А выбирает стратегию А 1 , то игрок В может выбрать такую стратегию В j , при которой выигрыш игрока А будет равен наименьшему из чисел a 1j . Обозначим его a 1:

то есть a 1 – минимальное значение из всех чисел первой строки.

Это можно распространить на все строки. Поэтому игрок А должен выбрать ту стратегию, для которой число a i - максимально.

Величина a - гарантированный выигрыш, который может обеспечить себе игрок а при любом поведении игрока В. Величина a называется нижней ценой игры.

Игрок В заинтересован в том, чтобы уменьшить свой проигрыш, то есть обратить выигрыш игрока А в минимум. Для выбора оптимальной стратегии он должен найти максимальное значение выигрыша в каждом столбце и среди них выбрать наименьшее.

Обозначим через b j максимальное значение в каждом столбце:

Наименьшее значение b j обозначим b.

b = min max a ij

b называется верхней границей игры. Принцип, диктующий игрокам выбор игрокам соответствующих стратегий, называется принципом минимакса.

Существуют матричные игры, для которых нижняя цена игры равна верхней, такие игры называются играми с седловой точкой. В этом случае g=a=b называется чистой ценой игры, а стратегии А * i , В * j , позволяющие достичь этого значения - оптимальными. Пара (А * i , В * j)называется седловой точкой матрицы, так как элемент a ij .= g одновременно является минимальным в i-строке и максимальным в j- столбце. Оптимальные стратегии А * i , В * j , и чистая цена являются решением игры в чистых стратегиях, т. е. без привлечения механизма случайного выбора.

Пример 1.

Пусть дана платежная матрица. Найти решение игры, т. е. определить нижнюю и верхнюю цены игры и минимаксные стратегии.

Здесь a 1 =min a 1 j =min(5,3,8,2) =2

a =max min a ij = max(2,1,4) =4

b = min max a ij =min(9,6,8,7) =6

таким образом, нижней цене игры (a=4) соответствует стратегия А 3 .Выбирая эту стратегию, игрок А достигнет выигрыша не менее 4 при любом поведении игрока В. Верхней цене игры (b=6) соответствует стратегия игрока В. Эти стратегии являются минимаксными. Если обе стороны будут придерживаться этих стратегий, выигрыш будет равен 4 (a 33).

Пример 2.

Дана платежная матрица. Найти нижнюю и верхнюю цены игры.

a =max min a ij = max(1,2,3) =3

b = min max a ij =min(5,6,3) =3

Следовательно, a =b=g=3. Седловой точкой является пара (А * 3 , В * 3). Если матричная игра содержит седловую точку, то ее решение находится по принципу минимакса.

Решение игр в смешанных стратегиях

Если платежная матрица не содержит седловой точки (aсмешанной стратегией .

Для применения смешанных стратегий требуются следующие условия:

1) В игре отсутствует седловая точка.

2) Игроками используется случайная смесь чистых стратегий с соответствующими вероятностями.

3) Игра многократно повторяется в одних и тех же условиях.

4) При каждом из ходов игрок не информирован о выборе стратегии другим игроком.

5) Допускается усреднение результатов игр.

В теории игр доказано, что любая парная игра с нулевой суммой имеет по крайней мере одно решение в смешанных стратегиях, отсюда следует, что каждая конечная игра имеет цену g. g - средний выигрыш, приходящийся на одну партию, удовлетворяющий условию a<=g<=b . Оптимальное решение игры в смешанных стратегиях обладает следующим свойством: каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии.

Стратегии игроков в их оптимальных смешанных стратегиях называются активными.

Теорема об активных стратегиях.

Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш(или минимальный средний проигрыш), равный цене игры g, независимо от того, какие действия предпринимает другой игрок, если он только не выходит за пределы своих активных стратегий.

Введем обозначения:

Р 1 Р 2 … Р m - вероятности использования игроком А стратегий А 1 А 2 ….. А m ;

Q 1 Q 2 …Q n вероятности использования игроком В стратегий В 1 , В 2….. Вn

Смешанную стратегию игрока А запишем в виде:

А 1 А 2 …. А m

Р 1 Р 2 … Р m

Смешанную стратегию игрока B запишем в виде:

B 1 B 2 …. B n

Зная платежную матрицу А, можно определить средний выигрыш (математическое ожидание) М(А,P,Q):

М(А,P,Q)=S Sa ij Р i Q j

Средний выигрыш игрока А:

a =max minМ(А,P,Q)

Средний проигрыш игрока В:

b = min maxМ(А,P,Q)

Обозначим через Р А * и Q В * векторы, соответствующие оптимальным смешанным стратегиям, при которых выполняется:

max minМ(А,P,Q) = min maxМ(А,P,Q)= М(А,P А * ,Q В *)

При этом выполняется условие:

maxМ(А,P,Q В *) <=maxМ(А,P А * ,Q В *)<= maxМ(А,P А * ,Q)

Решить игру – это означает найти цену игры и оптимальные стратегии.

Геометрический метод определения цены игры и оптимальных стратегий

(Для игры 2Х2)

На оси абсцисс откладывается отрезок длиной 1.Левый конец этого отрезка соответствует стратегии А 1 , правый – стратегии А 2 .

По оси ординат откладываются выигрыши а 11 и а 12 .

По линии, параллельной оси ординат из точки 1 откладываются выигрыши а 21 и а 22 .

Если игрок В применяет стратегию В 1 , то соединяем точки а 11 и а 21 , если – В 2, то – а 12 и а 22 .

Средний выигрыш изображается точкой N, точка пересечения прямых В 1 В 1 и В 2 В 2 .Абсцисса этой точки равна Р 2 , а ордината цене игры - g.

По сравнению с прежней технологией выигрыш составляет 55%.

Возникшая в сороковых годах XX века математическая теория игр чаще всего применяется именно в экономике. Но как с помощью концепции игр смоделировать поведение людей в обществе? Зачем экономисты изучают, в какой угол чаще бьют пенальти футболисты, и как выиграть в «Камень, ножницы, бумагу» в своей лекции рассказал старший преподаватель кафедры микроэкономического анализа ВШЭ Данил Федоровых.

Джон Нэш и блондинка в баре

Игра - это любая ситуация, в которой прибыль агента зависит не только от его собственных действий, но и от поведения остальных участников. Если вы раскладываете дома пасьянс, с точки зрения экономиста и теории игр, это не игра. Она подразумевает обязательное наличие столкновения интересов.

В фильме «Игры разума» о Джоне Нэше, нобелевском лауреате по экономике, есть сцена с блондинкой в баре. В ней показана идея, за которую ученый и получил премию, - это идея равновесия по Нэшу, которое он сам называл управляющей динамикой.

Игра - любая ситуация, в которой выигрыши агентов зависят друг от друга.

Стратегия - описание действий игрока во всех возможных ситуациях.

Исход - комбинация выбранных стратегий.

Итак, с точки зрения теории, игроками в этой ситуации являются только мужчины, то есть те, кто принимает решение. Их предпочтения просты: блондинка лучше брюнетки, а брюнетка лучше, чем ничего. Действовать можно двумя способами: пойти к блондинке или к «своей» брюнетке. Игра состоит из единственного хода, решения принимаются одновременно (то есть нельзя посмотреть, куда пошли остальные, и после походить самому). Если какая-то девушка отвергает мужчину, игра заканчивается: невозможно вернуться к ней или выбрать другую.

Каков вероятный финал этой игровой ситуации? То есть какова ее устойчивая конфигурация, из которой все поймут, что сделали лучший выбор? Во-первых, как правильно замечает Нэш, если все пойдут к блондинке, ничем хорошим это не кончится. Поэтому дальше ученый предполагает, что всем нужно пойти к брюнеткам. Но тогда, если известно, что все пойдут к брюнеткам, ему следует идти к блондинке, ведь она лучше.

В этом и заключается настоящее равновесие - исход, в котором один идет к блондинке, а остальные - к брюнеткам. Может показаться, что это несправедливо. Но в ситуации равновесия никто не может пожалеть о своем выборе: те, кто пойдут к брюнеткам, понимают, что от блондинки они все равно ничего б не получили. Таким образом, равновесие по Нэшу - это конфигурация, при которой никто по отдельности не хочет менять выбранную всеми стратегию. То есть, рефлексируя в конце игры, каждый участник понимает, что даже зная, как походят другие, он сделал бы то же самое. По-другому можно назвать это исходом, где каждый участник оптимальным образом отвечает на действия остальных.

«Камень, ножницы, бумага»

Рассмотрим другие игры на предмет равновесия. Например, в «Камне, ножницах, бумаге» нет равновесия по Нэшу: во всех ее вероятных исходах нет варианта, в котором оба участника были бы довольны своим выбором. Тем не менее, существует Чемпионат мира и World Rock Paper Scissors Society, собирающее игровую статистику. Очевидно, что вы можете повысить свои шансы на победу, если будете что-то знать об обычном поведении людей в этой игре.

Чистая стратегия в игре - это такая стратегия, при которой человек всегда играет одинаково, выбирая одни и те же ходы.

По данным World RPS Society, камень является самым часто выбираемым ходом (37,8%). Бумагу ставят 32,6%, ножницы - 29,6%. Теперь вы знаете, что нужно выбирать бумагу. Однако, если вы играете с тем, кто тоже это знает, вам уже не надо выбирать бумагу, потому что от вас ожидается то же самое. Есть знаменитый случай: в 2005 году два аукционных дома Sotheby“s и Christie”s решали, кому достанется очень крупный лот - коллекция Пикассо и Ван Гога со стартовой ценой в 20 миллионов долларов. Собственник предложил им сыграть в «Камень, ножницы, бумагу», и представители домов отправили ему свои варианты по электронной почте. Sotheby“s, как они позже рассказали, особо не задумываясь, выбрали бумагу. Выиграл Christie”s. Принимая решение, они обратились к эксперту - 11-летней дочери одного из топ-менеджеров. Она сказала: «Камень кажется самым сильным, поэтому большинство людей его выбирают. Но если мы играем не с совсем глупым новичком, он камень не выбросит, будет ожидать, что это сделаем мы, и сам выбросит бумагу. Но мы будем думать на ход вперед, и выбросим ножницы».

Таким образом, вы можете думать на ход вперед, но это не обязательно приведет вас к победе, ведь вы можете не знать о компетенции вашего соперника. Поэтому иногда вместо чистых стратегий правильнее выбирать смешанные, то есть принимать решения случайно. Так, в «Камне, ножницах, бумаге» равновесие, которое мы до этого не нашли, находится как раз в смешанных стратегиях: выбирать каждый из трех вариантов хода с вероятностью в одну третью. Если вы будете выбирать камень чаще, соперник скорректирует свой выбор. Зная это, вы скорректируете свой, и равновесия не выйдет. Но никто из вас не начнет менять поведение, если каждый просто будет выбирать камень, ножницы или бумагу с одинаковой вероятностью. Все потому что в смешанных стратегиях по предыдущим действиям невозможно предугадать ваш следующий ход.

Смешанные стратегии и спорт

Более серьезных примеров смешанных стратегий очень много. Например, куда подавать в теннисе или бить/принимать пенальти в футболе. Если вы ничего не знаете о вашем сопернике или просто постоянно играете против разных, лучшей стратегией будет поступать более-менее случайно. Профессор Лондонской школы экономики Игнасио Паласиос-Уэрта в 2003 году опубликовал в American Economic Review работу, суть которой заключалась в поиске равновесия по Нэшу в смешанных стратегиях. Предметом исследования Паласиос-Уэрта выбрал футбол и в связи с этим просмотрел более 1400 ударов пенальти. Разумеется, в спорте все устроено хитрее, чем в «Камне, ножницах, бумаге»: там учитывается сильная нога спортсмена, попадания в разные углы при ударе со всей силы и тому подобное. Равновесие по Нэшу здесь заключается в расчете вариантов, то есть, к примеру, определении углов ворот, в которые надо бить, чтобы выиграть с большей вероятностью, зная свои слабые и сильные стороны. Статистика по каждому футболисту и найденное в ней равновесие в смешанных стратегиях, показало, что футболисты поступают примерно так, как предсказывают экономисты. Вряд ли стоит утверждать, что люди, которые бьют пенальти, читали учебники по теории игр и занимались довольно непростой математикой. Скорее всего, есть разные способы научиться оптимально себя вести: можно быть гениальным футболистом, и чувствовать, что делать, а можно - экономистом, и искать равновесие в смешанных стратегиях.

В 2008 году профессор Игнасио Паласиос-Уэрта познакомился с Авраамом Грантом, тренером «Челси», который играл тогда в финале Лиги чемпионов в Москве. Ученый написал записку тренеру с рекомендациями по серии пенальти, которые касались поведения вратаря соперника - Эдвина ван дер Сара из «Манчестер Юнайтед». Например, по статистике, он почти всегда отбивал удары на среднем уровне и чаще бросался в естественную для пробивающего пенальти сторону. Как мы определили выше, правильнее все-таки рандомизировать свое поведение с учетом знаний о сопернике. Когда счет по пенальти был уже 6:5, Николя Анелька, нападающий «Челси», должен был забивать. Показывая перед ударом в правый угол, ван дер Сар будто спросил у Анелька, не собирается ли он бить туда.

Суть в том, что все предыдущие удары «Челси» были нанесены именно в правый от пробивающего угол. Мы не знаем точно почему, может быть, из-за консультации экономиста бить в неестественную для них сторону, ведь по статистике к этому менее готов ван дер Сар. Большинство футболистов «Челси» были правшами: ударяя в неестественный для себя правый угол, все они, кроме Терри, забивали. Видимо, стратегия была в том, чтобы Анелька пробил туда же. Но ван дер Сар, похоже, это понял. Он поступил гениально: показал в левый угол дескать «туда собрался бить?», от чего Анелька, наверное, пришел в ужас, ведь его разгадали. В последний момент он принял решение действовать по-другому, ударил в естественную для себя сторону, что и было нужно ван дер Сару, который взял этот удар и обеспечил «Манчестеру» победу. Эта ситуация учит случайному выбору, ведь в ином случае ваше решение может быть просчитано, и вы проиграете.

«Дилемма заключенного»

Наверное, самая известная игра, с которой начинаются университетские курсы о теории игр, - это «Дилемма заключенного». По легенде двух подозреваемых в серьезном преступлении поймали и заперли в разные камеры. Есть доказательство, что они хранили оружие, и это позволяет посадить их на какой-то небольшой срок. Однако доказательств, что они совершили это страшное преступление, нет. Каждому по отдельности следователь рассказывает об условиях игры. Если оба преступника сознаются, оба же сядут на три года. Если сознается один, а подельник будет молчать, сознавшийся выйдет сразу, а второго посадят на пять лет. Если, наоборот, первый не сознается, а второй его сдаст, первый сядет на пять лет, а второй выйдет сразу. Если же не сознается никто, оба сядут на год за хранение оружия.

Равновесие по Нэшу здесь заключается в первой комбинации, когда оба подозреваемых не молчат и оба садятся на три года. Рассуждения каждого таковы: «если я буду говорить, я сяду на три года, если молчать - на пять лет. Если второй будет молчать, мне тоже лучше говорить: не сесть лучше, чем сесть на год». Это доминирующая стратегия: говорить выгодно, независимо от того, что делает другой. Однако в ней есть проблема - наличие варианта получше, ведь сесть на три года хуже, чем сесть на год (если рассматривать историю только с точки зрения участников и не учитывать вопросы морали). Но сесть на год невозможно, ведь, как мы поняли выше, молчать обоим преступникам невыгодно.

Улучшение по Парето

Есть известная метафора про невидимую руку рынка, принадлежащая Адаму Смиту. Он говорил, что если мясник будет сам для себя стараться заработать деньги, от этого будет лучше всем: он сделает вкусное мясо, которое купит булочник на деньги от продажи булок, которые он, в свою очередь, тоже должен будет делать вкусными, чтобы они продавались. Но оказывается, эта невидимая рука не всегда работает, и таких ситуаций, когда каждый действует за себя, а всем плохо, очень много.

Поэтому иногда экономисты и специалисты по теории игр думают не об оптимальном поведении каждого игрока, то есть не о равновесии по Нэшу, а об исходе, при котором будет лучше всему обществу (в «Дилемме» общество состоит из двух преступников). С этой точки зрения, исход эффективен, когда в нем нет улучшения по Парето, то есть невозможно сделать кому-то лучше, не сделав при этом хуже другим. Если люди просто меняются товарами и услугами, это Парето-улучшение: они делают это добровольно, и вряд ли кому-то от этого плохо. Но иногда, если просто дать людям взаимодействовать и даже не вмешиваться, то, к чему они придут, не будет оптимальным по Парето. Это и происходит в «Дилемме заключенного». В ней, если мы даем каждому действовать так, как им выгодно, оказывается, что всем от этого плохо. Всем было бы лучше, если бы каждый действовал не оптимально для себя, то есть молчал.

Трагедия общины

«Дилемма заключенного» - это игрушечная стилизованная история. Вряд ли вы ожидаете оказаться в подобной ситуации, но похожие эффекты есть везде вокруг нас. Рассмотрим «Дилемму» с большим количеством игроков, ее иногда называют трагедией общины. Например, на дорогах - пробки, и я решаю, как ехать на работу: на машине или на автобусе. Это же делают остальные. Если я поеду на машине, и все решат сделать то же самое, будет пробка, но мы доедем с комфортом. Если я поеду на автобусе, пробка-то все равно будет, но ехать я буду некомфортно и не особо быстрее, поэтому такой исход еще хуже. Если же в среднем все ездят на автобусе, то я, сделав то же самое, довольно быстро доеду без пробки. Но если при таких условиях поехать на машине, я тоже доеду быстро, но еще и с комфортом. Итак, наличие пробки не зависит от моих действий. Равновесие по Нэшу здесь - в ситуации, когда все выбирают ехать на машине. Что бы не делали остальные, мне лучше выбрать машину, потому что будет там пробка или нет, неизвестно, но я в любом случае доеду с комфортом. Это доминирующая стратегия, поэтому в итоге все едут на машине, и мы имеем то, что имеем. Задача государства - сделать поездку на автобусе лучшим вариантом хотя бы для некоторых, поэтому появляются платные въезды в центр, парковки и так далее.

Другая классическая история - рациональное незнание избирателя. Представьте, что вы не знаете исход выборов заранее. Вы можете изучить программу всех кандидатов, послушать дебаты и после проголосовать за самого лучшего. Вторая стратегия - прийти на участок и проголосовать как попало или за того, кого чаще показывали по телевизору. Какое поведение оптимально, если от моего голоса никогда не зависит, кто выиграет (а в 140-миллионной стране один голос никогда ничего не решит)? Конечно, я хочу, чтобы в стране был хороший президент, но я же знаю, что никто больше не будет изучать программы кандидатов внимательно. Поэтому не тратить на это время - доминирующая стратегия поведения.

Когда вас призывают прийти на субботник, ни от кого в отдельности не будет зависеть, станет двор чистым или нет: если я выйду один, я не смогу убрать все, или, если выйдут все, то не выйду я, потому что все и без меня уберут. Другой пример - перевозка грузов в Китае, о котором я узнал в замечательной книге Стивена Ландсбурга «Экономист на диване». 100-150 лет назад в Китае был распространен способ перевозки грузов: все складывалось в большой кузов, который тащили семь человек. Заказчики платили, если груз доставлялся вовремя. Представьте, что вы - один из этих шести. Вы можете прилагать усилия, и тянуть изо всех сил, и если все будут так делать, груз доедет вовремя. Если кто-нибудь один так делать не будет, все тоже доедут вовремя. Каждый думает: «Если все остальные тянут как следует, зачем это делать мне, а если все остальные тянут не со всей силы, то я ничего не смогу изменить». В итоге, со временем доставки все было очень плохо, и сами грузчики нашли выход: они стали нанимать седьмого и платить ему деньги за то, чтобы он стегал лентяев плетью. Само наличие такого человека заставляло всех работать изо всех сил, потому что иначе все попадали в плохое равновесие, из которого никому в отдельности с выгодой не выйти.

Такой же пример можно наблюдать в природе. Дерево, растущее в саду, отличается от того, что растет в лесу, своей кроной. В первом случае она окружает весь ствол, во втором - находится только вверху. В лесу это является равновесием по Нэшу. Если бы все деревья договорились и выросли одинаково, они бы поровну распределили количество фотонов, и всем было бы лучше. Но никому в отдельности так делать невыгодно. Поэтому каждое дерево хочет вырасти немного выше окружающих.

Сommitment device

Во многих ситуациях одному из участников игры может понадобиться инструмент, который убедит остальных, что тот не блефует. Он называется commitment device. Например, закон некоторых стран запрещает платить выкуп похитителям людей, чтобы снизить мотивацию преступников. Однако это законодательство часто не работает. Если вашего родственника захватили, и у вас есть возможность спасти его, обойдя закон, вы это сделаете. Представим ситуацию, что закон можно обойти, но родственники оказались бедными и выкуп им платить нечем. У преступника в этой ситуации два пути: отпустить или убить жертву. Убивать он не любит, но тюрьму он не любит больше. Отпущенный пострадавший, в свою очередь, может либо дать показания, чтобы похититель был наказан, либо молчать. Самый лучший исход для преступника: отпустить жертву, которая его не сдаст. Жертва же хочет быть отпущенной и дать показания.

Равновесие здесь в том, что террорист не хочет быть пойманным, а значит, жертва погибает. Но это не равновесие по Парето, потому что существует вариант, при котором всем лучше - жертва на свободе хранит молчание. Но для этого надо сделать так, чтобы молчать ей было выгодно. Где-то я прочитал вариант, когда она может попросить террориста устроить эротическую фотосессию. Если преступника посадят, его подельники выложат фотографии в интернет. Теперь, если похититель останется на свободе - это плохо, но фотографии в открытом доступе - еще хуже, поэтому получается равновесие. Для жертвы это способ остаться в живых.

Другие примеры игр:

Модель Бертрана

Раз уж мы говорим об экономике, рассмотрим экономический пример. В модели Бертрана два магазина продают один и тот же товар, покупая его у производителя по одной цене. Если цены в магазинах одинаковы, то примерно одинакова и их прибыль, ведь тогда покупатели выбирают магазин случайно. Единственное равновесие по Нэшу здесь - продавать товар по себестоимости. Но магазины хотят зарабатывать. Поэтому если один поставит цену 10 рублей, второй снизит ее на копейку, увеличив тем самым свою выручку вдвое, так как к нему уйдут все покупатели. Поэтому участникам рынка выгодно снижать цены, распределяя тем самым прибыль между собой.

Разъезд на узкой дороге

Рассмотрим примеры выбора между двумя возможными равновесиями. Представьте, что Петя и Маша едут навстречу друг другу по узкой дороге. Дорога настолько узкая, что им обоим нужно съехать на обочину. Если они решат повернуть налево или направо от себя, они просто разъедутся. Если же один повернет направо, а другой налево от себя, или наоборот, случится авария. Как выбрать, куда съехать? Чтобы помогать искать равновесие в подобных играх, существуют, например, правила дорожного движения. В России каждому нужно повернуть направо.

В забаве Chiken, когда два человека едут на большой скорости навстречу друг другу, тоже есть два равновесия. Если оба сворачивают на обочину, возникает ситуация, которая называется Chiken out, если оба не сворачивают, то погибают в страшной аварии. Если я знаю, что мой соперник едет прямо, мне выгодно съехать, чтобы выжить. Если я знаю, что мой соперник съедет, то мне выгодно ехать прямо, чтобы после получить 100 долларов. Сложно предсказать, что случится на самом деле, однако, у каждого из игроков есть свой метод выиграть. Представьте, что я закрепил руль так, что его нельзя повернуть, и показал это своему сопернику. Зная, что у меня нет выбора, соперник отскочит.

QWERTY-эффект

Иногда бывает очень сложно перейти из одного равновесия в другое, даже если оно означает пользу для всех. Раскладка QWERTY была создана, чтобы замедлить скорость печати. Поскольку если бы все печатали слишком быстро, головки печатной машинки, которые бьют по бумаге, цеплялись бы друг за друга. Поэтому Кристофер Шоулз разместил часто стоящие рядом буквы на максимально далеком расстоянии. Если вы зайдете в настройки клавиатуры на своем компьютере, вы сможете выбрать там раскладку Dvorak и печатать гораздо быстрее, так как сейчас нет проблемы аналоговых печатных машин. Дворак рассчитывал, что мир перейдет на его клавиатуру, но мы по-прежнему живем с QWERTY. Конечно, если бы мы перешли на раскладку Дворака, будущее поколение было бы нам благодарно. Все мы приложили бы усилия и переучились, в результате вышло бы равновесие, в котором все печатают быстро. Сейчас мы тоже в равновесии - в плохом. Но никому не выгодно быть единственным, кто переучится, потому что за любым компьютером, кроме личного, работать будет неудобно.

С помощью теории игр предприятие получает возможность предусмотреть ходы своих партнеров и конкурентов

Сложный инструментарий следует использовать только при принятии принципиально важных стратегических решений

В последние годы значение теории игр существенно возросло во многих областях экономических и социальных наук. В экономике она применима не только для решения общехозяйственных задач, но и для анализа стратегических проблем предприятий, разработок организационных структур и систем стимулирования.

Уже в момент ее зарождения, которым считают публикацию в 1944 г. монографии Дж. Неймана и О. Моргенштерна “Теория игр и экономическое поведение”, многие предсказали революцию в экономических науках благодаря использованию нового подхода. Эти прогнозы нельзя было считать излишне смелыми, так как с самого начала данная теория претендовала на описание рационального поведения при принятии решений во взаимосвязанных ситуациях, что характерно для большинства актуальных проблем в экономических и социальных науках. Такие тематические области, как стратегическое поведение, конкуренция, кооперация, риск и неопределенность, являются ключевыми в теории игр и непосредственно связаны с управленческими задачами.

Первые работы по теории игр отличались упрощенностью предположений и высокой степенью формальной абстракции, что делало их малопригодными для практического использования. За последние 10 – 15 лет положение резко изменилось. Бурный прогресс в промышленной экономике показал плодотворность методов игр в прикладной сфере.

В последнее время эти методы проникли и в управленческую практику. Вполне вероятно, что теория игр наряду с теориями трансакционных издержек и “патрон – агент” будет восприниматься как наиболее экономически обоснованный элемент теории организации. Следует отметить, что уже в 80-х годах М. Портер ввел в обиход некоторые ключевые понятия теории, в частности такие, как “стратегический ход” и “игрок”. Правда, эксплицитный анализ, связанный с концепцией равновесия, в этом случае еще отсутствовал.

Основные положения теории игр

Чтобы описать игру, необходимо сначала выявить ее участников. Это условие легко выполнимо, когда речь идет об обычных играх типа шахмат, канасты и т.п. Иначе обстоит дело с “рыночными играми”. Здесь не всегда просто распознать всех игроков, т.е. действующих или потенциальных конкурентов. Практика показывает, что не обязательно идентифицировать всех игроков, надо обнаружить наиболее важных.

Игры охватывают, как правило, несколько периодов, в течение которых игроки предпринимают последовательные или одновременные действия. Эти действия обозначаются термином “ход”. Действия могут быть связаны с ценами, объемами продаж, затратами на научные исследования и разработки и т.д. Периоды, в течение которых игроки делают свои ходы, называются этапами игры. Выбранные на каждом этапе ходы в конечном счете определяют “платежи” (выигрыш или убыток) каждого игрока, которые могут выражаться в материальных ценностях или деньгах (преимущественно дисконтированная прибыль).

Еще одним основным понятием данной теории является стратегия игрока. Под ней понимаются возможные действия, позволяющие игроку на каждом этапе игры выбирать из определенного количества альтернативных вариантов такой ход, который представляется ему “лучшим ответом” на действия других игроков. Относительно концепции стратегии следует заметить, что игрок определяет свои действия не только для этапов, которых фактически достигла конкретная игра, но и для всех ситуаций, включая и те, которые могут и не возникнуть в ходе данной игры.

Важна и форма предоставления игры. Обычно выделяют нормальную, или матричную, форму и развернутую, заданную в виде дерева. Эти формы для простой игры представлены на рис. 1а и 1б.

Чтобы установить первую связь со сферой управления, игру можно описать следующим образом. Два предприятия, производящие однородную продукцию, стоят перед выбором. В одном случае они могут закрепиться на рынке благодаря установлению высокой цены, которая обеспечит им среднюю картельную прибыль П K . При вступлении в жесткую конкурентную борьбу оба получают прибыль П W . Если один из конкурентов устанавливает высокую цену, а второй – низкую, то последний реализует монопольную прибыль П M , другой же несет убытки П G . Подобная ситуация может, например, возникнуть когда обе фирмы должны объявить свою цену, которая впоследствии не может быть пересмотрена.

При отсутствии жестких условий обоим предприятиям выгодно назначить низкую цену. Стратегия “низкой цены” является доминирующей для любой фирмы: вне зависимости от того, какую цену выбирает конкурирующая фирма, самой всегда предпочтительней устанавливать низкую цену. Но в таком случае перед фирмами возникает дилемма, так как прибыль П K (которая для обоих игроков выше, чем прибыль П W) не достигается.

Стратегическая комбинация “низкие цены/низкие цены” с соответствующими платежами представляет собой равновесие Нэша, при котором ни одному из игроков невыгодно сепаратно отходить от выбранной стратегии. Подобная концепция равновесия является принципиальной при разрешении стратегических ситуаций, но при определенных обстоятельствах она все же требует усовершенствования.

Что касается указанной выше дилеммы, то ее разрешение зависит, в частности, от оригинальности ходов игроков. Если предприятие имеет возможность пересмотреть свои стратегические переменные (в данном случае цену), то может быть найдено кооперативное решение проблемы даже без жесткого договора между игроками. Интуиция подсказывает, что при многократных контактах игроков появляются возможности добиться приемлемой “компенсации”. Так, при известных обстоятельствах нецелесообразно стремиться к краткосрочным высоким прибылям путем ценового демпинга, если в дальнейшем может возникнуть “война цен”.

Как отмечалось, оба рисунка характеризуют одну и ту же игру. Предоставление игры в нормальной форме в обычном случае отражает “синхронность”. Однако это не означает “одновременность” событий, а указывает на то, что выбор стратегии игроком осуществляется в условиях неведения о выборе стратегии соперником. При развернутой форме такая ситуация выражается через овальное пространство (информационное поле). При отсутствии этого пространства игровая ситуация приобретает иной характер: сначала решение должен бы принимать один игрок, а другой мог бы делать это вслед за ним.

Применение теории игр для принятия стратегических управленческих решений

В качестве примеров здесь можно назвать решения по поводу проведения принципиальной ценовой политики, вступления на новые рынки, кооперации и создания совместных предприятий, определения лидеров и исполнителей в области инноваций, вертикальной интеграции и т.д. Положения данной теории в принципе можно использовать для всех видов решений, если на их принятие влияют другие действующие лица. Этими лицами, или игроками, необязательно должны быть рыночные конкуренты; в их роли могут выступать субпоставщики, ведущие клиенты, сотрудники организаций, а также коллеги по работе.

Инструментарий теории игр особенно целесообразно применять, когда между участниками процесса существуют важные зависимости в области платежей . Ситуация с возможными конкурентами приведена на рис. 2.

Квадранты 1 и 2 характеризуют ситуацию, когда реакция конкурентов не оказывает существенного влияния на платежи фирмы. Это происходит в тех случаях, когда у конкурента нет мотивации (поле 1 ) или возможности (поле 2 ) нанести “ответный удар”. Поэтому нет необходимости в детальном анализе стратегии мотивированных действий конкурентов.

Аналогичный вывод следует, хотя и по другой причине, и для ситуации, отражаемой квадрантом 3 . Здесь реакция конкурентов могла бы изрядно воздействовать на фирму, но поскольку ее собственные действия не могут сильно повлиять на платежи конкурента, то и не следует опасаться его реакции. В качестве примера можно привести решения о вхождении в рыночную нишу: при определенных обстоятельствах у крупных конкурентов нет оснований реагировать на подобное решение небольшой фирмы.

Лишь ситуация, показанная в квадранте 4 (возможность ответных шагов рыночных партнеров), требует использования положений теории игр. Однако здесь отражены лишь необходимые, но недостаточные условия, чтобы оправдать применение базы теории игр для борьбы с конкурентами. Бывают ситуации, когда одна стратегия безусловно доминирует над всеми другими независимо от того, какие действия предпримет конкурент. Если взять, например, рынок лекарственных препаратов, то для фирмы часто бывает важно первой заявить новый товар на рынке: прибыль “первопроходца” оказывается столь значительной, что всем другим “игрокам” остается только быстрее активизировать инновационную деятельность.

Тривиальным с позиций теории игр примером “доминирующей стратегии” является решение относительно проникновения на новый рынок. Возьмем предприятие, которое выступает в качестве монополиста на каком-либо рынке (например, IВМ на рынке персональных компьютеров в начале 80-х годов). Другое предприятие, действующее, к примеру, на рынке периферийного оборудования для ЭВМ, обдумывает вопрос о проникновении на рынок персональных компьютеров с переналадкой своего производства. Компания-аутсайдер может принять решение о вступлении или невступлении на рынок. Компания-монополист может отреагировать на появление нового конкурента агрессивно или дружественно. Оба предприятия вступают в двухэтапную игру, в которой первый ход делает компания-аутсайдер. Игровая ситуация с указанием платежей показана в виде дерева на рис.3.

Та же самая игровая ситуация может быть представлена и в нормальной форме (рис.4). Здесь обозначены два состояния – “вступление/дружественная реакция” и “невступление/ агрессивная реакция”. Очевидно, что второе равновесие несостоятельно. Из развернутой формы следует, что для уже закрепившейся на рынке компании нецелесообразно реагировать агрессивно на появление нового конкурента: при агрессивном поведении теперешний монополист получает 1(платеж), а при дружественном – 3. Компания-аутсайдер к тому же знает, что для монополиста не рационально начинать действия по ее вытеснению, и поэтому она принимает решение о вступлении на рынок. Грозившие потери в размере (-1) компания-аутсайдер не понесет.

Подобное рациональное равновесие характерно для “частично усовершенствованной” игры, которая заведомо исключает абсурдные ходы. Такие равновесные состояния на практике в принципе довольно просто найти. Равновесные конфигурации могут быть выявлены с помощью специального алгоритма из области исследования операций для любой конечной игры. Игрок, принимающий решение, поступает следующим образом: вначале делается выбор “лучшего” хода на последнем этапе игры, затем выбирается “лучший” ход на предшествующем этапе с учетом выбора на последнем этапе и так далее, до тех пор пока не будет достигнут начальный узел дерева игры.

Какую пользу могут извлечь компании из анализа на базе теории игр? Известен, например, случай столкновения интересов компаний IВМ и Telex. В связи с объявлением о подготовительных планах последней к вступлению на рынок состоялось “кризисное” совещание руководства IВМ, на котором были проанализированы мероприятия, направленные на то, чтобы заставить нового конкурента отказаться от намерения проникнуть на новый рынок.

Компании Telex, видимо, стало известно об этих мероприятиях. Анализ на базе теории игр показал, что угрозы IВМ из-за высоких затрат безосновательны.

Это свидетельствует, что компаниям полезно в эксплицитном виде обдумывать возможные реакции партнеров по игре. Изолированные хозяйственные расчеты, даже опирающиеся на теорию принятия решений, часто носят, как в изложенной ситуации, ограниченный характер. Так, компания-аутсайдер могла бы и выбрать ход “невступление”, если бы предварительный анализ убедил ее в том, что проникновение на рынок вызовет агрессивную реакцию монополиста. В этом случае в соответствии с критерием ожидаемой стоимости разумно выбрать ход “невступление” при вероятности агрессивного ответа 0,5.

Следующий пример связан с соперничеством компаний в области технологического лидерства. Исходной является ситуация, когда предприятие 1 ранее обладало технологическим превосходством, но в настоящее время располагает меньшими финансовыми ресурсами для научных исследований и разработок (НИР), чем его конкурент. Оба предприятия должны решить вопрос, попытаться ли с помощью крупных капиталовложений добиться доминирующего положения на мировом рынке в соответствующей технологической области. Если оба конкурента вложат в дело крупные средства, то перспективы на успех у предприятия 1 будут лучше, хотя оно и понесет большие финансовые расходы (как и предприятие 2 ). На рис. 5 эта ситуация представлена платежами с отрицательными значениями.

Для предприятия 1 лучше всего было бы, если бы предприятие 2 отказалось от конкуренции. Его выгода в таком случае составила бы 3 (платежа). С большой вероятностью предприятие 2 выиграло бы соперничество, когда предприятие 1 приняло бы урезанную программу инвестиций, а предприятие 2 – более широкую. Это положение отражено в правом верхнем квадранте матрицы.

Анализ ситуации показывает, что равновесие наступает при высоких затратах на НИР предприятия 2 и низких предприятия 1 . При любом другом раскладе у одного из конкурентов появляется резон отклониться от стратегической комбинации: так, для предприятия 1 предпочтителен сокращенный бюджет, если предприятие 2 откажется от участия в соперничестве; в то же время предприятию 2 известно, что при низких затратах конкурента ему выгодно инвестировать в НИР.

Предприятие, имеющее технологическое преимущество, может прибегнуть к анализу ситуации на базе теории игр, чтобы в конечном счете добиться оптимального для себя результата. С помощью определенного сигнала оно должно показать, что готово осуществить крупные затраты на НИР. Если такой сигнал не поступил, то для предприятия 2 ясно, что предприятие 1 выбирает вариант низких затрат.

О достоверности сигнала должны свидетельствовать обязательства предприятия. В данном случае это может быть решение предприятия 1 о закупке новых лабораторий или найме на работу дополнительного научно-исследовательского персонала.

С точки зрения теории игр подобные обязательства равнозначны изменению хода игры: ситуация одновременного принятия решений сменяется ситуацией последовательных ходов. Предприятие 1 твердо демонстрирует намерение пойти на крупные затраты, предприятие 2 регистрирует этот шаг и у него нет больше резона участвовать в соперничестве. Новое равновесие вытекает из расклада “неучастие предприятия 2 ” и “высокие затраты на НИР предприятия 1 ”.

К числу известных областей применения методов теории игр следует отнести также ценовую стратегию, создание совместных предприятий, расчет времени разработки новой продукции.

Важный вклад в использование теории игр вносят экспериментальные работы . Многие теоретические выкладки отрабатываются в лабораторных условиях, а полученные результаты служат импульсом для практиков. Теоретически было выяснено, при каких условиях двум эгоистически настроенным партнерам целесообразно сотрудничать и добиваться лучших для себя результатов.

Эти знания можно использовать в практике предприятий, чтобы помочь двум фирмам достичь ситуации “выигрыш/выигрыш”. Сегодня консультанты с подготовкой в области игр быстро и однозначно выявляют возможности, которыми предприятия могут воспользоваться для заключения стабильных и долгосрочных договоров с клиентами, субпоставщиками, партнерами по разработкам и т.п.

Проблемы практического применения
в управлении

Следует, однако, указать и на наличие определенных границ применения аналитического инструментария теории игр. В следующих случаях он может быть использован лишь при условии получения дополнительной информации.

Во-первых, это тот случай, когда у предприятий сложились разные представления об игре, в которой они участвуют, или когда они недостаточно информированы о возможностях друг друга. Например, может иметь место неясная информация о платежах конкурента (структуре издержек). Если неполнотой характеризуется не слишком сложная информация, то можно оперировать сопоставлением подобных случаев с учетом определенных различий.

Во-вторых, теорию игр трудно применять при множестве ситуаций равновесия. Эта проблема может возникнуть даже в ходе простых игр с одновременным выбором стратегических решений.

В-третьих, если ситуация принятия стратегических решений очень сложна, то игроки часто не могут выбрать лучшие для себя варианты. Легко представить более сложную ситуацию проникновения на рынок, чем та, которая рассмотрена выше. Например, на рынок в разные сроки могут вступить несколько предприятий или реакция уже действующих там предприятий может оказаться более сложной, нежели быть агрессивной или дружественной.

Экспериментально доказано, что при расширении игры до десяти и более этапов игроки уже не в состоянии пользоваться соответствующими алгоритмами и продолжать игру с равновесными стратегиями.

Отнюдь не бесспорно и принципиальное, лежащее в основе теории игр предположение о так называемом “общем знании”. Оно гласит: игра со всеми правилами известна игрокам и каждый из них знает, что все игроки осведомлены о том, что известно остальным партнерам по игре. И такое положение сохраняется до конца игры.

Но чтобы предприятие в конкретном случае приняло предпочтительное для себя решение, данное условие требуется не всегда. Для этого часто достаточны менее жесткие предпосылки, например “взаимное знание” или “рационализируемые стратегии”.

В заключение следует особо подчеркнуть, что теория игр является очень сложной областью знания. При обращении к ней надо соблюдать известную осторожность и четко знать границы применения. Слишком простые толкования, принимаемые фирмой самостоятельно или с помощью консультантов, таят в себе скрытую опасность. Анализ и консультации на основе теории игр из-за их сложности рекомендуются лишь для особо важных проблемных областей. Опыт фирм показывает, что использование соответствующего инструментария предпочтительно при принятии однократных, принципиально важных плановых стратегических решений, в том числе при подготовке крупных кооперационных договоров.

В практической деятельности часто приходится принимать решения в условиях противодействия другой стороны, которая может преследовать противоположные или иные цели, препятствовать теми или иными действиями или состояниями внешней среды достижению намеченной цели. Причем, эти воздействия противоположной стороны могут носить пассивный или активный характер. В таких случаях приходится учитывать возможные варианты поведения противоположной стороны, ответные действия и их возможные последствия.

Возможные варианты поведения обеих сторон и их исходов для каждого сочетания вариантов и состояний часто представляют в видематематической модели,которую называют игрой .

Если в качестве противодействующей стороны выступает неактивная, пассивная сторона, которая сознательно не противодействует достижению намеченной цели, то такую игру называют игрой с «природой». Под природой понимают обычно совокупность обстоятельств, в которых приходится принимать решения (неясность погодных условий, неизвестность поведения клиентов в коммерческой деятельности, неопределенность реакции населения на новые виды товаров и услуг и т. д.)

В других ситуациях противоположная сторона активно, сознательно противостоит достижению намеченной цели. В подобных случаях происходит столкновение противоположных интересов, мнений, идей. Такие ситуации называются конфликтными , а принятие решений в конфликтной ситуации затрудняется из-за неопределенности поведения противника. Известно, что противник сознательно стремится предпринять наименее выгодные для вас действия, чтобы обеспечить себе наибольший успех. Неизвестно, в какой мере противник умеет оценить обстановку и возможные последствия, как он оценивает ваши возможности и намерения. Обе стороны не могут предсказать взаимные действия. Несмотря на такую неопределенность, принимать решение приходится каждой стороне конфликта

В экономике конфликтные ситуации встречаются очень часто и имеют многообразный характер. К ним относятся, например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом и т. д. Во всех этих примерах конфликтная ситуация порождается различием интересов партнеров и стремлением каждого из них принимать оптимальные решения. При этом каждому приходится считаться не только со своими целями, но и с целями партнера и учитывать неизвестные заранее его возможные действия.

Необходимость обоснования оптимальных решений в конфликтных ситуациях привела к возникновению теории игр.

Теория игр - это математическая теория конфликтных ситуаций . Исходными положениями этой теории являются предположение о полной «идеальной» разумности противника и принятие при разрешении конфликта наиболее осторожного решения.

Конфликтующие стороны называются игроками , одна реализация игры – партией , исход игры – выигрышем или проигрышем . Любое возможное для игрока действие (в рамках заданных правил игры) называется его стратегией .

Смысл игры состоит в том, что каждый из игроков в рамках заданных правил игры стремится применить оптимальную для него стратегию, то есть стратегию, которая приведет к наилучшему для него исходу. Одним из принципов оптимального (целесообразного) поведения является достижение равновесной ситуации, в нарушении которой не заинтересован ни один из игроков.

Именно ситуация равновесия может быть предметом устойчивых договоров между игроками. Кроме того, ситуации равновесия являются выгодными для каждого игрока: в равновесной ситуации каждый игрок получает наибольший выигрыш, в той мере, в какой это от него зависит.

Математическая модель конфликтной ситуации называется игрой , стороны, участвующие в конфликте, называются игроками.

Для каждой формализованной игры вводятся правила. В общем случае правилами игры устанавливаются варианты действий игроков; объем информации каждого игрока о поведении партнеров; выигрыш, к которому приводит каждая совокупность действий.

Развитие игры во времени происходит последовательно, по этапам или ходам. Ходом в теории игр называют выбор одного из предусмотренных правилами игры действия и его реализацию. Ходы бывают личные и случайные. Личным ходом называют сознательный выбор игроком одного из возможных вариантов действия и его осуществление. Случайным ходом называют выбор, осуществляемый не волевым решением игрока, а каким-либо механизмом случайного выбора (бросание монеты, пасовка, сдача карт и т. д.).

Комбинированные игры, в которых правила дают в принципе возможность каждому игроку проанализировать все разнообразные варианты своего поведения и, сравнив эти варианты, избрать тот из них, который ведет к наилучшему для этого игрока исходу. Неопределенность исхода связана обычно с тем, что количество возможных вариантов поведения (ходов) слишком велико и игрок практически не в состоянии их всех перебрать и проанализировать.

Азартные игры , в которых исход оказывается неопределенным в силу влияния различных случайных факторов. Азартные игры состоят только из случайных ходов, при анализе которых применяется теория вероятностей. Азартными играми математическая теория игр не занимается.

Стратегические игры , в которых полная неопределенность выбора обоснована тем, что каждый из игроков, принимая решение о выборе предстоящего хода, не знает, какой стратегии будут придерживаться другие участники игры, причем незнание игрока о поведении и намерениях партнеров носит принципиальный характер, так как отсутствует информация о последующих действиях противника (партнера).

Существуют игры, сочетающие в себе свойства комбинированных и азартных игр, стратегичность игр может сочетаться с комбинаторностью и т. д.

В зависимости от числа участников игры подразделяются на парные и множественные. В парной игре число участников равно двум, во множественной игре число участников более двух. Участники множественной игры могут образовывать коалиции. В этом случае игры называют коалиционными . Множественная игра обращается в парную, если ее участники образуют две постоянные коалиции.

Одним из основных понятий теории игр является стратегия. Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в процессе игры.

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры, содержащей личные и случайные ходы, обеспечивает игроку максимально возможный средний выигрыш или минимально возможный проигрыш независимо от поведения противника.

Игра называется конечной , если число стратегий игроков конечно, и бесконечной , если хотя бы у одного из игроков число стратегий является бесконечным.

В многоходовых задачах теории игр понятия «стратегия» и «вариант возможных действий» существенно отличаются друг от друга. В простых (одноходовых) игровых задачах, когда в каждой партии игры каждый игрок может сделать по одному ходу, эти понятия совпадают, а, следовательно, совокупность стратегий игрока охватывает все возможные действия, которые он может предпринять в любой возможной ситуации и при любой возможной фактической информации.

Различают игры и по сумме выигрыша. Игра называется игрой с нулевой суммо й , если каждый игрок выигрывает за счет других, а сумма выигрыша одной стороны равна сумме проигрыша другой. В парной игре с нулевой суммой интересы игроков прямо противоположны. Парная игра с нулевой суммой называется антагонистической игрой .

Игры, в которых выигрыш одного игрока и проигрыш другого не равны между собой, называются играми с ненулевой суммой .

Существует два способа описания игр: позиционный и нормальный . Позиционный способ связан с развернутой формой игры и сводится к графу последовательных шагов (дереву игры). Нормальный способ заключается в явном представлении совокупности стратегий игроков и платежной функции . Платежная функция в игре определяет для каждой совокупности выбранных игроками стратегий выигрыш каждой из сторон.

Все камни