Понятие игровых моделей и их использование для решения управленческих задач

Автор работы: Пользователь скрыл имя, 23 Ноября 2011 в 21:55, реферат

Описание работы

Целью данной курсовой работы является изучение и практическое применение игровых моделей в управлении. Для достижения поставленной цели необходимо решить следующие задачи:
рассмотреть историю становления теории игр и ее основные элементы;
изучить стратегии игровых моделей;
рассмотреть приведение матричных игровых задач в смешанных стратегиях к задачам линейного программирования.

Файлы: 1 файл

теория.docx

— 65.18 Кб (Скачать файл)

      Величина  выигрыша игрока I равна, по определению матричной игры, величине проигрыша игрока II. Поэтому для игрока II необходимо определить значение

      Vв = minj maxi aij (2).

      Или найти максимальные значения по каждому  из столбцов платёжной матрицы, а  затем определить минимальное из этих значений. Величина Vв называется минимаксом матрицы или верхней ценой игры (2).

      В случае, если значения Vн и Vв не совпадают, при сохранении правил игры (коэффициентов aij ) в длительной перспективе, выбор стратегий каждым из игроков оказывается неустойчивым. Устойчивость он приобретает лишь при равенстве Vн = Vв = V. В этом случае говорят, что игра имеет решение в чистых стратегиях и называется игрой с седловой точкой, а стратегии, в которых достигается V - оптимальными чистыми стратегиями. Величина V называется чистой ценой игры[8].

      Как только будет найден перечень стратегий  приводящий к седловой точке, игра перестает  быть игрой и превращается в набор планомерных шагов.

      Однако  такое равновесие консервативно, поскольку  участник экономического процесса должен выбирать не ту стратегию, которая приносит ему наибольший выигрыш при неразумном выборе стратегии соперником, а ту стратегию, которая в наибольшей степени предохраняет от потерь в  игре с умудренным соперником. Те же соображения, которые лежат в  основе максимального определения  равновесия, дают аналитически строгое  решение старых проблем дуополии, которое заставляет фирму действовать  независимо от поведения конкурента. Самое лучшее для каждой фирмы - исходить из того, что соперник может предпринять  абсолютно любые действия; тогда  каждая фирма стремилась бы максимизировать  тот минимальный выигрыш, который  можно получить при каждой из возможных  стратегий.

      Далее рассмотрим пример платежных матриц, в которых как существует, так  и не существует решения в чистых стратегиях.

  B1 B2 B3 B4 Minj
A1 7 6 5 4 4
A2 1 8 2 3 1
A3 8 1 3 2 1
Maxi 8 8 5 4  

Рис. 1.2 Платёжная матрица, в которой существует решение в чистых стратегиях

  B1 B2 B3 B4 Minj
A1 7 6 5 2 2
A2 1 8 2 3 1
A3 8 1 3 2 1
Maxi 8 8 5 3  

Рис. 1.3 Платёжная матрица, в которой не существует решения в чистых стратегиях

     В матрице (рис. 1.2) существует решение  в чистых стратегиях.  При этом для игрока I оптимальной чистой стратегией будет стратегия A1, а для игрока II – стратегия B4.

     В матрице (рис. 1.3) решения в чистых стратегиях не существует, так как нижняя цена игры достигается в стратегии A1 и её значение равно 2, в то время как верхняя цена игры достигается в стратегии B4 и её значение равно 3.

      Порядок платёжной матрицы (количество строк  и столбцов) может быть уменьшен за счёт исключения доминируемых и  дублирующих стратегий.  Стратегия  K* называется доминируемой стратегией K**, если при любом варианте поведения противодействующего игрока выполняется соотношение

      Ak* < Ak** (3),

где Ak* и Ak** - значения выигрышей при выборе игроком, соответственно, стратегий K* и K**.

В случае, если выполняется соотношение Ak* = Ak**, стратегия K* называется дублирующей по отношению к стратегии K**.

      Рассмотрим  на примере платежную матрицу  с доменируемыми и дублирующими стратегиями.

  B1 B2 B3 B4 B5 B6
A1 1 2 3 4 4 7
A2 7 6 5 4 4 8
A3 1 8 2 3 3 6
A4 8 1 3 2 2 5

Рис. 1.4 Платёжная матрица с доминируемыми  и дублирующими стратегиями

В платежной  матрице (рис. 1.4) стратегия A1 является доминируемой по отношению к стратегии A2, стратегия B6 является доминируемой по отношению к стратегиям B3, B4 и B5, а стратегия B5 является дублирующей по отношению к стратегии B4. Данные стратегии не будут выбраны игроками, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей.

      Множество недоминируемых стратегий, полученных после уменьшения размерности платёжной  матрицы, называется ещё множеством Парето (по имени итальянского экономиста Вильфредо Парето, занимавшегося  исследованиями в данной области) [7].

1.3 Понятие о матричных играх и принятие решений в смешанных стратегиях

      Исследование  в матричных играх начинается с нахождения её чистой цены. Если матричная  игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается  исследование игры. Если же в игре нет  решения в чистых стратегиях, то можно найти нижнюю и верхнюю  цены этой игры, которые указывают, что игрок I не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.

      Смешанной стратегией игрока называется полный набор чистых стратегий, применённых в соответствии с установленным распределением вероятностей. Матричная игра, решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.

      Стратегии, применённые с вероятностью, отличной от нуля, называются активными стратегиями.

      Доказано [1, 2, 4, 7, 8, 11], что для всех игр со смешанным расширением существует оптимальная смешанная стратегия, значение выигрыша при выборе которой находится в интервале между нижней и верхней ценой игры:

      Vн  £ V £ Vв (4).

При этом условии (4) величина V называется ценой игры.

      Кроме того, доказано, что, если один из игроков  придерживается своей оптимальной  смешанной стратегии, то выигрыш  остаётся неизменным и равным цене игры V, независимо от того, каких стратегий придерживается другой игрок, если только он не выходит за пределы своих активных стратегий. Поэтому, для достижения наибольшего гарантированного выигрыша второму игроку также необходимо придерживаться своей оптимальной смешанной стратегии.

      Рассмотрим  матрицу парной игры на примере:

      
 A\B B1 B2 B3 B4
A1 1 2 4 3
A2 0 2 3 4
A3 1 2 4 3

A 4

4 3 1 0
 
 
 
 
 

Рис. 1.5 Матрица парной игры

      На  примере матрицы видно, что стратегия  А3 по выигрышу полностью повторяет  стратегию А1, данная стратегия является дублирующей и при решении игровой задачи ее можно исключить. Стратегия А2 является заведомо невыгодной, так как каждый ее платеж меньше соответствующего платежа А1. Поэтому от стратегии А2 также нужно отказаться, так как она никогда не будет выбрана игроком I.

      Исходная  матрица (рис. 1.5) преобразуется в  следующую (рис. 1.6):

 A\B B1 B2 B3 B4
A1 1 2 4 3

A 4

4 3 1 0
 
 
 
 

Рис. 1.6 Преобразованная матрица

Соответственно  для игрока II не выгодна стратегия В3, поскольку она имеет

 наибольший  платеж = 4. Следовательно матрица преобразуется еще раз (рис.

1.7). 

 A\B B1 B2 B4
A1 1 2 3

A 4

4 3 0
 
 
 
 

Рис. 1.7 Повторно преобразованная матрица

      Решение игровых задач в табличном  или матричном виде всегда начинается с вычеркивания дублирующих и  заведомо невыгодных стратегий. После  чего приступают к приведению игровой  матрицы к задаче линейного программирования (ЗЛП). Процесс приведения матричных игровых задач в смешанных стратегиях к ЗЛП будет подробно рассмотрен позднее, а далее рассмотрим последний вид игровой стратегии.

1.4 Cтатистические игры, принятие решений в «играх с природой»

     Принятие  управленческих решений предполагает наличие ситуаций выбора наиболее выгодного  варианта поведения из нескольких имеющихся  вариантов в условиях неопределённости.  Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой. Объективно окружающая среда не заинтересована в проигрыше игрока. В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени.

Информация о работе Понятие игровых моделей и их использование для решения управленческих задач