Автор работы: Пользователь скрыл имя, 23 Ноября 2011 в 21:55, реферат
Целью данной курсовой работы является изучение и практическое применение игровых моделей в управлении. Для достижения поставленной цели необходимо решить следующие задачи:
рассмотреть историю становления теории игр и ее основные элементы;
изучить стратегии игровых моделей;
рассмотреть приведение матричных игровых задач в смешанных стратегиях к задачам линейного программирования.
Решение матричной игры со смешанным расширением – это определение оптимальных смешанных стратегий, то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.
Для матричной игры, платёжная матрица которой показана на рис. 1.3, Vн ¹ Vв , определим такие значения вероятностей выбора стратегий для игрока I (p1, p2 ,…, pm) и для игрока II (q1, q2 ,…, qn), при которых игроки достигали бы своего максимально гарантированного выигрыша.
Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:
Для первого игрока:
Для второго игрока:
Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V – через yj.
Для игрока I получим следующую систему неравенств, из которой найдём значение 1/V:
Для игрока I необходимо найти максимальную цену игры (V). Следовательно, значение 1/V должно стремиться к минимуму.
Целевая функция задачи будет иметь следующий вид (18):
min Z = min 1/V = min (x1 + x2 + … + xm) (18)
Для игрока II получим следующую систему неравенств, из которой найдём значение 1/V:
Для игрока II необходимо найти минимальную цену игры (V). Следовательно, значение 1/V должно стремиться к максимуму.
Целевая функция задачи будет иметь следующий вид (19):
max Z = max 1/V = max (y1 + y2 + … + yn) (19)
Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина V* = V + K.
Для
решения задач линейного
Величина V* определяется по формуле: V* = 1/z
Значения вероятностей выбора стратегий определяются:
для игрока I: Pi = xi×V*:
для игрока II: qi = yi×V*.
Для определения цены игры V из величины V* необходимо вычесть число K.
Информация о работе Понятие игровых моделей и их использование для решения управленческих задач