Автор работы: Пользователь скрыл имя, 25 Февраля 2010 в 09:45, Не определен
1. Ознакомление с теорией игр
2. Постановка задачи с позиции теории игр
3. Исследование методов теории игр
4. Обзор программных средств для решения задач теорией игр
5. Решение задач методами теории игр в примера
Рисунок
1.4 - Игра двух участников с нулевой
суммой, не имеющая седловую точку
Расширим понятие стратегии за счет смешанных (или случайных) стратегий. Смешанная стратегия представляет собой вероятностную комбинацию чистых стратегий, т.е. ряд чистых стратегий, взятых в случайном порядке с некоторыми вероятностями.
Смешанные стратегии игроков 1 и 2 можно указать с помощью вектора вероятностей:
В теории игр доказано, что любая парная конечная игра с нулевой суммой имеет, по крайней мере, одно решение в смешанных стратегиях. Таким образом, каждая конечная игра имеет цену - g - средний выигрыш, приходящийся на одну партию, удовлетворяющий условию:
Решить игру – найти цену игры и оптимальные стратегии.
Игра
m
n, (где m³3,
n³3)
заданную платежной матрицей А:
Пусть платежная матрица не содержит седловой точки, т.е. игра решается в смешанных стратегиях: .
Применение игроком 1 оптимальной смешанной стратегии S1* гарантирует ему средний выигрыш не меньше цены игры g независимо от поведения игрока 2(gj ≥ g).
Игрок 2, применяя оптимальную смешанную стратегию S2*, гарантирует для себя минимальный проигрыш (gI g).
Учитывая данное условие, задачу линейного программирования можно записать следующим образом:
1)
для игрока 1:
(4)
2)
для игрока 2:
(5)
Смысл этих систем уравнений заключается в следующем: игрок 1 стремится увеличить цену игры (g→max), т.е. он действует так, чтобы его средний выигрыш при использовании его стратегии с вероятностями рi для любой j-й стратегии игрока 2 был не меньше величины g, которую он стремится увеличить. Игрок 2 стремится уменьшить свой проигрыш (g→min), т.е. он действует так, чтобы его средний проигрыш при использовании его стратегий с вероятностями qj при любой i-й стратегии игрока 1 не превышал величину g, которую он стремиться уменьшить.
Разделив
левую и правую часть неравенств
(4) и (5) на цену игры g > 0 и обозначив
(6)
получим уравнения (7) и (8) в следующем виде:
(7)
. (8)
Из равенств и выражений (6) следует, что переменные (xi) и (yj) удовлетворяют условиям: . Таким образом, цена игры определяется как: .
Оптимальные
стратегии
определяются как:
Теорема: Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры γ, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных (оптимальных смешанных) стратегий [15].
Графический метод решения игр выполняется по шагам:
1) В системе координат XOY по оси абсцисс (ОХ) откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка Х=0) соответствует стратегии А1, правый (точка Х=1) – стратегии А2. Промежуточные точки Х соответствуют некоторым смешанным стратегиям S1=(p1, p2).
2) По оси ординат (OY) откладываются выигрыши при стратегии А1. На линии, параллельной оси ординат, в точке 1 откладываются выигрыши при стратегии А2.
Пусть имеется игра с платежной матрицей: .
Если игрок 2 применяет стратегию В1, то выигрыш игрока 1 при использовании чистых стратегий А1 и А2 составляет соответственно 0,4 и 0,6. Соединим эти точки прямой В1В1.
Ордината любой точки отрезка В1В1 равна величине выигрыша игрока 1 при принятии им стратегии А1 и А2 с соответствующими вероятностями р1 и р2.
Аналогично прямая В2В2 соответствует стратегии игрока 2. Точка пересечения В1В1 и В2В2 определяет цену игры γ. Ординаты точек В2В2 равны среднему стратегий А1 и А2 с вероятностями р1 и р2.
Ломаная В1NB2 – нижняя граница выигрыша, получаемая игроком 1. В точке N он максимален.
Таким образом, оптимальная стратегия первого игрока: S1*=(0,375; 0,625); цена игры (максимальный выигрыш) γ =55% [18].
Рисунок
1.5 – Графическая интерпретация решения
игры
Принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой. Объективно окружающая среда не заинтересована в проигрыше игрока. В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени.
Матричная игра, в которой игрок взаимодействует с окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения наиболее выгодного варианта поведения с учётом неопределённости состояния окружающей среды, называется статистической игрой или «игрой с природой». Игрок в этой игре называется лицом, принимающим решение (ЛПР).
В общем виде платёжная
матрица статистической игры приведена
в таблице 2.
Таблица 2
Общий
вид платёжной матрицы
S1 | S2 | … | Sn | |
A1 | A11 | A12 | … | A1n |
A2 | A21 | A22 | … | A2n.. |
… | … | … | … | … |
An | Am1 | Am2 | … | Amn |
В данной игре строки матрицы (Ai ) - стратегии ЛПР, а столбцы матрицы (Sj) – состояния окружающей среды.
Критерии принятия решения
ЛПР определяет наиболее выгодную стратегию в зависимости от целевой установки, которую он реализует в процессе решения задачи. Результат решения задачи ЛПР определяет по одному из критериев принятия решения. Для того, чтобы прийти к однозначному и по возможности наиболее выгодному варианту решению, необходимо ввести оценочную (целевую) функцию. При этом каждой стратегии ЛПР (Ai) приписывается некоторый результат Wi, характеризующий все последствия этого решения. Из массива результатов принятия решений ЛПР выбирает элемент W, который наилучшим образом отражает мотивацию его поведения [17].
Критерий
максимального математического
ожидания выигрыша применяется в
тех случаях, когда ЛПР известны
вероятности состояний
(9)
где pj –вероятность j-го состояния окружающей среды.
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение математического ожидания выигрыша максимально: W = max Wi
Применение критерия максимального математического ожидания выигрыша, таким образом, оправдано, если ситуация, в которой принимается решение, следующая:
Необходимость иметь информацию о вероятностях состояний окружающей среды ограничивает область применения данного критерия.
Данный
критерий используется при наличии
неполной информации о вероятностях
состояний окружающей среды в
задаче принятия решения. Вероятности
состояний окружающей среды принимаются
равными и по каждой стратегии ЛПР в платёжной
матрице определяется, таким образом,
среднее значение выигрыша:
. (10)
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение среднего выигрыша максимально: W = max Wi.
Использование данного критерия оправдано в следующей ситуации:
Правило выбора решения в соответствии с максиминным критерием (ММ-критерием) можно интерпретировать следующим образом:
Платёжная
матрица дополняется столбцом, каждый
элемент которого представляет собой
минимальное значение выигрыша в
соответствующей стратегии ЛПР:
Wi
= minj aij.
(11)
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой минимальное значение выигрыша максимально: W = max Wi.
Выбранная
таким образом стратегия
Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:
Величина (amax j – aij ), где amax j - максимальный элемент j – го столбца, может быть интерпретирована как дополнительный выигрыш, получаемый в условиях состояния окружающей среды Sj при выборе ЛПР наиболее выгодной стратегии, по сравнению с выигрышем, получаемым ЛПР при выборе в тех же условиях любой другой стратегии. Эта же разность может быть интерпретирована как величина возможного проигрыша при выборе ЛПР I – й стратегии по сравнению с наиболее выгодной стратегией.
Информация о работе Применение алгоритмов теории игр в экономических системах