Автор работы: Пользователь скрыл имя, 23 Ноября 2011 в 21:55, реферат
Целью данной курсовой работы является изучение и практическое применение игровых моделей в управлении. Для достижения поставленной цели необходимо решить следующие задачи:
рассмотреть историю становления теории игр и ее основные элементы;
изучить стратегии игровых моделей;
рассмотреть приведение матричных игровых задач в смешанных стратегиях к задачам линейного программирования.
Матричная игра, в которой игрок взаимодействует с окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения наиболее выгодного варианта поведения с учётом неопределённости состояния окружающей среды, называется статистической игрой или «игрой с природой». Игрок в этой игре называется лицом, принимающим решение (ЛПР). [3,6,9,10].
В общем виде платёжная матрица статистической игры приведена на рисунке 1.8.
S1 | S2 | … | Sn | |
A1 | а11 | а12 | ... | а1n |
A2 | а21 | а22 | ... | а2n |
… | ... | ... | ... | ... |
An |
am1 | am2 | ... | amn |
Рис. 1.8 Общий вид платёжной матрицы статистической игры
В данной игре строки матрицы (Ai ) - стратегии ЛПР, а столбцы матрицы (Sj) – состояния окружающей среды. При этом каждому платежу amnвводится понятие риска rm n или вновь упущенной возможности.
Риск определяется как разность между выигрышем игрока I, в случае, если бы он знал поведение «природы» и тем выигрышем, который он получит применяя ту или иную конкретную стратегию. Риски также сводятся в матрицу, той же размерности, что и платежная.
ЛПР определяет наиболее выгодную стратегию в зависимости от целевой установки, которую он реализует в процессе решения задачи. Результат решения задачи ЛПР определяет по одному из критериев принятия решения. Для того, чтобы прийти к однозначному и по возможности наиболее выгодному варианту решению, необходимо ввести оценочную (целевую) функцию. При этом каждой стратегии ЛПР (Ai) приписывается некоторый результат Wi, характеризующий все последствия этого решения. Из массива результатов принятия решений ЛПР выбирает элемент W, который наилучшим образом отражает мотивацию его поведения.
Выбор ЛПР наилучшей стратегии в «играх с природой» осуществляется на основе матрицы платежеспособности и матрицы рисков. Причем в данном случае используются следующие критерии:
Критерий максимального математического ожидания выигрыша применяется в тех случаях, когда ЛПР известны вероятности состояний окружающей среды. Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой значение математического ожидания выигрыша при выборе соответствующей стратегии ЛПР:
где pj –вероятность j-го состояния окружающей среды.
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение математического ожидания выигрыша максимально (6):
W = max Wi (6)
Применение критерия максимального математического ожидания выигрыша, таким образом, оправдано, если ситуация, в которой принимается решение, следующая:
Необходимость иметь информацию о вероятностях состояний окружающей среды ограничивает область применения данного критерия.
Данный критерий
используется при наличии неполной
информации о вероятностях состояний
окружающей среды в задаче принятия
решения. Вероятности состояний
окружающей среды принимаются равными
и по каждой стратегии ЛПР в
платёжной матрице
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение среднего выигрыша максимально (8):
W = max Wi (8)
Данный критерий предполагает, что игрок II – «природа» всегда предпринимает шаги в пользу игрока I. Это критерий крайнего оптимизма, игрок I при этом рассчитывает на 100% везение. Использование данного критерия оправдано в следующей ситуации:
Правило выбора решения в соответствии с максиминным критерием (ММ-критерием) можно интерпретировать следующим образом:
Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой минимальное значение выигрыша в соответствующей стратегии ЛПР (9):
Wi
= minj aij (9)
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой минимальное значение выигрыша максимально (10):
W = max Wi (10)
Выбранная
таким образом стратегия
Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:
Величина (amax j – aij ), где amax j - максимальный элемент j – го столбца, может быть интерпретирована как дополнительный выигрыш, получаемый в условиях состояния окружающей среды Sj при выборе ЛПР наиболее выгодной стратегии, по сравнению с выигрышем, получаемым ЛПР при выборе в тех же условиях любой другой стратегии. Эта же разность может быть интерпретирована как величина возможного проигрыша при выборе ЛПР I – й стратегии по сравнению с наиболее выгодной стратегией. На основе данной интерпретации разности выигрышей производится определение наиболее выгодной стратегии по критерию минимаксного риска.
Для
определения оптимальной
rij = amax j – aij (11)
Матрица рисков дополняется столбцом, содержащим максимальные значения коэффициентов rij по каждой из стратегий ЛПР (12):
Ri = maxj rij (12)
Оптимальной по данному критерию считается та стратегия, в которой значение Ri минимально (13):
W = min Ri (13)
Ситуация, в которой оправдано применение критерия Сэвиджа, аналогична ситуации ММ-критерия, однако наиболее существенным в данном случае является учёт степени воздействия фактора риска на величину выигрыша.
В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска. Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале [0;1] и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма. Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях.
Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле (14):
Wi = C×minj aij + (1-C) ×maxj aij (14),
где C – коэффициент пессимизма.
Оптимальной по данному критерию считается стратегия, в которой значение Wi максимально (15):
W = max Wi (15)
При С=1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий “азартного игрока”, делающего ставку на то, что «выпадет» наилучший случай.
Критерий Гурвица применяется в ситуации, когда:
Этот критерий опирается одновременно на ММ-критерий и критерий максимального математического ожидания выигрыша. При определении оптимальной стратегии по этому критерию вводится параметр достоверности информации о распределении вероятностей состояний окружающей среды, значение которого находится в интервале [0, 1]. Если степень достоверности велика, то доминирует критерий максимального математического ожидания выигрыша, в противном случае – ММ-критерий.
Платёжная матрица дополняется столбцом, коэффициенты которого определяются по формуле (16):
где u – параметр достоверности информации о вероятностях состояний окружающей среды.
Оптимальной по данному критерию считается та стратегия, в которой значение Wi максимально (17):
W = max Wi (17)
Данный критерий применим в следующем случае:
2 Приведение матричных игровых задач в смешанных стратегиях к задачам ЛП
Информация о работе Понятие игровых моделей и их использование для решения управленческих задач