Автор работы: Пользователь скрыл имя, 17 Мая 2011 в 04:21, курсовая работа
Целью работы является исследование вопросов принятия решения в условиях, когда выбор некоторой стратегии гарантирует получение результата с определенной вероятностью, и разработка программного модуля. Упрощение матрицы игры. Критерий Байеса. Критерий Лапласа. Критерий относительных значений вероятностей состояний природы с учетом выигрышей (рисков). Программа для расчета, интерфейс, код, пример.
В понятии оптимальной стратегии лежат различные соображения, составляющие содержание соответствующих критериев оптимальности стратегий.
Перед тем как переходить к выбору оптимальной стратегии, целесообразно возможности упростить матрицу А, уменьшив число строк на основании принципа доминирования стратегий игрока А.
Если какая-нибудь из стратегий игрока А окажется доминирующей каждую из остальных его стратегий, то она и должна выбираться игроком А в качестве предпочтительной, поскольку его выигрыш при этой стратегии и при любом состоянии природы П не меньше выигрыша при любой из остальных стратегий.
Если же матрица игры не обладает указанным свойством, т.е. у игрока А нет стратегии, доминирующей каждую из остальных его стратегий, то нужно посмотреть, нет ли у него доминируемых или дублирующих стратегий. При наличии таковых, соответствующие им строки матрицы можно удалить, уменьшив тем самым ее размерность.
Таким образом, в играх с природой можно и полезно пользоваться принципом доминирования стратегий игрока А (строк матрицы игры). Однако принцип доминирования стратегий (состояний) природы (столбцов матрицы игры) недопустим, поскольку природа не выбирает свои состояния с целью по возможности большего уменьшения выигрышей игрока А, для нее нет более или менее эффективных состояний.
Предположим, что статистик из прошлого опыта известны не только состояния Пj, j = l, ..., п, в которых может находиться природа П, но и соответствующие вероятности q1 , ..., qn с которым природа П реализует эти состояния. Тогда мы находимся в ситуации принятия решения в условиях риска.
Показателем
эффективности стратегии Аi
по критерию Байеса относительно выигрышей
называется среднее значение, или математическое
ожидание выигрыша i-й
строки с учетом вероятностей всех возможных
состояний природы. Обозначая это среднее
значение через āi, будем
иметь:
āi
= q1 ai1 + q2
ai2 + … + qn
ain =
, i=1, …,
m. (6)
Таким образом, at представляет собой взвешенное среднее выигрышей i-й строки, взятых с весами q1 , ..., qn.
Оптимальной
среди чистых стратегий по критерию Байеса
относительно выигрышей
считается стратегия Аi0
с максимальным показателем эффективности,
т.е. с максимальным средним выигрышем:
āi0 = max āi. (7)
1≤ i ≤m
Таким образом, выбранное решение по этому критерию является оптимальным не в каждом отдельном случае, а в среднем.
Распространим понятие показателя эффективности по критерию Байеса относительно выигрышей на смешанные стратегии игрока П.
Пусть P = ( p1 , ..., pn ) - некоторая смешанная стратегия игрока А, при которой чистая стратегия Аi используется им с вероятностью pi, i=1, ..., т. Тогда выигрыш игрока А при смешанной стратегии P = ( p1 , ..., pn ) и при состоянии природы Пj будет равен
H
(P, Пj) =
, j=1, …, n. (8)
Показателем эффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно выигрышей назовем среднее значение выигрышей, с учетом вероятностей q1 , ..., qn состояний природы. Обозначим этот показатель через .
Получим:
=
=
=
=
. (9)
Таким образом показатель эффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно выигрышей представляет собой взвешенное среднее показателей эффективности чистых стратегий Аi, i = l, ..., m, по тому же критерию с весами pi, i = l, ..., m.
Если, в частности, стратегия P = ( p1 , ..., pn ) является чистой стратегией Аk, k = l, ..., m, то pi = 0 i ≠ k, pk = 1, и ее показатель эффективности как смешанной стратегии , превращается в ее показатель эффективности как чистой стратегии āk, вычисляемый по формуле (6).
Пусть SA
- множество всех смешанных (в том числе
и чистых) стратегий игрока A. Оптимальной
среди всех стратегий множества
SA по критерию Байеса относительно
выигрышей назовем стратегию P0,
показатель эффективности (9) которой максимален:
max = . (10)
P
ϵ Sa
Стратегия Аi0 оптимальная среди чистых стратегий по критерию Байеса относительно выигрышей, является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA.
При принятии решений в условиях риска по критерию Байеса относительно выигрышей можно обойтись только чистыми стратегиями, не используя смешанные.
Рассмотрим
ту же игру с природой матрицей, в которой
известны вероятности состояний природы
q1 , ...,
qn.
При принятии решений в условиях риска
можно пользоваться не только средними
выигрышами, но и средними рисками. Составим
матрицу рисков для матрицы A, используя
формулу рисков (3)
Таблица 3 – Матрица рисков
Пj
Аi |
П1 | П2 | … | Пn |
А1 | r11 | r12 | … | r1n |
А2 | r21 | r22 | … | r2n |
… | … | … | … | … |
Аm | rm1 | rm2 | … | rmn |
Показателем неэффективности стратегии
Аi по критерию Байеса относительно
рисков называется среднее значение,
или математическое ожидание риска i-й
строки матрицы (таблица 3), вероятности
которых, очевидно, совпадают с вероятностями
состояний природы. Обозначим средний
риск при стратегии Аi через
ṝi, тогда
ṝi = q1
ri1 + q2
ri2 + … + qn
rin =
, i=1, …,
m. (11)
является взвешенной средней рисков i-й строки матрицы (таблица 3) с весами pi, i=1, ..., т.
Оптимальной
среди чистых стратегий по критерию Байеса
относительно рисков
является стратегия Пj, показатель
неэффективности (11) которой минимален,
т.е. минимален средний риск
ṝi0 = min ṝi. (12)
1≤
i ≤m
Определим
понятие риска при использовании игроком
А смешанной стратегии и при состоянии
природы Пj,
j = l, ..., п,
как разность
r (P, Пj) = [max H (U, Пj)] - H (P, Пj), j=1, …, n. (13)
U ϵ Sa
между максимальным выигрышем max H (U, Пj) при всех смешанных стратегиях U = ( u1 , ..., un ) ϵ SA и при состоянии природы Пj и выигрышем H (P, Пj) при смешанной стратегии P = ( p1 , ..., pn ) и при состоянии природы Пj.
В качестве
показателя неэффективности смешанной
стратегии P = ( p1
, ..., pn
) по критерию Байеса относительно
рисков рассмотрим взвешенную среднюю
рисков (13) с весовыми коэффициентами,
равными вероятностям q1
, ..., qn
состояний природы:
=
. (14)
Оптимальной среди всех смешанных (в том числе и чистых) стратегий по критерию Байеса относительно рисков будем считать стратегию P0, показатель неэффективности которой, вычисляемый по формуле (14), минимален:
min = . (15)
P ϵ Sa
Если Аi0 - стратегия, оптимальная среди чистых стратегий по критерию Байеса относительно рисков, то она является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA.
При принятии решения в условиях риска по критерию Байеса относительно рисков так же как и в случае критерия Байеса относительно выигрышей достаточно использовать одни чистые стратегии, не рассматривая смешанные.
Критерии Байеса относительно выигрышей и относительно рисков эквивалентны, т.е. если стратегия Аi0 является оптимальной по критерию Байеса относительно выигрышей, то она является оптимальной и по критерию Байеса относительно рисков, и наоборот, стратегия Аi0, оптимальная по критерию Байеса относительно рисков, оптимальна и по критерию Байеса относительно выигрышей.
В предыдущих двух критериях Байеса известные вероятности q1 , ..., qn состояний природы могли быть получены из статистических данных, отражающих многократное решение подобных задач, или в результате наблюдений за поведением природы. Однако, довольно часто складывается такая ситуация, когда мы лишены возможности определить вероятности состояний природы указанными способами. Желая все же принять решение в условиях риска, мы вынуждены оценить вероятности состояний природы субъективно. Существуют различные методы численной субъективной оценки степени правдоподобности состояний природы. Один из них состоит в том, что мы не можем отдать предпочтение ни одному из состояний природы, и потому считаем их равновероятными, т.е. q1 = .. .=qn = . Этот принцип называется «принципом недостаточного основания» Лапласа. На нем основан критерий Лапласа относительно выигрышей.
Показателем эффективности стратегии Аi по критерию Лапласа относительно выигрышей называется среднее арифметическое выигрышей i-й строки:
āi
=
, i=1, …,
m. (16)
Оптимальной среди чистых стратегий по критерию Лапласа относительно выигрышей считается стратегия Аi0 показатель эффективности, кот-
орой, вычисляемый по формуле (16), максимален, т.е. āi0 = max āi.
1≤ i ≤m
Очевидно, что критерий Лапласа относительно выигрышей есть частный случай критерия Байеса относительно выигрышей при q1 = .. .=qn = . Поэтому все утверждения на счет критерия Байеса относительно выигрышей, остаются в силе и для критерия Лапласа относительно выигрышей.