Лекции по «Теория принятия решений»

Автор работы: Пользователь скрыл имя, 30 Марта 2013 в 22:01, курс лекций

Описание работы

Сегодня, как показывает практика широко распространенное мнение о том, что достаточно иметь хорошее программное обеспечение (ПО) из соответствующей области, чтобы с успехом приступить к решению практических задач, оказывается принципиально неверным. В простейших случаях трудностей может и не быть, но в таких алгоритмически сложных областях, как принятие решений, управление, системное проектирование и т.д., ситуация совершенно иная.
Наличие хорошего ПО в соответствующей организации или фирме и хороших аппаратных средств – это лишь необходимое, но не достаточное условие. Кроме этого, совершенно обязательной является высокая профессиональная подготовка лица, принимающего решение (ЛПР). Это не обязательно глава фирмы, им может быть специальный человек (так называемый системный аналитик) или группа лиц – отдел системного анализа.

Файлы: 1 файл

Материал по ТПР.doc

— 658.00 Кб (Скачать файл)

Прежде всего, это экономика, где исследуются проблемы разумного, рационального использования ограниченных ресурсов потребителем и производителем.

Этот термин активно  используется в когнитивной психологии. Психологи давно изучают особенности человеческой системы переработки информации.

Рассматриваются гипотезы о том, как влияет организация  человеческой памяти на ППР. Психологи стремятся определить границы человеческих возможностей в задачах выбора.

В науке – политологии  одним из главных объектов изучения является механизм принятия лидерами политических решений.

«Принятие решений» - один из основополагающих терминов в научном направлении, известном под названием «исследование операций». С помощью методов исследования операций разрабатываются модели, описывающие объективную реальность, определяется единственный критерий оптимальности решения, рассчитывается оптимальное решение. Существенное отличие проблем принятия решения от проблем исследования операций состоит в наличии многих критериев оценки качества решения. Компромисс между критериями может быть найден только на основе предпочтений ЛПР. Существует особый класс задач ПР, в которых модели имеют объективный характер, но качество решений оценивается по многим критериям. Эти задачи могут быть названы многокритериальными задачами с объективными моделями. Они находятся на границе между исследованием операций и принятием решений.

Принятие решений является одним из направлений прикладной математики. Ставятся и решаются задачи обоснования свойств функции полезности в зависимости от тех или иных условий, накладываемых на правила выбора.

Слова «принятие решений» можно встретить и в зоологии, когда исследуются проблемы естественного отбора среди представителей животного мира и растений.

Термин «принятие решений» является центральным для искусственного интеллекта. В рамках этого направления создаются различные компьютерные системы, имитирующие поведение людей при решении тех или иных проблем.

В информатике и вычислительной технике в последнее время уделяется большое внимание построению систем поддержки ПР, помогающих человеку в задачах выбора.

Рассмотрение процессов  и проблем ПР в различных научных  дисциплинах вполне оправдано. Центральным для этих проблем является сам акт выбора человеком одного из вариантов решений.

Основным предметом  в науке о принятии решений  является исследование процесса выбора. Она изучает, как человек принимает решения и как следует ему в этом помогать, создавая специальные методы и компьютерные системы.

Итак, принятие решений  – это прикладная научная дисциплина. Создание методов принятия решений требует рассмотрения математических, психологических и компьютерных проблем

В связи с этим, в  развитии ПР как научного направления  принимают участие математики, психологи, политологи, специалисты по искусственному интеллекту, теории организаций, информатике, вычислительной технике.

 

Тема 4. Аксиоматические  теории рационального поведения.

 

           1.Рациональный выбор в экономике.

 

Задача выбора  является одной из центральных в экономике. Два основных действующих лица в экономике – покупатель и производитель – постоянно вовлечены в процесс выбора.

Потребитель решает, что покупать и за какую цену. Производитель  решает, во что вкладывать капитал, какие товары следует производить и др.

Основное допущение экономической  теории состоит в том, что человек  делает рациональный выбор. Рациональный выбор означает предположение, что решение человека является результатом упорядоченного процесса мышления. Для определения этого понятия в строго математической форме выводятся аксиомы рационального поведения.

При условии, что аксиомы справедливы, доказывается, что существует некая  функция, устанавливающая человеческий выбор – функция полезности.

Под полезностью будем понимать величину, которая в процессе выбора максимизирует личность с рациональным экономическим мышлением. Иначе говоря – полезность – это воображаемая мера психологической и потребительской ценности различных благ.

С содержательной точки зрения делается предположение, что человек оценивает различные альтернативы и выбирает из них ту, полезность которой больше.

ЗПР с рассмотрением полезностей  были первыми, которые привлекли  внимание исследователей. Постановка таких задач заключается в  следующем: человек выбирает какие-то действия, где на получаемый результат (исход) действия влияют случайные события, неподвластные человеку, но, имея некоторые знания о вероятностях этих событий, человек может рассчитывать наиболее выгодную совокупность и очерёдность своих действий. Человек, который следует аксиомам рационального выбора, называется в экономике рациональным человеком.

 

  1. Аксиомы рационального поведения.

 

Через x, у, z различные исходы (результаты) процесса выбора, а через

p, q – вероятности тех или иных исходов.

Лотереей называется игра с двумя  исходами: исходом x, получаемым с вероятностью p, и исходом y, получаемым с вероятностью (1-p) ( рис.1)

 p X


 


                                                         Рис.1.    Лотерея с двумя исходами.

 

1-p Y 

 

Ожидаемая (или средняя цена) лотереи  определяется по формуле 

p x+(1-p)y.

Приведем аксиомы рационального выбора:

Аксиома 1. Пусть P означает строгое предпочтение (похожие на > в математике); R – не строгое предпочтение (похожее на ³); I – безразличие (похожее на =). Аксиома 1.  требует выполнения 2-х условий:

  1. связности: либо x R y, либо y R x, либо и то и другое вместе;

2)  транзитивности: из x R y и y R x следует x R z

Аксиома 2. Если x I y, то (x, p, z) I (y, p, z)  (через (x, p, y) обозначается лотерея на рис.1).

Аксиома 3. Если x P y, то x P (x, p, y) P y

Аксиома 4. Если x P y P z , то существует вероятность p, такая, что

y I (x, p, z).

Аксиомы, приведенные выше достаточно просты для понимания.

В предположении, что они выполняются, имеет место теорема, которая гласит, что существует числовая функция полезности

U, определенная на множестве исходов и такая, что:

    1. x R y тогда и только тогда, когда U (x) ³ U(y)
    2. U (x, p, y) = p U(x) + (1-p) U(y)

 

         3.   Деревья решений

 

Для представления своих  возможных действий и для нахождения последовательности правильных решений используется дерево решений.

Рассмотрим пример задачи с вазами. Экспериментатор случайно выбирает вазу из множества ваз, содержащего 700 ваз 1-го типа и 300 ваз 2-го типа. Если перед испытуемым находится ваза 1-го типа и он угадает это, то он получит выигрыш 350 у.е., если не угадает, то его проигрыш составит 50 у.е. Если перед ним ваза 2-го типа и он это угадает, то получит выигрыш 500 у.е., если не угадает, его проигрыш составит 100 у.е. Испытуемый может предпринять одно из следующих действий: d1 – сказать, что ваза 1-го типа; d2 – сказать, что ваза 2-го типа.

Условия задачи можно представить  в таблице 1.

                                                                                                         Таблица 1.

Тип вазы

Вероятность выбора вазы данного типа

Действия и выигрыш

d1

d2.

1

0.7

350

-100

2

0.3

-50

500


 

Какое действие предпринять человеку?

На основе теории полезности для  этого необходимо оценить среднюю (ожидаемую) полезность каждого из действий и выбрать действие с максимальной ожидаемой полезностью. Оценка полезности дает:

U (d1) = 0.7 *350 – 0.3 * 50 = 230 y.e.

U (d2) = 0.3 *500 – 0.7 * 100 = 80 y.e.

Следовательно, разумный человек выберет  действие d1, а не действие d2.

Отсюда следует общий рецепт действий для рационального человека: для каждого действия определить ожидаемую полезность и выбрать  действие с наибольшей полезностью.

Таблица 1. может быть представлена в виде дерева решений .

Дерево решений удобно использовать для представления своих возможных действий и для нахождения последовательности правильных решений, ведущих к максимальной ожидаемой полезности.

 

4. Парадокс Алле

Рассмотрим две лотереи, представленные на рис. 2.

 

 


            1 млн.                                                     0,1          5 млн.

           А                                                             С


0,1 5 млн. 0,9 0

                                  

В   0,89 0,11 1 млн.

                          1 млн. D

0,01                                                        0,89

                               0 0

 

Рис. 2. Парадокс Алле

 

Обозначим: U ( 5млн )=1;  U(1млн ) =U;   U (0) = 0.

В левой лотереи есть выбор между действиями А (получить 1 млн.) и В (согласиться на лотерею). В экспериментах подавляющее большинство людей предпочитает А. Откуда следует  

U > 0.1*1 + 0.89*U + 0.01*O     или    U > 10/11

В правой лотерее есть выбор между действиями С и D (две лотереи). Подавляющее большинство людей предпочитает действие С (почти та же вероятность проиграть, но выигрыш больше). Тогда

0.1*1 + 0.9*O > 0.11*U + 0.89*O   т.е.     U < 10/11.

Совершая такой выбор, люди действуют не в соответствии с функцией полезности. Полученный парадокс носит название парадокса  Алле.

Рассмотрим ещё пример. Две лотереи, показанные на рис.3 имеют одинаковые средние цены.

 0,5              44


0,6 50  


0,4               -20 0,5 0

 

Рис. 3. Сравнение 2-х лотерей

 

0.6*50 + 0.4* (-20) = 22

0.5*44 + 0.5 * 0 = 22.

Однако предъявление различным группам лотерей показало, что люди предпочитают правую лотерею, где при той же средней цене риск проигрыша исключен. Эти и другие примеры говорят о нерациональном поведении людей в задачах принятия решений.

 

5. Нерациональное поведение. Эвристики.

 

Один из наиболее известных примеров нерационального поведения людей – «дилемма  генерала». Генерал потерпел поражение в войне и хочет вывести свои войска (600 чел.) с территории противника. У него есть две возможные дороги с возможными потерями при выборе каждой из них. Данные о дорогах и возможных потерях представлены на рис. 4.


200 чел. спасены

                   

600 чел                                          Р= 1/3            600 чел. спасены

 

 

   Р= 2/3               0 чел. спасены

 

Рис. 4. Дилемма генерала

 

Большинство людей рассматривающих  дилемму выбирают первую дорогу, стараясь избежать лотереи, когда в одном из исходов погибает весь личный состав соединения.

Но эта же дилемма  была представлена используемым в ином виде (рис. 5.)


400 чел. погибнут

600 чел.                                    

                                     Р= 1/3            никто не погибнет

 

 

                                   Р= 2/3            все 600 чел. погибнут

 

 

 

Рис. 5. Иное представление дилеммы генерала

 

Теперь уже большинство испытуемых выбирает вторую дорогу, т. к. на ней с вероятностью р = 1/3 можно спасти все соединение. Легко видеть, что лотереи на рис. 4 и 5 эквивалентны.

Эти и другие примеры  демонстрируют отклонение поведения  людей от рационального поведения, определяют эвристики, которые используются при принятии решений. Перечислим наиболее известные эвристики.

 

1. Суждение по представительности.

Люди часто судят  о вероятности того, что объект А принадлежит к классу В только по похожести А на типовой объект класса В. Они почти не учитывают априорные вероятности, влияющие на эту принадлежность.

2. Суждение по встречаемости.

Люди часто определяют вероятности событий по тому, как  часто они сами сталкивались с этими событиями и насколько важными для них были эти встречи.

3. Суждение по точке отсчета.

Если при определении  вероятностей используется начальная  информация как точка отсчета, то она существенно влияет на результат.

4. Сверхдоверие.

Людям свойственно чрезмерно  доверять своим суждениям, особенно в случаях, когда они выносят суждения о прошлых событиях.

5. Стремление к исключению риска.

Люди стремятся исключить  альтернативы связанные с риском.

 

6.Объяснения отклонений от рационального поведения.

 

Признание нерациональности человеческого поведения привело к поиску его причин, основными из которых являются:

-Недостаток информации  у ЛПР в процессе выбора

Информация о работе Лекции по «Теория принятия решений»