Автор работы: Пользователь скрыл имя, 27 Ноября 2012 в 11:27, реферат
Заключенным не разрешается общаться друг с другом. Ситуация объясняется каждому из них отдельно. Если оба признаются, то обоим выносится приговор за кражу со взломом и они приговариваются к двум годам тюрьмы. Если никто из них не признается, то обоим выносится приговор за хранение краденого и они получат по шесть месяцев тюрьмы. Если только один из них признается, то он не будет наказан, в то время как другому выносится приговор на основании свидетельских показаний напарника и он получает максимальное наказание — пять лет тюрьмы.
Дилемма заключенного
Игра, названная А. Таккером «дилеммой заключенного», безусловно, привлекла широкое: внимание по той причине, что она вызвала сомнения в универсальной применимости так называемого принципа обеспеченного успеха как принципа принятия рациональных решений.
Эту игру можно проиллюстрировать следующей ситуацией. Два человека пойманы с крадеными вещами, они подозреваются в краже со взломом, но для вынесения приговора по этому преступлению нет достаточных оснований, если один из них или оба не признаются. Однако им можно вынести приговор за хранение краденого, что является менее серьезным нарушением закона.
Заключенным не разрешается общаться друг с другом. Ситуация объясняется каждому из них отдельно. Если оба признаются, то обоим выносится приговор за кражу со взломом и они приговариваются к двум годам тюрьмы. Если никто из них не признается, то обоим выносится приговор за хранение краденого и они получат по шесть месяцев тюрьмы. Если только один из них признается, то он не будет наказан, в то время как другому выносится приговор на основании свидетельских показаний напарника и он получает максимальное наказание — пять лет тюрьмы.
В интересах каждого из заключенных признаться в содеянном. Ведь если его напарник признается, это закончится двухлетним заключением, в то время как непризнание приведет к пятилетнему сроку. Если же напарник не признается, то непризнание ведет к шестимесячному заключению, в то время как признание дает свободу. Таким образом, «признание» является доминирующей стратегией, то есть такой, которая приносит более предпочтительный результат независимо от стратегии, использованной партнером. Можно сказать, что выбор доминирующей стратегии диктуется «принципом обеспеченного успеха». Тем не менее, если оба участника, ведомые «принципом обеспеченного успеха», сознаются, то оба они окажутся в худшем положении (с двухлетним сроком заключения), чем если бы оба они не сознались и получили шестимесячный срок.
В указанном смысле «дилемма
заключенного» может
Обобщенная для случая более двух участников (игроков), «дилемма заключенного» становится вариантом так называемой «общинной трагедии» В интересах каждого отдельного фермера добавить еще одну корову к своему стаду, пасущемуся на общественном пастбище. Но если каждый фермер будет следовать своим индивидуальным интересам, то пастбище может быть «перегружено», от чего проиграют все. Чрезмерные уловы каждой стремящейся к выгоде страны, занимающейся коммерческим рыболовством, — по существу, «общинная трагедия» в современном виде.
Многие ситуации в обществе
характеризуются аналогичным
Поскольку требования индивидуальной и коллективной рациональности противоречат друг другу, нормативная теория принятия решений в ситуациях подобного типа становится неоднозначной. Естественно, усилия исследователей обращаются на проблему создания дескриптивной теории, нацеленной на описание (и, если возможно, предсказание) того, как люди, встретившиеся с дилеммами подобного типа, действительно принимают решения при тех или иных обстоятельствах.
По мере того как в пятидесятые годы быстро развивалась экспериментальная социальная психология, «дилемма заключенного» стала любимым экспериментальным инструментом исследователей. Она дала им возможность собирать большие массивы данных при сравнительно небольших усилиях. Кроме того, все эти данные «надежны», поскольку дихотомия между выбором кооперативной стратегии в «дилемме заключенного» (С) и отказом от нее (D) однозначна. Частоты выбора этих альтернатив стали главными зависимыми переменными в экспериментах, в которых следовало выбрать между действиями в индивидуальных или коллективных интересах. Независимые переменные включают индивидуальные характеристики игроков (пол, род занятий, национальность, тип личности), условия, в которых решения были приняты (предшествующий опыт, возможности для коммуникации), характеристики поведения партнера, связанные с исходами игры платежи. (см.: Rapoport, GuyerandGordon, 1976, chs. 9, 15, 18, 19).
«Дилемма заключенного» в исследованиях обычно представляется в форме матрицы 2x2, строки которой С, и Dx представляют возможные решения первого игрока, а столбцы С2 и D2 — возможные решения второго. Решения игроков обычно принимаются независимо друг от друга. Таким образом, четыре ячейки матрицы соответствуют четырем возможным результатам игры: С,С2, CXDV D{C2 и DXD2. Каждая ячейка содержит два числа, первое из которых показывает платеж «Строке», то есть игроку, выбирающему между С, и Dv а второе — платеж «Столбцу» то есть игроку, который выбирает между С2 и D2. Величины платежей таковы, что стратегия (выбор) D каждого игрока доминирует над стратегией С. Проблема выбора решения видится как дилемма, поскольку оба игрока предпочитают результат С, С2 результату DXD2; но выбор стратегии С означает отказ от возможного получения преимущества над другим игроком, если бы он выбрал С, или получения наихудшего из четырех платежей, если соперник выберет D.
Эксперименты обычно проводятся в одном из трех форматов:
1) единственная игра, где каждый игрок принимает только одно решение;
2) повторяющаяся игра, в
которой пара игроков
3) повторяющаяся игра
против «запрограммированного»
игрока, где решения партнера
данного субъекта являются
Цель единственной игры —
в том, чтобы увидеть, как делают
выбор различные субъекты, когда
отсутствует возможность
Выводы, полученные на основе
экспериментов с «дилеммой
Больший интерес представляет динамика повторяющейся игры. Обычно частота выбора кооперативной стратегии, усредненная по большому числу субъектов, сначала убывает, отражая разочарование неудачными попытками установить сотрудничество. Если игра продолжается достаточно долго, то средняя частота кооперативной стратегии в конечном счете увеличивается, отражая установление молчаливого соглашения между игроками. Полученная асимптотическая частота кооперативной стратегии представляет собой только среднее значение, но не моду распределения. Обычно игроки приходят либо к исходу С, С2 либо к исходу DXD2 (RapoportandChammah, 1965).
Бимодальность наблюдается и в повторяющихся играх против запрограммированного игрока, который «настроен» на кооперативную стратегию. Приблизительно половина наблюдаемых субъектов «отвечает» на это сотрудничество тем же, в то время как другая половина пытается его использовать с целью получения максимального платежа.
Сравнение результатов различных
программируемых стратегий в
повторяющейся игре показало, что
так называемая стратегия взаимности
«как ты мне, так и я тебе» оказалась
наиболее эффективной для установления
сотрудничества между субъектами. Эта
стратегия начинает с выбора С
и далее повторяет выбор
Возможно, наиболее интересный
результат экспериментов с
На первый взгляд, неявное соглашение рационально для повторяющейся игры, поскольку «измена», как можно предположить, вызовет ответную «враждебную позицию» в целях «самозащиты», поскольку другой игрок стремится избежать наихудшего исхода, связанного с предложенным, но отвергнутым сотрудничеством. Тем не менее, этот аргумент не относится к игре, о которой известно, что она последняя, поскольку за ней не может последовать расплата. Таким образом, D доминирует над С в последней игре, и согласно «принципу обеспеченного успеха» результат DlD2 является предопределенным. Это переключает внимание на игру, предшествующую последней, которая теперь, по сути, сама есть «последняя игра» и к которой теперь может быть применена та же аргументация. И так далее. Таким образом, строгий стратегический анализ показывает, что стратегия, состоящая из D для всех повторений игры, — единственно рациональная независимо от числа повторений.
Индукция «от конца» не может быть проведена, если количество повторений бесконечно, неизвестно или определено стохастически. В таких случаях, если вероятность завершения игры не слишком велика, индивидуальная рациональность не обязательно диктует 100%-е использование стратегии D. Естественно, возникает вопрос о сравнительных достоинствах различных стратегий в повторяющейся игре типа «дилеммы заключенного». Этот вопрос рассмотрен эмпирически в работе Аксельрода (Axelrod, 1984).
Лиц, заинтересованных в этой проблеме, попросили представить программы для проведения двухсотшаговой игры типа «дилеммы заключенного». Каждая программа должна была «сыграть» с каждой другой представленной программой, включая саму себя. Программа с самой большой суммой полученных платежей объявлялась победителем конкурса.
Было предложено 15 программ, и среди них — программа со стратегией «взаимности». Она и получила самую высокую оценку. Был объявлен второй конкурс, на этот раз со стохастическим завершением, при ожидаемом числе итераций около 150. Одновременно с приглашением к участию во втором конкурсе были оглашены результаты первого конкурса вместе с полными описаниями представленных программ. На этот раз было подано 63 программы из шести стран. Программа со стратегией «взаимности» вновь была среди них (предложенная тем же конкурсантом и никем другим), и она снова получила самую высокую оценку.
Интересная особенность
этого результата состояла в том,
что выигравшая стратегия не «победила»
ни одну программу, против которой она
играла. Действительно, она не может
победить ни одну программу, поскольку
единственный путь получить более высокую
оценку, чем партнер, состоит в
применении большего, чем он, числа
стратегий D, чего, по определению, стратегия
«взаимности» не может сделать. Она
может только сыграть вничью либо
проиграть, но не более чем одну игру.
Из этого следует, что стратегия
«взаимности» получила самую высокую
оценку, потому что другие программы,
очевидно, разработанные так, чтобы
победить своих оппонентов, каждый
раз сокращали выигрыш обоих
партнеров, включая свой собственный.
Результаты этих конкурсов могут
быть проинтерпретированы как
Поддержка последнего вывода пришла из такого отчасти неожиданного источника, как приложения игровых концепций в теории эволюции (MaynardSmith, 1982; Rapoport, 1985). До недавних пор игровыми моделями, использовавшимися в теоретической биологии, были так называемые игры против природы (см., например, работу:Lewontin, 1961). «Выбор стратегии» был представлен появлением определенного генотипа в популяции, живущей в стохастической среде. Степень адаптации к среде выражалась в относительном воспроизводственном успехе данного генотипа, т.е. статистически ожидаемой численности потомства, доживающего до репродуктивного возраста. В данном случае популяция эволюционировала наилучшим образом приспособленному генотипу.