Динамическое программирование

Автор работы: Пользователь скрыл имя, 27 Сентября 2011 в 10:26, курсовая работа

Описание работы

Целью исследования методов является выявление наилучшего способа действия при решении той или иной задачи. Главная роль при этом отводится математическому моделированию. Для решения математических моделей предназначены различные математические методы. Среди них метод динамического программирования, рассмотренный в данной работе.

Содержание работы

ВВЕДЕНИЕ…………………………………………………………………..3

I. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ……………………………………………..5

1.1. Задача динамического программирования ………………………..5

1.2. Примеры задач динамического программирования………………9

1.3. Общая структура динамического программирования……………13

1.4. Понятие о методе ветвей и границ………………………………….15

II.ПРАКТИЧЕСКАЯ ЧАСТЬ………………………………………………21

2.1.Применение метода ветвей и границ для задач календарного планирования ……………………………………………………………….21

ЗАКЛЮЧЕНИЕ………………………………………………………………27

Библиографический список………………………………………………..28

Файлы: 1 файл

Курсовая работа.Математические методы.Филиппов.doc

— 289.00 Кб (Скачать файл)

    Рекуррентное  уравнение динамического программирования представляется в виде 

    

    где

    Вычисления  начинаются с этапа n при xn=bn и заканчиваются на этапе 1.  

    Задача  замены оборудования:

    Чем дольше механизм эксплуатируется, тем  выше затраты на его обслуживание и ниже его производительность. Когда  срок эксплуатации механизма достигает определенного уровня, может оказаться более выгодной его замена. Задача замены оборудования, таким образом, сводится к определению оптимального срока эксплуатации механизма.

    Предположим, что мы занимаемся заменой механизмов на протяжении n лет. В начале каждого года принимается решение либо об эксплуатации механизма еще один год, либо о замене его новым.

    Обозначим через r(t) и c(t) прибыль от эксплуатации t-летнего механизма на протяжении года и затраты на его обслуживание за этот же период. Далее пусть s(t) – стоимость продажи механизма, который эксплуатировался t лет. Стоимость приобретения нового механизма остается неизменной на протяжении всех лет и равна l.

    Элементы  модели динамического программирования таковы:

  1. Этап і представляется порядковым номером года і, і=1,2,...n.
  2. Вариантами решения на і-м этапе (т.е. для і-ого года) являются альтернативы: продолжить эксплуатацию или заменить механизм в начале і-ого года.
  3. Состоянием на і-м этапе является срок эксплуатации t (возраст) механизма к началу і-ого года.

    Пусть fi(t)-максимальная прибыль, получаемая за годы от і до n при условии, что в начале і-ого года имеется механизм t-летнего возраста.

    Рекуррентное  уравнение имеет следующий вид: 

    

    (1)-если  эксплуатировать механизм,

    (2)-если  заменить механизм. 

    Задача  инвестирования:

    Предположим, что в начале каждого из следующих n лет необходимо сделать инвестиции P1, P2,…, Pn соответственно. Вы имеете возможность вложить капитал в два банка: первый банк выплачивает годовой сложный процент r1, а второй - r2. Для поощрения депозитов оба банка выплачивают новым инвесторам премии в виде процента от вложенной суммы.

    Премиальные меняются от года к году, и для  і-ого года равны qi1 и qi2 в первом и втором банках соответственно. Они выплачиваются к концу года, на протяжении которого сделан вклад, и могут быть инвестированы в один из двух банков на следующий год. Это значит, что лишь указанные проценты и новые деньги могут быть инвестированы в один из двух банков. Размещенный в банке вклад должен находится там до конца рассматриваемого периода. Необходимо разработать стратегию инвестиции на следующие n лет.

    Элементы  модели динамического программирования следующие:

  1. Этап і представляется порядковым номером года і, і=1,2,...n
  2. Вариантами решения на і-м этапе (для і-ого года) являются суммы li и инвестиций в первый и второй банк соответственно.
  3. Состоянием xi на і-м этапе является сумма денег на начало і-ого года, которые могут быть инветсированы.

    Заметим, что по определению  =xi-li. Следовательно,

    где і=2,3,…n, x1=P1. Сумма денег xi, которые могут быть инвестированы, включает лишь новые деньги и премиальные проценты за инвестиции, сделанные на протяжении (і-1)-го года.

    Пусть fi(xi)- оптимальная сумма инвестиций для интервала от і-го до n-го года при условии, что в начале і-го года имеется денежная сумма xi. Далее обозначим через si накопленную сумму к концу n-го года при условии, что li и (xi-li)-объемы инвестиций на протяжении і-го года в первый и второй банк соответственно. Обозначая , і=1,2, мы можем сформулировать задачу в следующем виде.

    Максимизировать z=s1+s2+…+sn, где

    

    Так как премиальные за n-й год являются частью накопленной денежной суммы от инвестиций, в выражения для sn добавлены qn1 и qn2.

    Итак, в данном случае рекуррентное уравнение для обратной прогонки в алгоритме динамического программирования имеет вид 

    

    где xi+1 выражается через xi в соответствии с приведенной выше формулой, а fn+1(xn+1)=0. 

 

    1.3 Общая структура  динамического программирования 

    Отыскание оптимальной стратегии принятия набора последовательных решений, в  большинстве случаях, производится следующим образом: сначала осуществляется выбор последнего во времени решения, затем при движении в направлении, обратном течению времени, выбираются все остальные решения вплоть до исходного.

    Для реализации такого метода необходимо выяснить все ситуации, в которых может происходить выбор последнего решения. Обычно условия, в которых принимается решение, называют «состоянием» системы. Состояние системы – это описание системы, позволяющее, учитывая будущие решения, предсказать ее поведение. Нет необходимости выяснять, как возникло то ил иное состояние или каковы были предшествующие решения. Это позволяет последовательно выбирать всего по одному решению в каждый момент времени. Независимо от того, отыскивают оптимальные решения с помощью табличного метода и последующего поиска или аналитическим путем, обычно быстрее и выгоднее производить выбор по одному решению в один момент времени, переходя затем к следующему моменту и т.д. К сожалению, таким методом можно исследовать не все процессы принятия решений. Необходимым условием применения метода динамического программирования является аддитивность цен всех решений, а также независимость будущих результатов от предыстории того или иного состояния.

    Если  число решений очень велико, то можно построить относительные оценки состояний так, чтобы оценки, отвечающие каждой паре последовательных решений, отличались друг от друга на постоянную величину, представляющую собой средний «доход» на решение. Также можно выполнять дисконтирование доходов от будущих решений. Необходимость в этом иногда появляется в том случае, когда решение принимаются редко, скажем раз в году. Тогда уже не нужно рассматривать последовательно 1,2,3…решения, чтобы достичь решения с большим номером. Вместо этого можно непосредственно оперировать функциональным уравнением, что, как правило, дает существенную выгоду с точки зрения сокращения объема вычислений. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    1.4. Понятие о методе ветвей и границ

  Метод ветвей и границ — один из комбинаторных  методов. Его суть заключается в  упорядоченном переборе вариантов  и рассмотрении лишь тех из них, которые  оказываются по определенным признакам  перспективными, и отбрасывании бесперспективных вариантов.

  Метод ветвей и границ состоит в следующем: множество допустимых решений (планов) некоторым способом разбивается  на подмножества, каждое из которых  этим же способом снова разбивается  на подмножества. Процесс продолжается до тех пор, пока не получено оптимальное целочисленное решение исходной задачи.

  Алгоритм  решения:

  Первоначально  находим симплексным  методом  или  методом искусственного базиса оптимальный план задачи без учета  целочисленности переменных. Пусть  им является план X0. Если среди компонент этого плана нет дробных чисел, то тем самым найдено искомое решение данной задачи и Fmax = F(Xo).

  Если  же среди компонент плана X0 имеются дробные числа, то X0 не удовлетворяет условию целочисленности и необходимо осуществить упорядоченный переход к новым планам, пока не будет найдено решение задачи. Покажем, как это можно сделать, предварительно отметив, что F(X0) ³ F(X) для всякого последующего плана X.

  Предполагая, что найденный оптимальный план X0 не удовлетворяет условию целочисленности переменных, тем самым считаем, что среди его компонент есть дробные числа. Пусть, например, переменная приняла в плане X0 дробное значение. Тогда в оптимальном целочисленном плане ее значение будет по крайней мере либо меньше или равно ближайшему меньшему целому числу , либо больше или равно ближайшему большему целому числу + 1. Определяя эти числа, находим симплексным методом решение двух задач линейного программирования:

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

  Найдем  решение задач линейного программирования (I) и (II). Очевидно, здесь возможен один из следующих четырех случаев:

1.   Одна  из  задач  неразрешима,   а другая имеет целочисленный  оптимальный план. Тогда этот  план и значение целевой функции  на нем и дают решение исходной  задачи.

2. Одна из  задач неразрешима, а другая  имеет оптимальный план, среди компонент которого есть дробные числа. Тогда рассматриваем вторую задачу и в ее оптимальном плане выбираем одну из компонент, значение которой равно дробному числу, и строим две задачи, аналогичные задачам (I) и (II).

3. Обе  задачи разрешимы. Одна из задач имеет оптимальный целочисленный план, а в оптимальном плане другой задачи есть дробные числа. Тогда вычисляем значения целевой функции на этих планах и сравниваем их между собой. Если на целочисленном оптимальном плане значение целевой функции больше или равно ее значению на плане, среди компонент которого есть дробные числа, то данный целочисленный план является оптимальным для исходной задачи и он вместе со значением целевой функции на нем дает искомое решение.

Если  же значение целевой функции больше на плане, среди компонент которого есть дробные числа, то следует взять одно из таких чисел и для задачи, план которой рассматривается, необходимо построить две задачи, аналогичные (I) и (II).

4. Обе  задачи разрешимы, и среди оптимальных  планов обеих задач есть дробные числа. Тогда вычисляем значение целевой функции на данных оптимальных планах и рассматриваем ту из задач, для которой значение целевой функции является наибольшим. В оптимальном плане этой задачи выбираем одну из компонент, значение которой является дробным числом, и строим две задачи, аналогичные (I) и (II).

Таким образом, описанный выше итерационный процесс может быть представлен  в виде некоторого дерева, на котором  исходная вершина отвечает оптимальному плану Х0 задачи (1)-(3), а каждая соединенная с ней ветвью вершина отвечает оптимальным планам задач (I) и (II). Каждая из этих вершин имеет свои ветвления. При этом на каждом шаге выбирается та вершина, для которой значение функции является наибольшим. Если на некотором шаге будет получен план, имеющий целочисленные компоненты, и значение функции на нем окажется больше или равно, чем значение функции в других возможных для ветвления вершинах, то данный план является оптимальным планом исходной задачи целочисленного программирования и значение целевой функции на нем является максимальным.

Итак, процесс  нахождения решения задачи целочисленного программирования (1)-(4) методом ветвей и границ включает следующие основные этапы:

1°. Находят  решение задачи линейного программирования (1)-(3).

2°. Составляют  дополнительные ограничения для  одной из пере-менных, значение  которой в оптимальном плане  задачи (1)-(3) является дробным числом.

3°. Находят  решение задач (I) и (II), которые получаются из задачи (1)-(3) в результате присоединения дополнительных ограничений.

Информация о работе Динамическое программирование