Автор работы: Пользователь скрыл имя, 04 Февраля 2011 в 15:29, шпаргалка
Работа содержит ответы к Госам по дисциплине "Бухгалтерский учет".
Очень часто в экономических задачах приходится принимать решение поэтапно, шаг за шагом, а не дискретно и разово, как например в задачах ЛП. В этом случае применяют так называемое динамическое программирование (ДП).
Метод ДП основан на принципе оптимальности Беллмана и бал впервые опубликован в начале 60-х годов.
Принцип заключается в том, что каково бы ни было состояние системы s в результате какого-либо числа шагов, мы должны выбрать управление на ближайшем шаге так, чтобы в совокупности с оптимальным управлением на всех последующих шагах оно приводило к максимальному выигрышу на всех шагах, включая данный.
V0 – начальная скорость, h0 – начальная высота.
Самолет должен достичь hкон и vкон.
Для простоты будем считать, что: интервалы скорости и высот разбиты на равные части, и самолет может на каждом отдельном разбиении набирать либо скорость, либо высоту.
Считаем известным расход горючего при изменении скорости «на одну клетку» и изменении высоты «на одну клетку».
Необходимо найти такую траекторию движения, что суммарный расход горючего наименьший.
Понятно,
что суммарный расход горючего определяется
сложением соответствующих
Таким
образом, целевая функция является
аддитивной. Если есть аддитивность, то
есть ДП и если нет аддитивности, то нет
и ДП.
Самым
важным в ДП является этапирование
процесса. ДП состоит из двух частей:
обратного хода и прямого хода.
Процесс рассматривается с
Теперь осуществляется прямой ход. Начав движение с начальной точки (v0, h0) мы должны двигаться на каждом отрезке по условно оптимальным направлениям, выявляя оптимальную траекторию. Такой путь – единственный.
В ДП условно оптимальное управление часто выбирается из так называемой «розы направлений».
Пусть W – показатель эффективности всего процесса и пусть ji – показатель эффективности на i-ом шаге. Аддитивность критерия будет означать W = Sji .
Пусть Хi – переменная, от которой зависит выигрыш на i-ом шаге (управление). В нашей задаче это были «вправо-вверх». При выборе шагового управления необходимо учитывать возможные исходы предыдущего и влияние выбираемого управления на все оставшиеся до конца процесса.
Пусть S – состояние системы (у нас это были 2 координаты: vi и hi).
С введенными
обозначениями тесно связано
само состояние математической модели.
Всего можно выделить 7 этапов:
(*) Wm(s) = max{jm (si, xm)}, xmÎX.
(**) Wi(s) = max
{ji
(si, xi) + Wi+1(f(si, xi))}
Задача
о распределении
инвестиций между
m предприятиями с целью
обеспечения максимальной
суммарной прибыли.
Инвестор выделяет D средств, которые должны быть распределены между m предприятиями, каждое из которых приносит прибыль ji (x), где х – количество вкладываемых в него средств.
Нужно определить оптимальное распределение инвестиций дабы получить максимальную суммарную от всех предприятий прибыль W.
Обозначим: W* - оптимальная
прибыль, Х* - оптимальное распределение
средств.
Построение математической модели:
На последнем шаге перед инвестированием средств в последнее предприятие (а мы начинаем с последнего предприятия) условное оптимальное управление соответствует количеству средств, имеющихся в наличии. То есть сколько средств осталось, столько надо вложить в последнее предприятие. Условный оптимальный выигрыш равен доходу, приносимому последним предприятием.
Функциональное уравнение примет вид:
Wi(s) = max{ji (x) + Wi+1(s - x)}, xÎs, Wi(s) – выигрыш на i-м шаге.
Пояснения:
Перед i-м шагом у инвестора осталось s условных единиц, тогда эти xi условных единиц он может вложить в i-е предприятие, при этом получаем доход ji (x), а остальные s – x единиц в остальные предприятия с (i+1)-го до m-го.
Условный оптимальный выигрыш - Wi+1(s-x).
Оптимальным будет такое вложение, когда сумма в фигурных скобках будет максимальной.