Автор работы: Пользователь скрыл имя, 07 Июня 2010 в 19:08, Не определен
Отчёт по предквалификационной практике
Министерство образования Российской Федерации
Обнинский институт Атомной Энергетики
НАциональный
исследовательский
ядерный университет
МИФи
Кафедра прикладной математики
Отчёт
по предквалификационной
практике
Тема:
Статистический анализ
финансовых данных
Студентка: |
________________ дата, подпись |
Мурашова Л.А. гр. ПМ3-С51 |
Руководитель: |
_________________ дата, подпись |
Чепурко А. Н. |
Обнинск, 2010
Содержание
Введение
Под временным рядом (time series) понимается последовательность наблюдений значений некоторой переменной, произведенных через равные промежутки времени. Если принять длину такого промежутка за единицу времени (год, квартал, день и т.п.), то можно считать, что последовательные наблюдения h1, ..., hn произведены в моменты t = 1, …, n
Основная
отличительная особенность
F(v1, v2, …, vn) = P{ h1 < v1, h2 < v2, ... , hn < vn }.
Мы будем рассматривать в основном временные ряды, у которых совместное распределение случайных величин h1, ..., hn имеет совместную плотность распределения p( h1, h2, … , hn).
Чтобы сделать задачу статистического анализа временных рядов доступной для практического решения, приходится так или иначе, ограничивать класс рассматриваемых моделей временных рядов, вводя те или иные предположения относительно структуры ряда и структуры его вероятностных характеристик. Одно из таких ограничений предполагает стационарность временного ряда.
Ряд ht , t = 1, …, n , называется строго стационарным (или стационарным в узком смысле), если для любого m ( m < n) совместное распределение вероятностей случайных величин h t1 ,… , h tm такое же, как и для h t1+ τ ,… , h tm+ τ, при любых t1,…, tm и τ , таких, что 1 ≤ t1, … , tm ≤ n и 1 ≤ t1+τ, … , tm+τ ≤ n.
Другими словами, свойства строго стационарного временного ряда не изменяются при изменении начала отсчета времени. В частности, при m = 1 из предположения о строгой стационарности временного ряда ht следует, что закон распределения вероятностей случайной величины ht не зависит от t, а значит, не зависят от t и все его основные числовые характеристики (если, конечно, они существуют), в том числе: математическое ожидание E (ht) = μ и дисперсия D(ht)=σ 2.
Значение μ определяет постоянный уровень, относительно которого колеблется анализируемый временной ряд ht, а постоянная σ характеризует размах этих колебаний.
Теоретическая часть
Белый шум
Во всех моделях (линейных и не линейных) предполагается заданной некоторая «базисная» последовательность ε=(εn), которую в теории временных рядов обычно считают белым шумом и которая идентифицируется с источником случайности, определяющим стохастический характер исследуемых вероятностно-статистических объектов.
При этом говорят, что последовательность ε=(εn) является белым шумом в широком смысле, если Еεn = 0, Еε2n< ∞ и Еεn εm= 0 для всех n≠m.
Иначе говоря, белый шум в широком смысле - это квадратично интегрируемая последовательность некоррелированных случайных величин с нулевыми средними.
Если в этом определении добавить еще требование гауссовости (нормальности), то получаемую последовательность ε=(εn) называют белым шумом в узком смысле или белым (гауссовским) шумом, просто белым шумом, что равносильно тому, что ε=(εn) есть последовательность независимых нормально распределенных εn ~N(0,σn2)случайных величин. В дальнейшем будем считать σn2≡1.
Модель скользящего среднего
В модели скользящего среднего MA(q), описывающей эволюции последовательности h=(hn), предполагается следующий способ формирования значений hn по белому шуму в широком смысле ε=(εn):
Где параметр q определяет порядок зависимости от «прошлого», а εn играет роль величин, «обновляющих» информацию, содержащуюся в
Fn-1=σ(εn-1, εn-2, …)
Обратимся
к вопросу о вероятностных
характеристиках
Пусть q=1. В этом случае
И непосредственно находим, что
Последние два свойства означают, что h=(hn) является последовательностью с коррелированными соседними значениями (hn и hn+k), в то время как корреляция значений hn и hn+k при k≥2 равна нулю.
Заметим, между прочим , что если >0, то величины hn и hn+1 положительно коррелированны. Если же <0, то корреляция отрицательна.
Из свойств следует, что у элементов последовательности h=(hn) среднее значение, дисперсия и ковариация не зависят от n. Тем самым последовательность h=(hn ) является стационарной в широком смысле. Если к тому же предположить, что последовательность ε=(εn) является гауссовской, то последовательность h=(hn)так же будет гауссовской и , следовательно, все ее вероятностные свойства выражаются лишь в терминах среднего, дисперсии и ковариации. В этом случае последовательность h=(hn) является стационарной в узком смысле.
Для MA(q) свойства выглядят следующим образом:
Авторегрессионная модель AR(p)
Говорят что последовательность h=(hn)n>1 подчиняется авторегрессионной модели (схеме) AR(p) порядка p, если
Иначе можно сказать, что последовательность h=(hn) подчиняется разностному уравнению порядка p:
В случае n≥1 для полного описания эволюции последовательности h=(hn) разностным уравнением нужно еще задать начальные условия(h1-p h2-p,…, h0).
Часто полагают h1-p=…= h0=0. их можно считать так же случайными, не зависящими от последовательности значений ε1 ,ε2,…. В «эргодических» случаях асимптотическое поведение hn при n→∞ не зависит от начальных условий, и в этом смысле их конкретизация не очень – то существенна.
Рассмотрим простой случай p=1, где
Этот случай выделяется из общего класса моделей тем, что в из «прошлых» величин hn-1 hn-2,…, hn-p вклад в hn вносит только ближайшее (по времени) значение hn-1.
Если ε=(εn)n>1 – последовательность независимых случайных величин, h0 не зависит от ε=(εn)n>1, то последовательность h=(hn)n>1 будет классическим примером конструктивно заданной марковской цепи. Рекуррентным образом из находим:
.
Отсюда видно, что свойства последовательности h=(hn)n>1 существенным образом зависят от параметра , при этом следует различать три случая: | |<1, | |=1, | |>1, среди которых случай | |=1 играет своего рода «пограничную» роль, точный смысл которой будет ясен из последующего изложения.
Из . находим, что
Из этих формул видно, что, в случае | |<1 и при n→∞
и (если )
В этом случае (| |<1) последовательность h=(hn)n≥0 при n→∞ «стационаризуется». Более того, если начальное распределение для является гауссовским ~ то h=(hn)n≥0 образует гауссовскую стационарную последовательность с
Практическая часть
Рассмотрим на реальных данных модели MA(1), MA(2) и AR(1).
Модель MA(1):
Для начала найдем из этой системы коэффициенты b0 и b1
пусть
Смоделируем ряд и по этому ряду найдем мат. ожидание, дисперсию, ковариацию и коэффициенты b0 ,b1.
Построим оба графика:
Заметим, графики практически совпадают, это говорит о том, что модель является рабочей.
Далее применим эту же модель к курсу доллара за 2004 год.
Решение b0 и b1 не единственно, но лишь один вариант будет ближе всего:
После
нахождения коэффициентов, строим графики:
Важно отметить, что модель MA(1) невозможно построить для данных в кризисный период, так как при вычислении коэффициентов, дискриминант квадратного уравнения получается отрицательным.
(для евро 2009)
Модель MA(2).
Так же найдем коэффициенты.
Пусть: