Регрессионный анализ в статистическом изучении взаимосвязи показателей

Автор работы: Пользователь скрыл имя, 24 Марта 2011 в 08:57, курсовая работа

Описание работы

Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи. Не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.

Содержание работы

Введение 3
1.Статистическое изучение взаимосвязи социально-экономических явлений и процессов 5
2.Характеристика регрессионного анализа 11
2.1.Оценка взаимосвязи между факторным и результативным признаком на основе регрессионного анализа 11
2.2.Отбор факторных признаков для построения множественной регрессионной модели 13
2.3.Проверка адекватности моделей, построенных на основе уравнений регрессии 17
3.Применение регрессионного анализа для изучения объекта исследования 26
Заключение 33
Список литературы

Файлы: 1 файл

Курсовая работа_моя_new.doc

— 494.50 Кб (Скачать файл)

     При численности объектов анализа до 30 единиц возникает необходимость  проверки значимости (существенности) каждого коэффициента регрессии. При  этом выясняют насколько вычисленные параметры, характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин. Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия

      для параметра a0: 

      для параметра a1:          

         где  n - объём выборки; 

     - среднее квадратическое отклонение  результативного признака от выравненных значений ŷ ;

          или   

     - среднее квадратическое отклонение  факторного признака x от общей  средней  . [8]

     Вычисленные по вышеприведенным формулам значения сравнивают с критическими t, которые  определяют по таблице Стьюдента  с учетом принятого уровня значимости  α  и числом степеней свободы вариации . В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч> tтабл . В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями.

     Теперь  я рассчитаю t-критерий Стьюдента  для моей модели регрессии.

      - это средние  квадратические отклонения.

     

      Расчетные значения t-критерия Стьюдента:

     По  таблице распределения Стьюдента  я нахожу критическое значение t-критерия для  ν= 32-2 = 30 . Вероятность α я  принимаю 0,05. tтабл равно 2,042. Так как, оба значения ta0 и ta1 больше tтабл , то оба параметра а0 и а1 признаются значимыми и отклоняется гипотеза о том, что каждый из этих параметров в действительности равен 0 , и лишь в силу случайных обстоятельств оказался равным проверяемой величине.

     Проверка  адекватности регрессионной модели  может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту   корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением ηэ, когда δ2 (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней: . 

     Говоря  о корреляционном отношении как  о показателе измерения тесноты  зависимости, следует отличать от эмпирического  корреляционного отношения – теоретическое.

     Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выравненных  значений результативного признака  δ, то есть рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативности признака σ:

        ,

     где ;       .

     Тогда . [2]

     Изменение значения η объясняется влиянием факторного признака.

     В основе расчёта корреляционного отношения лежит правило сложения дисперсий, то есть , где    -   отражает вариацию у за счёт всех остальных факторов, кроме х, то есть являются остаточной дисперсией:

      .

     Тогда формула теоретического корреляционного  отношения примет вид:

      ,

     или        .

     Подкоренное выражение корреляционного выражения  представляет собой коэффициент  детерминации (мера определенности, причинности).

     Коэффициент детерминации показывает долю вариации результативного признака под влиянием вариации признака-фактора. Задача

     Теоретическое корреляционное выражение применяется  для измерения тесноты связи  при линейной и криволинейной  зависимостях между результативным и факторным признаком.

     Как видно из вышеприведенных формул корреляционное отношение может  находиться от 0 до 1. Чем ближе корреляционное отношение к 1, тем связь между признаками теснее.

     Теоретическое корреляционное отношение применительно  к  моему анализу я рассчитаю  двумя способами:

     

      [5]

     Полученное  значение теоретического корреляционного  отношения свидетельствует о возможном наличии среднестатистической связи между рассматриваемыми признаками. Коэффициент детерминации равен 0,62. Отсюда я заключаю, что 62% общей вариации работающих активов изучаемых банков обусловлено вариацией фактора – капитала банков (а 38% общей вариации нельзя объяснить изменением размера капитала).

     Кроме того, при линейной форме уравнения  применяется другой показатель тесноты  связи – линейный коэффициент корреляции:

      ,

     где n – число наблюдений.

     Для практических вычислений при малом  числе наблюдений (n≤20÷30) линейный коэффициент корреляции удобнее исчислять по следующей формуле:

      .

     Значение  линейного коэффициента корреляции важно для исследования социально-экономических  явлений и процессов, распределение  которых близко к нормальному. Он принимает значения в интервале:

     -1≤  r ≤ 1.

     Отрицательные значения указывают на обратную связь, положительные – на прямую. При r = 0 линейная связь отсутствует. Чем  ближе коэффициент корреляции по абсолютной величине к единице, тем  теснее связь между признаками. И, наконец, при r = ±1 – связь функциональная.

     Используя данные Таблицы 1 (Приложение 1), я рассчитал линейный коэффициент корреляции r. Но чтобы использовать формулу для линейного коэффициента корреляции рассчитаем дисперсию результативного признака σy:

     

     

     Квадрат линейного коэффициента корреляции r2 называется линейным коэффициентом детерминации. Из определения коэффициента детерминации очевидно, что его числовое значение всегда заключено в пределах от 0 до 1, то есть 0 ≤ r2 ≤ 1. Степень тесноты связи полностью соответствует теоретическому корреляционному отношению, которое является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции.

     Факт  совпадений и несовпадений значений теоретического корреляционного отношения η и линейного коэффициента корреляции r используется для оценки формы связи. [4]

     Выше  отмечалось, что посредством теоретического корреляционного отношения измеряется теснота связи любой формы, а  с помощью линейного коэффициента корреляции – только прямолинейной. Следовательно, значения η и r совпадают только при наличии прямолинейной связи. Несовпадение этих величин свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов η и r не превышает 0,1 , то гипотезу о прямолинейной форме связи можно считать подтвержденной. В моем случае наблюдается примерное совпадение линейного коэффициента детерминации и теоретического корреляционного отношения, что дает мне основание считать связь между капиталом банков и их работающими активами прямолинейной.

     При линейной однофакторной связи t-критерий можно рассчитать по формуле:

      ,

     где (n - 2) – число степеней свободы  при заданном уровне значимости α  и объеме выборки n.

     Так, для коэффициента корреляции между капиталом и работающими активами получается:

     

     Если  сравнить полученное tрасч с критическим  значением из таблицы Стьюдента, где ν=30, а α=0,01 (tтабл=2,750), то полученное значение t-критерия будет больше табличного, что свидетельствует о значимости коэффициента корреляции и существенной связи между капиталом и работающими активами.

     Таким образом, построенная регрессионная  модель ŷ=245,75+1,42x  в целом адекватна, и выводы, полученные по результатам малой выборки можно с достаточной вероятностью распространить на всю гипотетическую генеральную совокупность. 

     Экономическая интерпретация параметров регрессии 

     После проверки адекватности, установления точности и надежности построенной  модели (уравнения регрессии), ее необходимо проанализировать. Прежде всего, нужно проверить, согласуются ли знаки параметров с теоретическими представлениями и соображениями о направлении влияния признака-фактора на результативный признак (показатель).

     В рассмотренном уравнении ŷ=245,75+1,42х, характеризующем зависимость размера работающих активов (у) от капиталов банков (х), параметр а1>0. Следовательно, с возрастанием размера капитала банка размер работающих активов увеличивается.

     Из  уравнения следует, что возрастание  капитала банка на 1 млн рублей приводит к увеличению работающих активов в среднем на 1,4 млн рублей (величину параметра а1). 

     Для удобства интерпретации параметра  a1 используют коэффициент эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1% и вычисляется по формуле, %:

      .

     В представленном анализе деятельности банков эта величина равна:

     

     Это означает, что с увеличением размера  капитала на 1% следует ожидать повышения размера работающих активов банков в среднем на 0,78%.

     Этот  вывод справедлив только для данной совокупности банков при конкретных условиях их деятельности.

     Если  же эти банки и условия считать  типичными, то коэффициент регрессии  может быть применен для расчета  размера работающих активов по их капиталу и для других банков.

     Имеет смысл вычислить остатки εi = y – ŷ, характеризующие отклонение i-х наблюдений от значений, которые следует ожидать в среднем.

     Анализируя  остатки, можно сделать ряд выводов  о деятельности банков. Значения остатков (Таблица 1, графа 8, Приложение 1) имеют как положительные, так и отрицательные отклонения от ожидаемого. Таким образом, выявляются банки, которые вкладывают больше денежных средств в оборот (положительные значения), и банки, предпочитающие пускать в оборот небольшую часть своих денежных средств (отрицательные значения остатков).

     В итоге положительные отклонения размеров работающих  активов уравновешиваются отрицательными значениями, то есть получается ∑εi=0.

     Таким образом, в данной работе я установил  корреляционную зависимость  показателей 32 российских банков, провел регрессионный анализ и нашёл регрессионную модель данной взаимосвязи показателей.

     Полученное  уравнение ŷ=245,75+1,42х позволяет проиллюстрировать зависимость размера работающих активов банков от размера их капитала.

     А также я проверил мою модель на адекватность по критерию Стьюдента, результат  оказался положительным (модель адекватна, т.е. ее можно применять), а затем дал экономическую оценку этой модели.

     И так, с помощью корреляционно-регрессионного анализа, я исследовал показатели банков.

 

3.Применение  регрессионного анализа  для изучения объекта  исследования 

     На  основе ранжированных данных о производительности труда и стаже работы двадцати рабочих бригады ЗАО «Роспан Интернешнл» (Таблица 2, Приложение 3) необходимо:

     1.Установить результативный и факторный признаки.

     2.Определить наличие и форму корреляционной связи между производительностью труда рабочих бригады и стажем работы.

     3.Построить на графике поле корреляции и эмпирическую линию корреляционной связи.

Информация о работе Регрессионный анализ в статистическом изучении взаимосвязи показателей