Основы общей теории статистики

Автор работы: Пользователь скрыл имя, 03 Ноября 2009 в 15:35, Не определен

Описание работы

Реферат по статистике

Файлы: 1 файл

Реферат по статистике.doc

— 526.50 Кб (Скачать файл)

1.3.Принципы  построения группировки

 

      При построении группировки следует  придерживаться следующей схемы:

  1. выбирают группировочный признак или комбинацию признаков;
  2. определяют число групп и величину интервала;
  3. непосредственно группируют статистические данные;
  4. составляют таблицу или графическое отображение, в которых представляют результаты группировки;
  5. делают вывод. 

При построении группировки важным является  вопрос о количестве групп.

      Для определения оптимального числа  групп используют формулу Стерджесса : 

n = 1 + 3,322*lgN

где n –  число групп,

       N – число единиц совокупности.

Для решения  вопроса о количестве групп, из практики, имеются несколько рекомендаций:

1 Число  групп должно быть таким, сколько  в действительности имеется типичных  характерных групп и какова их роль в исследуемом процессе.

2 В каждую  группу должно попасть достаточное  количество единиц для получения  устойчивых данных.

3 В особую  группу следует выделить малочисленное,  но имеющее большое значение  явление.

      Другой  способ определения числа групп основан на применении среднего квадратичного отклонения. Если величина интервала 0,5 то совокупность разбивается на 12 групп, когда величина интервала 2/3 и    , то совокупность делится соответственно на 9 и 6 групп.

      Если  совокупность делится на 12 групп, то интервалы строятся в промежутке (x-3; x+3) с шагом 0,5   , если на 6 групп, то интервалы строятся в том же промежутке с шагом    .

      Среднее квадратичное отклонение    рассчитывается  по формуле: 

                                                    (xi-x)2  ,             

                                                         n                                                         

где  xi- i-е значение варьирующего признака,

        x- среднее значение признака по  совокупности, которое находится по формуле: 
 

                                                        xi

                                                                                    n                                                                                    

      Интервалы могут быть равными и неравными. Если вариация признака проявляется  в сравнительно узких границах, и  распределение носит более или  менее равномерный характер, то строят группировку с равными интервалами.

      Величина  равного интервала определяется по следующей формуле: 

                                                 X max – x min ,

                                                        n                                                        

где xmax и xmin- максимальное и минимальное значение признака в              совокупности.

      Интервал, у которого обозначены обе границы, называют закрытым, а интервал, у  которого указана только одна граница (верхняя или нижняя) – открытым.

  Неравные интервалы применяются в статистике, когда значения признака варьируются неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно на макроэкономическом уровне.

      Неравные  интервалы могут быть прогрессивно возрастающими и убывающими в  арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяются следующим образом:

                                            hi+1 = hi + a ,                                                   

в геометрической прогрессии: 

                                            hi+1 = hi*q ,                                                       

где a –  константа – число, которое будет  положительным при прогрессивно возрастающих интервалах и отрицательным  – при прогрессивно убывающих  интервалах;

        q – константа – положительное  число, которое при прогрессивно  возрастающих интервалах будет  больше 1, а при прогрессивно убывающих  – меньше 1.

      При изучении социально-экономических  явлений на макроуровне часто  применяют группировки с произвольными интервалами. Произвольные интервалы используют при группировке рабочих по выработке продукции, предприятий – по уровню рентабельности.

      Для построения группировки с произвольными  интервалами используют коэффициент  вариации: 

                                          V = x/  *100% .                                                 

      Всю совокупность выстраивают в порядке  возрастания или убывания варьирующего признака, а затем берут первые значения ряда до тех пор, пока коэффициент  вариации не будет равен 33%. Это будет свидетельствовать об образовании первой группы, которая исключается из исходной совокупности. Оставшаяся часть принимается за новую совокупность, для которой повторяется алгоритм образования первой группы. И так до тех пор, пока все единицы совокупности не будут объединены в группы.

      Особенностью  данной группировки является то, что  до проведения группировки исследователь  не знает ни количества групп, ни величины интервалов. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

1.4. Сущность корреляционной связи

 

         Важнейшей целью статистики является  изучение объективно существующих  связей между явлениями. В ходе  статистического исследования этих  связей необходимо выявить причинно-следственные  зависимости между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей.

           Существует две категории зависимостей (функциональная и корреляционная) и две группы признаков (признаки-факторы  и результативные признаки). В  отличие от функциональной связи, где существует полное соответствие между факторными и результативными признаками, в корреляционной связи отсутствует это полное соответствие. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

      1.5.Корреляционно-регрессионный  метод анализа

 

Корреляционная  связь - это связь, где воздействие отдельных факторов проявляется только как тенденция (в среднем) при массовом наблюдении фактических данных. Примерами корреляционной зависимости могут быть зависимости между размерами активов банка и суммой прибыли банка, ростом производительности труда и стажем работы сотрудников

      Содержание теории корреляции составляет изучение зависимости вариации признака от окружающих условий.

При изучении конкретных зависимостей выявляют факторные  и результативные признаки. В корреляционных связях между изменениями факторного и результативного признака нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных.

Кроме того, сам признак-фактор в свою очередь  может зависеть от изменения ряда обстоятельств. В сложном взаимодействии находится результативный признак - в более общем виде он выступает как фактор изменения других признаков. Отсюда результаты корреляционного анализа имеют значение в данной связи, а интерпретация этих результатов в более общем виде требует построения системы корреляционных связей.

При исследовании корреляционных зависимостей между  признаками решению подлежит широкий  круг вопросов, к которым следует  отнести :

1)Предварительный  анализ свойств моделируемой совокупности единиц;

2)Установление  факта наличия связи, определение  её формы и направления; 

3)Измерение  степени тесноты связи между  признаками;

4)Построение  регрессивной модели, т.е. нахождение  аналитического выражения связи; 

5)Оценка  адекватности модели, её экономическая интерпретация и практическое использование.

Для того, чтобы результаты корреляционного  анализа нашли практическое применение и дали желаемый результат, должны выполняться  определённые требования.

1.Требование  однородности тех единиц, которые подвергаются изучению.

2.Количественная  оценка однородности исследуемой  совокупности по комплексу признаков  (расчет относительных показателей  вариации, коэффициент вариации, отношение  размаха вариации к среднему  квадратическому отклонению).

3.Достаточное  число наблюдений.

4.Исследуемая  совокупность должна иметь нормальное  распределение. 

5.Факторы  должны иметь количественное  выражение. 

Наиболее  простым вариантом корреляционной зависимости является парная корреляция, т.е. зависимость между двумя признаками (результативным и факторным или между двумя факторными). Математически эту зависимость можно выразить как зависимость результативного показателя у от факторного показателя х. Связи могут быть прямые и обратные. В первом случае с увеличением признака х увеличивается и признак у, при обратной связи с увеличением признака х уменьшается признак у.

             Важнейшей задачей является определение  формы связи с последующим  расчетом параметров уравнения,  или, иначе, нахождение уравнения  связи (уравнения регрессии).

Могут иметь  место различные формы связи:

  -прямолинейная

Для определения  параметров уравнения на основе требований метода наименьших квадратов составляется система нормальных уравнений:

Для решения  системы применяется способ определителей, позволяющий сводить к минимуму неточности округлений в расчетах параметров уравнений регрессии:

Информация о работе Основы общей теории статистики