Обработка статистических данных средствами пакета Statgraphics

Автор работы: Пользователь скрыл имя, 05 Декабря 2011 в 17:00, курсовая работа

Описание работы

Основная цель данной курсовой работы – решение некоторых экономических задач с помощью статистического пакета StatGraphics.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Изучить и систематизировать литературу по статистическим методам обработки информации.
2. Изучить пакет StatGraphics.

Файлы: 1 файл

Курсовая по информатике Statgraphics .doc

— 1.23 Мб (Скачать файл)

  В стахостической зависимости разграничение переменных на зависимую и независимую является условным, не всегда ясным из  содержания переменных и определяется целями анализа. Независимая переменная откладывается по оси абсцисс. Случайными могут быть зависимая и независимая переменная.

  Если  цель анализа - только выявление связи (корреляции), то отнесение переменной к зависимой или независимой не играет никакой роли, и вообще, стахостическая зависимость, если она и существует, сама по себе не указывает, какая переменная является причиной другой.

  Корреляция  между признаками не указывает на причинные отношения между ними. Требуются дополнительные основания для выяснения, какой из признаков является причиной другого, и научно обоснованного прогноза или управления. Корреляционные зависимости принято подразделять на действительные и мнимые. Действительные корреляционные связи вызваны причинными отношениями между зависимой и независимой переменными. Мнимые корреляционные зависимости могут возникать между переменными, которые не находятся между собой в причинной связи.  

  1.7.2. Понятие корреляции.

  Проблема  обнаружения стахостической связи, в частности линейной двумерной (парной), и оценке  ее силы решается в корреляционном анализе.

  Двумерная (парная) линейная зависимость является частным случаем двумерной нелинейной и многомерной связей. Поэтому в частном случае линейной связи корреляционное отношение совпадает с коэффицентом корреляции.

  Слабость  стахостической связи характеризуется  коэффицентом неопределенности. Он по своему смыслу противоположен корреляционному отношению.

  Коэффицент неопределенности определяется отношением:

  

Формула 5

                                                                                                  

  1.7.3. Парная линейная  регрессия.

  Линейная  модель парной зависимости между независимой переменной x и зависимой переменной y – это уравнение прямой линии: , где и - оценки неизвестных истинных коэффицентов a и b. Линейная модель широко применяется при исследовании стахостических связей, так как при небольших изменениях аргумента любая зависимость допускает линейное приближение.

  Проблема  построения математической модели, определения  параметров  и оценке достоверности  чаще решается в регрессионном анализе. Его смысл состоит в переходе от стахостической связи рассматриваемых переменных x и y к зависимости условного математического ожидания зависимой переменной y от контролирующего фактора- аргумента x. Такая зависимость называется регрессией y по x.

  Модель  с такими параметрами обладает минимальной  суммой квадратов отклонения от эмпирических данных. Поэтому поиск параметров для регрессионной модели осуществляется методом наименьших квадратов.

  В программных средствах оценки коэффицентов линейной регрессии выводятся как и для ее уравнения в форме при непосредственном использовании независимой переменной x. 

1.8. Общая характеристика временных рядов.

  Временной ряд является одним из видов парной стахостической зависимости, в которой независимая переменная – время. 

  1.8.1. Показатели и формы представления временного ряда.

  Как парная стахостическая зависимость, временной  ряд численно представляется в таблице  с двумя столбцами или двумя строками:

  • в  первом столбце (или первой строке)- упорядоченные временные  интервалы или просто время  (даты), являющиеся детерминированными дискретными величинами;
  • во втором столбце - числовые, как правило, случайные характеристики изучаемого явления.

  Такие сведения прослеживают явление  в  развитии, и ряд называется динамическим. Упорядоченные числовые характеристики рассматриваемого явления называются уровнями  ряда, причем первое значение именуется начальным уровнем, последнее конечным. Уровни ряда могут являться натуральными мерами или вычисляемыми на их основе средними либо относительными величинами.

  Уровни  задаются через равные упорядоченные  промежутки времени , и их указание в таблице необязательно, так  как последованность значений времени  отражается номерами по порядку.

  Графически  временной ряд представляется кривой или маркерами  в двумерной  декартовой системе координат, в  которой:

    • абсциссы- значения аргумента, то есть времяили номера по порядку;
    • ординаты- значения уровня.

  При  компьютерном выводе графика временного ряда значения абсцисс задаются явно или по умолчанию откладываются номера по порядку. Временные ряды в области экономике и управления отражают развитие социально- экономических явлений жизни общества, в сфере статистического учета их обычно называют рядами динамики. 

  1.8.2. Виды временных рядов и возможности их использования.

  Временные ряды могут быть интервальными и  моментальными.

  В интервальном ряду приводятся данные за определенны периоды. Особенностью интервальных рядов из абсолютных величин является то, что их уровни можно суммировать, получая новые численные значения объема явления, относящиеся к более длительным периодам.

  В моментальном ряду приводятся данные в определенные даты. Уровни моментальных динамических рядов суммировать нельзя; сумма не имеет смысла, так как каждый последующий уровень полностью или частично включает предыдущий. Однако их разность имеет смысл, характеризуя увеличение или уменьшение уровня ряда между датами учета.

  Временные ряды позволяют объяснить, что случилось в прошлом, и прогнозировать события в будущем. Основным положением, на котором базируется использование временных рядов для прогнозирования, является то, что для факторов, определяющих регулярную составляющую динамики изучаемых событий в прошлом и настоящем, ожидая схожее действие в не слишком далеком будущем. Поэтому основной целью анализа временных рядов является оценка и вычисление этой регулярной составляющей динамики изучаемых событий с целью прогноза их дальнейшего поведения и выработки рациональных управленческих решений. 
 
 
 
 
 
 
 
 
 
 
 
 

2. Работа в пакете StatGraphics.

  Специализированный  статистический графический пакет STATGRAPHICS Plus for Windows  разработан американской корпорацией Manugistics, которая до 1992 г. именовалась Scientific Time Sharing Corp. Первые версии программы назывались STATGRAPHICS (STATistica GRAPHICs System),были разработаны под DOS и совершенствовались до 7-й версии (1993). В 1994 г. корпорации Manugistics и Statistica Graphics создали первую версию STATGRAPHICS Plus for Windows. Она по своим возможностям соответствовала последней разработке для DOS, но имела значительно лучший интерфейс, как и у всех программных средств для Windows.

  Пакет STATGRAPHICS Plus for Windows 2.1 функционирует на компьютерах с процессором 386 и выше под управлением ОС Windows,начиная с 3–й версии. Требует около 14,5 Мб на жестком диске.

  Последующие версии STATGRAPHICS Plus for Windows разработаны для Windows 95/98 и выше и занимают около 65 Мб. 

2.1. Запуск пакета.

  Для инициализации пакета STATGRAPHICSРОЩЕ проще всего щелкнуть по ярлыку файла Sdwin.exe, если он выведен на Рабочий стол Windows. При отсутствии на Рабочем столе ярлыка можно поступить одним из двух способов:

  • с помощью кнопки Пуск открыть список Программы, найти название пакета и инициализировать его;
  • используя Проводник или другую программу – навигатор, открыть папку с пакетом и запустить файл Sgwin.exe.

  При запуске STATGRAPHICS выводится заставка и затем Untitled StatFolio-вводная (начальная) страница для создания статистического проекта. Выбора методов, статистических процедур, графики и т. п. Сверху на странице Untitled StatFolio находится строка меню:

    • FILE – для работы с файлами;
    • EDIT – для редактирования данных;
    • GRAPHICS – изображение графика (Плот);
    • DESCRIBE – описание. Выбор статистического метода анализа,
    • COMPARE – (сравнение) многофакторный дисперсионный анализ,
    • RELATE – (отношение) регрессионный анализ,
    • SPECIAL – (специальный) особый специальный метод анализа, который используется в определенных группах задач;
    • VIEW – (просмотр) режим просмотра выводов, результатов , отчетов;
    • HELP – помощь,

  под ней - рабочее поле (фон) для вывода окон, еще ниже –

  панель  с кнопками, позволяющими свернуть встроенные приложения:

  • <untitled> - электронной таблицы;
  • StatAdvisor – консультанта экспертной системы по статистике;
  • StatGallery – накапливаемых графиков (диаграмм);
  • Untitled Co… - комментариев по работе с системой.

  Последние версии STATGRAPHICS дополнены для создания отчета еще одним приложением, вызываемым кнопкой StatReporter – прмежуточный инструмент между блокнотом и полноценным текстовым процессором. Он позволяет объединять результаты обработки (таблицы. Графики, интерпритацию StatAdvisor ) и применения в один отчет.

  Окно  STATGRAPHICS с развернутой электронной таблицей показано на рисунке 1.

    

  Развернутые и свернутые окна имеют стандартные ярлычки, которые позволяют:

  • восстановить свернутое окно до средних размеров;
  • развернуть свернутое окно до максимальных размеров;
  • закрыть окно.

  Для манипуляции со свернутым окном  помимо активизации одного из доступных ярлычков можно щелкнуть мышью по  надписи кнопки и в позволяющемся контекстном меню выбрать команду Развернуть.

  После этого в правой части строки заголовка развернувшегося окна появится ярлычок для операции сворачивания. 

  2.2.Ввод  и преобразование данных.

  Для ввода данных (создание файла с данными – Date File) электронная таблица должна быть развернута (с помощью кнопки <untitled>).

  Окно  с электронной таблицей организовано таким образом, что строки соответствуют объектам (наблюдениям), а столбцы – признакам (переменным).

  Электронная таблица заключена в бордюр (адресные полосы): слева – боковая адресная полоса с номерами строк 1, 2, 3, … , сверху – верхняя адресная полоса с обозначениями столбцов Col_1, Col_2, Col_3, … . Имена столбцов и тип переменных (по умолчанию – числовой) можно переопределить. 

2.3. Операции в STATGRAPHICS Plus for Windows.

  Для переопределения имени и типа переменной прежде всего выделяется столбец с переменной. Затем щелчком мыши вызывается контекстное меню и в нем выбирается команда Modify Column. Главное свойство Modify Column – появляется окно с Name, Comment, Type

  Numeric – натуральное число;

  Character – текст;

  Integer – целая часть;

  Data – дата;

  Month – текстовое обозначение месяца;

  Fixed Decimal – действует число с фиксированным количеством знаков после запятой. В появляющемся одноименном диалоговом окне в поле Name вводится имя, явно указывается тип данных.

  Ввод  данных возможен путем импорта из других программных средств или  непосредственно набора в электронной таблице.

  Для освоения операций непосредственного ввода рекомендуется выполнить его применительно к данным по стоимости нескольких деталей. В первой колонке указываются идентификаторы деталей , во второй – их стоимость.

Информация о работе Обработка статистических данных средствами пакета Statgraphics