Сравнительная оценка параметров эмпирического и нормального распределений. Критерий Пирсона

Автор работы: Пользователь скрыл имя, 24 Ноября 2015 в 22:02, реферат

Описание работы

Теория вероятности и математическая статистика – это наука, занимающаясяизучением закономерностей массовых случайных явлений, то есть статистических закономерностей. Такие же закономерности, только в более узкой предметной области социально-экономических явлений, изучает статистика. Между этими науками имеется общность методологии и высокая степень взаимосвязи. Практически любые выводы сделанные статистикой рассматриваются как вероятностные.

Содержание работы

1. Предмет теории вероятности. Вероятность и статистика.
2. Основные категории теории вероятности.
3. Классическое и статистическое определение вероятности.
4. Теорема сложения вероятностей.
5. Теорема умножения вероятностей.
6. Следствие теорем сложения и умножения вероятностей.
7. Вероятность гипотез. Формула Байеса.
8. Независимые события. Биномиальное распределение.
9. Вероятность редких событий. Формула Пуассона.
10. Локальная теорема де Муавра-Лапласа.
11. Интегральная формула Лапласа.
12. Зависимые события. Гипергеометрическое распределение.
13. Нормальное распределение.
14. Сравнительная оценка параметров эмпирического и нормального распределений. Критерий Пирсона.

Файлы: 1 файл

Документ Microsoft Word (3).docx

— 31.58 Кб (Скачать файл)

— для зависимых событий.

Пример : Два продавца независимо друг от друга обслуживают покупателей. Вероятность того, что первый продавец сумеет продать товар 0,3, а второй – 0,2. Какова вероятность того, что хотя бы один из продавцов реализует товар?

Данную задачу можно решить и другим способом, рассматривая события, как независимые совокупности. Тогда вероятность, что первый продавец не сумет продать товар – 0,7, а вероятность того, что второй не сумеет продать товар – 0,8.

Пример : Вероятность покупки мужского костюма посетителем магазина составляет 0,02, галстука – 0,1, а вероятность покупки галстука под приобретенный костюм — 0,3.

Надо определить вероятность покупки покупателями хотя бы одной из этих вещей.

Комбинация теорем сложения и умножения вероятностей выражается в формулеполной вероятности .

Вероятность события Е, которое может произойти только при появлении одного из событий , составляющих полную группу, равна сумме произведений вероятностей каждого из этих событий на соответствующую условную вероятность события Е.

По условию достоверным является появление одного из событий или или или . По теореме умножения вероятностей:

Но так как все эти события не совместны, вероятность появления одного из них определяется по теореме сложения вероятностей.

Пример : На плодоовощную базу поступило 4 партии картофеля. В первой партии – 95% доля стандартных клубней, во второй – 97%, в третьей – 94%, в четвертой – 91%. При этом доля первой партии в общем объеме поставок – 28%, второй – 31%, третьей – 24%, четвертой – 17%. Определить вероятность того, что магазину, заказавшему товар, достанется стандартная продукция.

Полученный результат характеризует математическое ожидание или вероятность поставки стандартной продукции в магазин. Фактически это долевая средняя, показывающая среднюю долю стандартных клубней в четырех партиях.

7. Вероятность  гипотез. Формула Байеса.

Как уже отмечалось, практически любое утверждение в статистике рассматривается как гипотеза, то есть некоторое предположение о наличии, форме, тесноте взаимосвязей.

Предположим, событие Е наступает только при появлении одного из несовместных событий , образующих полную группу. Допустим, в результате испытания событие Е произошло, то есть достоверным стало одно из событий или или или .

Каждое из этих событий рассматривается как гипотетическое и его вероятность как раз определяется по формуле Байеса .

Предыдущий пример : Известно, что в магазин поставлен стандартный картофель. Какова вероятность того, что он из четвертой партии.

Таким образом, только в 16-ти случаях из 100 доставленная в магазин стандартная продукция окажется из четвертой партии.

Применение формулы Байеса позволяет переоценить вероятности гипотез по результатам испытаний, в следствие которых появилось событие Е.

Достоинство формулы Байеса в том, что она может применяться при отсутствии сведений о числе элементарных исходов, достаточно знать вероятности или частости событий.

8. Независимые  события. Биномиальное распределение.

Предположим событие Е во всех случаях имеет одну и ту же вероятность , тогда вероятность противоположного события будет так же постоянна и может определяться по формуле .

Такой подход позволяет рассматривать практически любое пространство элементарных событий, как дихотомно е (то есть состоит из противоположных событий).

Допустим, необходимо определить вероятность появления события Е ровно k раз в n независимых испытаниях. В этом случае событие противоположное Е произойдет n-k раз. Отобрать k-элементов из n можно различными способами, каждый из которых несовместное событие, появление которого это результат игры случая.

В математике доказано, что число различных комбинаций из n элементов по k определяется по формуле:

,! это произведение натурального ряда чисел, каждое из которых больше предыдущего на 1 (начиная с 1).

В соответствии с теоремой умножения вероятностей вероятность появления одной из возможных комбинаций определяется по формуле:

Формула, которая определяет вероятность появления события Е k-раз в n-независимых испытаниях, называется формулой Бернулли. А схема отбора из дихотомной совокупности схемой Бернулли (или схемой возвращаемого шара или схемой повторного отбора).

Пример : Для обслуживания покупателей супермаркета в час пик без очередей должно работать не менее 6 контролеров-кассиров из 8. Вероятность отсутствия одного из работников составляет 0,1. Найти вероятность работы расчетно-кассового узла без очередей.

Поскольку нас устраивает работа 6, 7, 8 кассовых кабин, то вероятность появления одного из этих несовместных событий будет определяться по формуле сложения вероятностей. Каждая из этих вероятностей может определяться по формуле Бернулли.

Таким образом, в 96 случаях из 100 очередей не будет.

Если при фиксированной численности n-повторного отбора из дихотомной совокупности изменять величину k, то полученное распределение вероятности будет называться биномиальным. Поскольку его ординаты представляют собой элементы разложения бинома .

Число наступления событий в n-независимых испытаниях называетсянаивероятнейшим, если этому числу соответствует наибольшая вероятность.

При этом если k смешанное число, то в результате выбирается ближайшее к этому смешанному числу, но меньше его, целое число.

В примере с кассирами .

Математическое ожидание М( k ) числа появления событий Е в n-независимых испытаниях равно произведению числа испытаний на вероятность появления события в каждом испытании.

Если перейти от абсолютного числа раз появления события к плотностям распределения вероятностей, то будет равно p.

Дисперсия биномиального распределения , — по плотности.

График биномиального распределения зависит от соотношения p и q. Если p равно q и равно 0,5, то распределение симметрично, в противном случае (p≠q) наблюдается асимметрия или скошенность полигона.

Показатель асимметрии биномиального распределения определяется по формуле:

Если , то высота биномиального распределения соответствует высоте кривой нормального распределения. Доказано, что с увеличением числа испытаний значения , а биномиальное распределение стремится к нормальному распределению.

9. Вероятность  редких событий. Формула Пуассона.

Применение формулы Бернулли сопряжено с расчетами трех факториалов, что при достаточно больших значениях n, k, n-q, осложняет задачу. Поэтому статистики математики разработали ряд примерных методов, заменяющих формулу Бернулли при решении некоторых частных и общих задач.

Пример : Определение вероятности появления редких событий , k-раз, в n независимых испытаниях. Причем подразумевается нефиксированное, а бесконечно большое количество испытаний (). При этом . Такая вероятность определяется по формуле Пуассона (альтернативные независимые события).

— математическое ожидание;

Формула Пуассона выводится из формулы Бернулли и после ряда преобразований выглядит следующим образом , где k – количество раз, которое произойдет редкое событие.

Эта формула применяется в прикладных разработках, в теории массового обслуживания (теории очередей), которая используется для расчета оптимального числа точек обслуживания, числа бензоколонок, числа рабочих мест операционистов в банке (такое число, чтобы не было очередей).

Кроме того, формула Пуассона применяется в ситуациях, когда не требуется высокая точность расчетов, а вероятность события p не велика.

10. Локальная теорема  де Муавра-Лапласа.

В 1730 г. формула для приближения расчета значений для случая, когда p=q=0,5 предложил французский математик де Муавр.

Позднее в 1783 г. Лаплас обобщил результаты, полученные де Муавром, в своей теореме. Если вероятность p появления события Е в каждом испытании постоянна и отлична от 0 и 1, то вероятность появления события Е в n испытаниях равно k раз приближенно равна значению функции:

Созданы специальные таблицы значений функции в зависимости от величины t. t – стандартизированное значение.

Пример : Найти вероятность того, что 80 из 1000 приобретут мужскую обувь, если вероятность покупки обуви p=0,11 (по данным из наблюдений за предыдущий период).

1)

Поскольку в функции использована четная степень t – функция положительна, то есть .

Таким образом, только в 404 случаях из 1 млн. ровно 80 из 1000 посетителей приобретут мужскую обувь.

2)

Таким образом, в 242 случаях из 10000 ровно 120 из 1000 посетителей приобретут мужскую обувь.

11. Интегральная  формула Лапласа.

Локальная теорема Лапласа имеет важное значение, однако ее практическое значение ограничено. На практике важно знать вероятность того, что событие Е произойдет число раз, заданное в определенных пределах.

Пример : Вероятность приобретения покупателями мужской обуви от 80 до 120 человек из 1000.

, то есть, равна сумме  вероятностей несовместных событий  покупки 1000 посетителей конкретного  числа пар обуви в пределах  от 80 до 120 пар обуви.

Каждое из слагаемых определяется по локальной формуле Лапласа. Высокая трудоемкость задачи очевидна, поэтому рациональным способом решения задачи является интегрирование локальной функции Лапласа.

Если вероятность p появления событий Е в каждом испытании постоянна и отлична от 0 и 1, то

, при этом

Интегрированная функция описывает распределение вероятности полной группы событий, поэтому ее общая площадь в пределах изменения t от до равна 1.

Поскольку функция асимптотически приближается к оси абсцисс в пределах изменения t от до -5, а так же от +5 до считается, что единице равна площадь кривой в пределах ординат .

Значения функции даны в приложении 3, они указаны в пределах от –t до +t.

Пример : от 80 до 120

Таким образом, в 84 случаях из 100.

Складывая и вычитая площади, определенные по таблицам всегда можно получить необходимый результат.

12. Зависимые события. Гипергеометрическое распределение.

Для вывода функции гипергеометрического распределения проводятся испытания (выборка) по схеме невозвращающегося шара. В этом случае вероятность появления события Е k-раз в n зависимых испытаниях подвергается влиянию не только числа отбираемых единиц n, но и численности всей генеральной совокупности N.

Если p доля единиц генеральной совокупности, обладающих изучаемым признаком, а q – доля необладающих этим признаком, то вероятность появления события Е k раз n зависимых испытаний определяется по формуле:

, где — число сочетаний  из pN=M элементов генеральной совокупности, обладающих изучаемым признаком по k; — число сочетаний из qN=N-M единиц, необладающих изучаемым признаком n-k единиц; — число исходов, удовлетворяющих и неудовлетворяющих данному испытанию.

Математическое ожидание гипергеометрического распределения не зависит от объема генеральной совокупности и как в биномиальном распределении определяется по формуле:

, где — корректирует  дисперсию при бесповторном отборе  в зависимости от численности  выборки и генеральной совокупности.

Если численность генеральной совокупности достаточно велика, то , в этом случае , то , то есть, зная параметры биномиального распределения всегда можно рассчитать параметры гипергеометрического.

13. Нормальное  распределение.

Нормальное распределение – это наиболее важный вид распределения в статистике.

Нормально распределяются значения признака под воздействием множества различных причин, которые практически не взаимосвязаны друг с другом и влияние каждой из которых сравнительно мало, по сравнению с действием всех остальных факторов.

Нормальное распределение отражает вариацию значений признака у единиц однородной совокупности. Подобное распределение наблюдается преимущественно в естественно-научных испытаниях (измерение роста, веса).

В социально-экономических явлениях нормального распределения данные встречаются редко. Здесь всегда присутствуют причины существенным образом влияющие на уровень изучаемого признака (результат управленческого воздействия).

Тем не менее, гипотеза о нормальном распределении исходных данных лежит в основе методологии анализа взаимосвязей выборочного метода и многих других статистических методов.

При достаточно большом числе испытаний нормальная кривая служит пределом, к которому стремятся многие виды распределения, в том числе биномиальное и гипергеометрическое.

Нормальное распределение выражается функцией вида:

Данная функция характеризует плотность нормального распределения вероятности, ее математическое ожидание , а показатель степени – стандартное значение отклонений эмпирических данных от среднеарифметических.

Масштабирование данных кривой по оси x осуществляется величинами среднеквадратического отклонения . Так как показатель степени функции возведет в четную степень, функция положительна, кривая симметрична относительно средней, то есть показатель асимметрии равен . Показатель эксцесса кривой нормального распределения так же равен 0.

Значения параметров и влияют на форму и положение графика на координатной плоскости. С изменением при кривая скользит вдоль оси x. С изменением при чем больше тем более плосковершинной становится нормальная кривая. Нормальная кривая имеет точки перегиба с координатами . Площадь, ограниченная функцией и ординатами, проведенными из точек с координатами:

составляет 0,6827 площади всей кривой;

— 0,9545 площади всей кривой;

— 0,9973 площади всей кривой.

14. Сравнительная  оценка параметров эмпирического  и нормального распределений. Критерий  Пирсона.

Информация о работе Сравнительная оценка параметров эмпирического и нормального распределений. Критерий Пирсона