Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона

Автор работы: Пользователь скрыл имя, 18 Января 2013 в 17:20, курсовая работа

Описание

Генеральной совокупностью называется совокупность всех возможных наблюдений, проводимых в одинаковых условиях над некоторыми случайными величинами.
Отобранные из генеральной совокупности объекты называются выборкой.
Число объектов данной выборки называется объемом выборки (n).
Дана выборка из генеральной совокупности случайной величины X:
Наиболее употребляемым и простым критерием для проверки статистических гипотез является критерий Пирсона (χ2).

Содержание

1. Исходные данные
2. Вариационный ряд
3. Интервальный вариационный ряд
4. Гистограмма. Выдвижение гипотезы о законе распределения генеральной совокупности X
5. Теоретическая функция плотности рассмотренного закона. Оценки числовых характеристик и оценки параметров закона
6. Проверка критерия Пирсона

Работа состоит из  1 файл

математика.doc

— 157.00 Кб (Скачать документ)

ФБГОУ ВПО «Сибирская государственная автомобильно-дорожная

академия (СибАДИ)»

 

 

 

Кафедра «Высшая математика»

 

 

 

РАСЧЕТНО-ГРАФИЧЕСКАЯ  РАБОТА

по дисциплине «Высшая  математика»

на тему: «Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона» (Вариант №58)

 

 

 

 

 

 

Выполнил: студент гр. ПГСб-11В1

Остапченко М. И.

Проверила: Мирошниченко Т. П.

 

 

 

 

 

 

 

Омск-2012

Содержание 

 

  1. Исходные данные
  2. Вариационный ряд
  3. Интервальный вариационный ряд
  4. Гистограмма. Выдвижение гипотезы о законе распределения генеральной совокупности X
  5. Теоретическая функция плотности рассмотренного закона. Оценки числовых характеристик и оценки параметров закона
  6. Проверка критерия Пирсона

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. Исходные данные

 

Математической  статистикой называется наука о методах получения и обработки результатов наблюдений (измерений) для установления закономерностей в массовых случайных явлениях. В математической статистике решается 2 типа задач:

  1. Оценивание - получение точечных и интервальных оценок некоторых параметров или числовых характеристик.
  2. Статистическая проверка гипотез заключается в проверке согласованности результатов эксперимента с предлагаемой гипотезой о распределении вероятностей случайной величины.

Генеральной совокупностью называется совокупность всех возможных наблюдений, проводимых в одинаковых условиях над некоторыми случайными величинами.

Отобранные из генеральной  совокупности объекты называются выборкой.

Число объектов данной выборки  называется объемом выборки (n).

Дана выборка из генеральной совокупности случайной величины X:

Табл. 1

Генеральная совокупность

0,569

1,986

3,399

0,136

1,526

0,546

0,582

0,340

0,438

0,138

1,536

0,089

1,414

0,450

0,336

3,986

1,454

0,254

1,104

0,920

0,733

0,084

0,366

1,312

1,517

2,112

0,530

2,075

0,976

0,206

0,542

0,418

1,593

0,275

0,098

1,227

0,978

0,298

0,025

0,308

0,870

1,728

2,277

0,250

0,271

0,453

0,101

1,308

1,779

1,401

           

 

n= 50-объем выборки.

 

      1. Вариационный ряд

После того как из генеральной совокупности извлечена выборка, ее объекты обследуют по отношению к генеральной совокупности, для этого их подвергают обработке.

Операция заключается  в том, что элементы выборки располагают  в порядке их возрастания, называемое ранжированием, а последовательность элементов называется вариационным рядом, а элементы называются вариантами.

Табл. 2

Ранжированный ряд

 

0,025

0,084

0,089

0,098

0,101

0,136

0,138

0,206

0,250

0,254

0,271

0,275

0,298

0,308

0,336

0,340

0,366

0,418

0,438

0,450

0,453

0,530

0,542

0,546

0,569

0,582

0,733

0,870

0,920

0,976

0,978

1,104

1,227

1,308

1,312

1,401

1,414

1,454

1,517

1,526

1,536

1,593

1,728

1,779

1,986

2,075

2,112

2,277

3,399

3,986


 

Диапазон наблюденных  значений случайной величины X укладывается в интервал (0,025; 3,986). Ранжированные опытные данные объединяем в группы.

Если выборка содержит много вариантов, то для простоты изучения варианты разбивают на отдельные  интервалы, т.е. проводят группировку  и получают группированный вариационный ряд (статистический ряд).

Численность отдельной  группы сгруппированного ряда опытных  данных называется выборочной частотой соответствующей варианты X(i) и обозначается: - выборочная частота,

При этом

         Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и находится по формуле:

 

, где i-номер варианта, причем

 

3. Интервальный  вариационный ряд

 

Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений случайных величин, с соответствующими им частотами или относительной частотой.

Для построения вариационного  ряда выполняются следующие действия:

1. Находим размах выборки:

R=Xнаиб.-Xнаим.

R=3,986 – 0,025 = 3,961

2. Назначаем количество частичных интервалов k=8

Находим шаг разбиения ∆:

При этом округление производим до ближайшего целого числа или до ближайшей простой дроби.

3. После разбиения  на частичные интервалы рассмотрим  ранжированную выборку и определяем, сколько значений признака попало  в каждый частичный интервал. В итоге получаем интервальный  вариационный ряд.

 

4. Гистограмма.  Выдвижение гипотезы о законе распределения генеральной совокупности X

Гистограмма – это  изображение интервального ряда, представляющее собой ступенчатую  фигуру, состоящую из прямоугольников  с основаниями равными длине  интервала  (2) и высотой (3).

Вариационный ряд является статистическим аналогом распределения  случайной величины X, а гистограмма – статистическим аналогом функции плотности. По гистограмме будет выдвигаться гипотеза о законе распределения случайной величины X.

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 1- Гистограмма и выравнивающая ее кривая

          Вид данной гистограммы позволяет выдвинуть гипотезу о нормальном законе распределения исследуемой случайной величины.

Результаты расчетов в столбцах хi и f(xi) дают возможность построить на гистограмме выравнивающую кривую функции плотности (прод. табл. 3).

 

 

 

 

 

 

 

 

 

Табл. 3

Интервальный вариационный ряд

 

xi – xi+1

i  - середина интервала

mi* частота

pi*= mi*/n

hi*= pi*/∆

 

e - xi

 f(xi) =

e- xi

pi= f(xi) .

npi

mi*- npi

(mi*- npi)2

(mi*- npi)2

npi

0 – 0,5

0,25

21

0,42

0,84

0,26

0,7710

0,810

0,405

20,25

0,75

0,563

0,028

0,5 – 1,0

0,75

10

0,20

0,40

0,79

0,4538

0,476

0,238

11,90

-1,90

3,610

0,303

1,0 – 1,5

1,25

7

0,14

0,28

1,31

0,2698

0,283

0,119

5,95

1,05

1,103

0,185

1,5 – 2,0

1,75

7

0,14

0,28

1,84

0,1588

0,167

0,084

4,20

2,80

7,840

1,867

2,0 - 2,5

2,25

3

0,06

0,12

2,36

0,0944

0,099

0,050

2,50

0,50

0,250

0,100

2,5 – 3,0

2,75

0

0

0

2,89

0,0556

0,058

0,029

1,45

1,45

2,103

1,450

3,0 – 3,5

3,25

1

0,02

0,04

3,41

0,0330

0,035

0,018

0,90

0,10

0,010

0,011

3,5 – 4,0

3,75

1

0,02

0,04

3,94

0,0195

0,020

0,010

0,50

0,50

0,250

0,500

   

∑ mi*=50

∑ pi=1

       

∑ pi=1

     

Х2в=4,4


 

Где - середина i-ого интервала;

ti –нормированная нормальная случайная величина i-ого интервала;

pi – вероятность попадания возможных значений случайной величины в i-ый интервал.

 

Предварительно для  вычислений значений функции плотности (табл. 3) были найдены точечные оценки математического ожидания и дисперсии, что позволило получить оценки параметров µ и σ ( ).

 

 

5. Теоретическая функция плотности рассмотренного закона.

Оценки числовых характеристик и оценки параметров закона

 

Показательный закон распределения

 

Главная особенность  этого закона – это то, что  он является предельным законом, к которому приближаются другие законы распределения.

Непрерывная случайная  величина X распределена по нормальному закону (закону Гаусса) с параметрами µ и σ2 ( ), если ее функция плотности имеет вид:

                                   

                                                (4)

 

Найдем оценки М(х) и D(х).

Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности X, вычисленные на основе выборки.

Оценка называется точечной, если она определяется одним числом или точкой на числовой оси.

При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов (х͂i) из интервального вариационного ряда.

Выборочной средней (оценкой математического ожидания) называется среднее арифметическое значение признака выборочной совокупности.

                                   

                                                 (5)

Выборочная дисперсия (оценка дисперсии) – это среднее арифметическое квадратов отклонений вариант от их выборочной средней.

                                  

                                    (6)

 

Среднее квадратическое отклонение:

                                               

                                            (7)

Коэффициент вариации

                                            (8)

Оценка параметра  закона распределения  

                             6. Проверка критерия Пирсона

 

Наиболее употребляемым и простым критерием для проверки статистических гипотез является критерий Пирсона (χ2).

Распределение χ2 зависит от параметра r, который называют числом степеней свободы:

                                                 r= k - q,                                                     (9)

где k- количество объединенных интервалов;

q – число независимых условий («связей»), наложенных на относительные частоты pi* (для нормального закона распределения q=3).

Для практических целей  величину χ2 считают по формуле:

                                           

                                        (10)

Метод проверки гипотезы с помощью критерия χ2 можно сформулировать следующим образом:

    1. Определить меру расхождения между теоретическим и выборочным распределениями по формуле (10).
    2. Определить  r= k – q.
    3. Выбрать уровень значимости α и по таблице распределения χ2 по этому уровню значимости и числу степеней свободы r найти предел χ2 α, r
    4. Если  χ2в > χ2 α,r, то гипотеза с вероятностью P=1-α отвергается.

Если же χ2в ≤ χ2 α,r, то гипотеза с вероятностью P=1- α принимается.

 

Проверим гипотезу о  нормальном распределении исследуемой  нами величины:

1.

2. r= k – q= 5 - 2= 3

3. Выбираем уровень  значимости α = 0,05 и соответствующее  значение χ2 0,05; 3 = 7,8

4. χ2< χ2 0,05; 5 (3,8<7,8), т.е. гипотеза о показательном распределении не противоречит опытным данным, поэтому должна быть принята.

Найдем доверительные  интервалы для MX и DX. По формуле и по формуле

Тогда для доверительной  вероятности p = 0,95 найдем значение up по табл. П.2 как значение аргумента функции Лапласа, при котором она равна ;   u 0,95 = 1,96.

Получаем соответственно 0,95-1,96*0,117<MX<0,95+1,96*0,117

                                                               0,721<MX<1,179

                                             0,69-1,96*0,139<DX<0,69+1,96*0,139

                                                               0,418<DX<0,962

Информация о работе Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона