Нарушения допущений классической модели линейной регрессии
Лабораторная работа, 21 Ноября 2012, автор: пользователь скрыл имя
Описание
В лабораторной работе № 1 выявили, что на чистый доход (y) предприятий оказывают влияния такие факторы, как использованный капитал (x2) и численность служащих (x3).
Для нахождения остатков воспользуемся инструментом анализа данных Регрессия.
Работа состоит из 1 файл
лабораторная работа №3.doc
— 1.52 Мб (Скачать документ)Министерство образования Российской Федерации
Федеральное агентство по образованию
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Финансово экономический факультет
Кафедра финансы и кредит
ОТЧЕТ
по лабораторной работе № 3
по курсу Эконометрики
Нарушения допущений классической модели
линейной регрессии
ГОУ ОГУ 080105.65.7012.08 О
Руководитель
_______________ Лебедева Т.В.
"___”_______________2012 г.
Исполнитель
студент гр. 10ФК02
____________ Елисеева Е.В.
"___"_______________
Оренбург 2012
Исходные данные (вариант 3):
№ п/п |
Пол руководителя компании | ||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
45,9 |
34 |
68 |
12,5 |
43,3 |
2,3 |
муж |
2 |
46,7 |
16,1 |
49,3 |
18,8 |
42,9 |
3,9 |
жен |
3 |
45,7 |
7,2 |
66,6 |
7 |
41,3 |
1,7 |
муж |
4 |
46,7 |
12,7 |
17,3 |
14,6 |
40,9 |
2,6 |
муж |
5 |
47,6 |
22,7 |
78,5 |
30,7 |
39,7 |
3,1 |
муж |
6 |
46,3 |
17,7 |
20,9 |
28 |
28,9 |
0,6 |
жен |
7 |
49,1 |
139,8 |
356,4 |
100,6 |
39,4 |
5,1 |
муж |
8 |
46,6 |
20,6 |
72,4 |
24,8 |
39,2 |
2,6 |
муж |
9 |
51,9 |
168,1 |
218,2 |
216,1 |
38,7 |
4,5 |
муж |
10 |
45,4 |
4,7 |
5 |
1,2 |
37,7 |
1,9 |
жен |
11 |
46,3 |
9,5 |
28,8 |
7,8 |
37,7 |
3 |
жен |
12 |
46,9 |
29,8 |
68 |
12,4 |
37,4 |
3,6 |
жен |
13 |
46,9 |
16,1 |
47,5 |
17,9 |
28,6 |
3,7 |
муж |
14 |
46,4 |
12,5 |
45,4 |
61,5 |
35,5 |
2,5 |
жен |
15 |
45,4 |
22,2 |
43,9 |
30,5 |
35,1 |
3,1 |
жен |
16 |
45,8 |
9,5 |
11,5 |
9,7 |
34,5 |
0,3 |
жен |
17 |
46,8 |
29,7 |
46,8 |
41,2 |
32,9 |
2,2 |
муж |
18 |
45,9 |
15,1 |
24,8 |
27,8 |
32,2 |
3,5 |
жен |
19 |
46,1 |
20,4 |
54 |
40,6 |
27,8 |
4,1 |
жен |
20 |
46,9 |
15,4 |
42,8 |
17,2 |
31,7 |
4,3 |
муж |
21 |
44,1 |
24,1 |
5,8 |
38 |
31,6 |
2,9 |
муж |
22 |
46,3 |
16,2 |
31 |
20,5 |
31,6 |
3,5 |
муж |
23 |
47 |
16,1 |
41,4 |
19 |
31,5 |
4 |
муж |
24 |
45,6 |
6,9 |
6,8 |
6,7 |
30,3 |
2,6 |
жен |
25 |
45,7 |
18,2 |
20,9 |
23,4 |
29,6 |
4 |
жен |
где y – чистый доход, млрд. долл.;
x1 – оборот капитала, млрд. долл.;
x2 – использованный капитал, млрд. долл.;
x3 – численность служащих, тыс. чел.;
x4 – рыночная капитализация компаний, млрд. долл.;
x5 – заработная плата служащих, тыс. долл.
Задание:
- Проведите графический анализ остатков. Проверьте остатки на гетероскедастичность с помощью:
- графического анализа,
- теста Голдфелда-Квандта,
- теста ранговой корреляции Спирмена,
- теста Уайта (White test).
- Если будет обнаружена гетероскедастичность остатков, примените для исходных данных ОМНК, предполагая, что .
3. Проверить
остатки на наличие
Реализация заданий:
В лабораторной работе № 1 выявили, что на чистый доход (y) предприятий оказывают влияния такие факторы, как использованный капитал (x2) и численность служащих (x3).
Для нахождения остатков воспользуемся инструментом анализа данных Регрессия.
Заполним диалоговое окно ввода данных и параметров ввода (рисунок 1):
Входной интервал Y – диапазон, содержащий данные результативного признака, в нашем случае это ячейки с B2 по B26;
Входной интервал Х – диапазон, содержащий данные двух факторов (x2 и x3), в нашем случае это ячейки с D2 по D26 и с E2 по E26;
Метки – флажок, который указывает, содержит ли первая строка названия столбцов или как в нашем случае нет;
Константа – ноль – флажок, указывающий на наличие или отсутствие свободного члена в уравнении, в нашем случае его нет;
Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист - можно задать произвольное имя нового листа в нашем случае выводится на тот же рабочий лист, где находятся исходные данные;
Остаток - флажок, указывает вывод остатков и теоретические значения результативного признака.
Рисунок 1 – Регрессия с остатками
Полученные результаты регрессионного и корреляционного анализа, а также вспомогательные характеристики представлены на рисунке 2.
Рисунок 2 – Вывод остатков
Проверим остатки
полученного уравнения
Графический анализ остатков
Построим графики остатков для каждого уравнения (рисунок 3 и 4):
Рисунок 3 – График остатков для фактора х4
Как видно на рисунке отклонения не лежат внутри полуполосы постоянной ширины, это говорит, о зависимости дисперсионных остатков от величины х2 и о их непостоянстве, т.е. о наличии гетероскедастичности.
Рисунок 4 – График остатков для фактора х3
Как видно на рисунке отклонения не лежат внутри полуполосы постоянной ширины, это говорит, о зависимости дисперсионных остатков от величины х3 и о их непостоянстве, т.е. о наличии гетероскедастичности.
Тест Голфелда-Квандта
1) Все n наблюдений упорядочиваются по величине X2 и X3.
Таблица 1 – Упорядоченные значения по фактору х2:
№ п/п |
y |
x2 |
|
1 |
45,4 |
5 |
2 |
44,1 |
5,8 |
3 |
45,6 |
6,8 |
4 |
45,8 |
11,5 |
5 |
46,7 |
17,3 |
6 |
46,3 |
20,9 |
7 |
45,7 |
20,9 |
8 |
45,9 |
24,8 |
9 |
46,3 |
28,8 |
10 |
46,3 |
31 |
11 |
47 |
41,4 |
12 |
46,9 |
42,8 |
13 |
45,4 |
43,9 |
14 |
46,4 |
45,4 |
15 |
46,8 |
46,8 |
16 |
46,9 |
47,5 |
17 |
46,7 |
49,3 |
18 |
46,1 |
54 |
19 |
45,7 |
66,6 |
20 |
45,9 |
68 |
21 |
46,9 |
68 |
22 |
46,6 |
72,4 |
23 |
47,6 |
78,5 |
24 |
51,9 |
218,2 |
25 |
49,1 |
356,4 |
Таблица 2 – Упорядоченные значения по фактору х3:
№ п/п |
y |
x3 |
|
1 |
45,4 |
1,2 |
2 |
45,6 |
6,7 |
3 |
45,7 |
7 |
4 |
46,3 |
7,8 |
5 |
45,8 |
9,7 |
6 |
46,9 |
12,4 |
7 |
45,9 |
12,5 |
8 |
46,7 |
14,6 |
9 |
46,9 |
17,2 |
10 |
46,9 |
17,9 |
11 |
46,7 |
18,8 |
12 |
47 |
19 |
13 |
46,3 |
20,5 |
14 |
45,7 |
23,4 |
15 |
46,6 |
24,8 |
16 |
45,9 |
27,8 |
17 |
46,3 |
28 |
18 |
45,4 |
30,5 |
19 |
47,6 |
30,7 |
20 |
44,1 |
38 |
21 |
46,1 |
40,6 |
22 |
46,8 |
41,2 |
23 |
46,4 |
61,5 |
24 |
49,1 |
100,6 |
25 |
51,9 |
216,1 |
2) Исключим С центральных наблюдений, разобьем совокупность на две части: а) со значениями x ниже центральных; б) со значениями x выше центральных.
Исключение С средних наблюдений в этом упорядочении в целях построения двух независимых "частных" регрессий по данным n' = (n-с)/2 в начале выборки и по данным n' = (n - с)/2 в конце выборки
Пусть С = 5, это наблюдения с порядковыми номерами 11-15.
3) Оцениваются отдельные регрессии для первой подвыборки (10 первых наблюдений) и для третьей подвыборки (10 последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям X верно, то дисперсия регрессии по первой подвыборке (сумма квадратов отклонений ) будет существенно меньше дисперсии регрессии по третьей подвыборке (суммы квадратов отклонений ).
4) По каждой части находим уравнение регрессии (рисунки 5 и 6)
Рисунок 5 – Вывод итогов для подвыборок для фактора х2
Рисунок 6 – Вывод итогов для подвыборок для фактора х3
5) Для сравнения соответствующих дисперсий строится следующая F-статистика:
- для х2:
- для х3:
При сделанных предположениях относительно случайных отклонений построенная F-статистика имеет распределение Фишера с числами степеней свободы v1=v2=(n-C-2m)/2. Тогда,
6) Если , то гипотеза об отсутствии гетероскедастичности отклоняется ( - выбранный уровень значимости).
По проведенным расчетам в обоих случаях (и для х2, и для х3) мы получили, что следовательно в ряду остатков обнаружена гетероскедастичность.
Тест ранговой корреляции Спирмена
Значения хi и ui ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции:
где di - разность между рангами хi и ui, i = 1, 2, ..., n;
n - число наблюдений.
Рассчитаем теоретические значения для x2 по уравнению регрессии и найдем остатки. Ранжируем совокупность по возрастанию (рисунок 7).
№ п/п |
y |
x2 |
Теоритическое y |
Остатки |
Модуль остатков |
Ранг x |
Ранг u |
d2 |
|
1 |
45,4 |
5 |
45,768 |
-0,368 |
0,368 |
1 |
11 |
100 |
2 |
44,1 |
5,8 |
45,780 |
-1,680 |
1,680 |
2 |
22 |
400 |
3 |
45,6 |
6,8 |
45,795 |
-0,195 |
0,195 |
3 |
6 |
9 |
4 |
45,8 |
11,5 |
45,864 |
-0,064 |
0,064 |
4 |
2 |
4 |
5 |
46,7 |
17,3 |
45,949 |
0,751 |
0,751 |
5 |
17 |
144 |
6 |
46,3 |
20,9 |
46,002 |
0,298 |
0,298 |
6 |
9 |
9 |
7 |
45,7 |
20,9 |
46,002 |
-0,302 |
0,302 |
6 |
10 |
16 |
8 |
45,9 |
24,8 |
46,059 |
-0,159 |
0,159 |
7 |
4 |
9 |
9 |
46,3 |
28,8 |
46,118 |
0,182 |
0,182 |
8 |
5 |
9 |
10 |
46,3 |
31 |
46,150 |
0,150 |
0,150 |
9 |
3 |
36 |
11 |
47 |
41,4 |
46,303 |
0,697 |
0,697 |
10 |
16 |
36 |
12 |
46,9 |
42,8 |
46,324 |
0,576 |
0,576 |
11 |
15 |
16 |
13 |
45,4 |
43,9 |
46,340 |
-0,940 |
0,940 |
12 |
20 |
64 |
14 |
46,4 |
45,4 |
46,362 |
0,038 |
0,038 |
13 |
1 |
144 |
15 |
46,8 |
46,8 |
46,383 |
0,417 |
0,417 |
14 |
13 |
1 |
16 |
46,9 |
47,5 |
46,393 |
0,507 |
0,507 |
15 |
14 |
1 |
17 |
46,7 |
49,3 |
46,419 |
0,281 |
0,281 |
16 |
8 |
64 |
18 |
46,1 |
54 |
46,488 |
-0,388 |
0,388 |
17 |
12 |
25 |
19 |
45,7 |
66,6 |
46,673 |
-0,973 |
0,973 |
18 |
21 |
9 |
20 |
45,9 |
68 |
46,694 |
-0,794 |
0,794 |
19 |
19 |
0 |
21 |
46,9 |
68 |
46,694 |
0,206 |
0,206 |
19 |
7 |
144 |
22 |
46,6 |
72,4 |
46,759 |
-0,159 |
0,159 |
20 |
4 |
256 |
23 |
47,6 |
78,5 |
46,848 |
0,752 |
0,752 |
21 |
18 |
9 |
24 |
51,9 |
218,2 |
48,901 |
2,999 |
2,999 |
22 |
24 |
4 |
25 |
49,1 |
356,4 |
50,932 |
-1,832 |
1,832 |
23 |
23 |
0 |
Сумма: |
1509 |