Влияние факторного признака на результаивный
Контрольная работа, 26 Февраля 2012, автор: пользователь скрыл имя
Описание
По исходным данным, характеризующим территории региона за 199х год необходимо1:
Построить поле корреляции.
Для характеристики зависимости у от х:
а) построить линейное уравнение парной регрессии у от х;
б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации;
Работа состоит из 1 файл
эконометика.docx
— 136.23 Кб (Скачать документ)1.2.
Типовой пример выполнения
Задание:
По исходным данным, характеризующим территории региона за 199х год необходимо1:
- Построить поле корреляции.
- Для характеристики зависимости у от х:
а) построить линейное уравнение парной регрессии у от х;
б) оценить
тесноту связи с помощью
в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации;
г) дать оценку силы связи с помощью среднего коэффициента эластичности;
д) оценить статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера;
е) оценить статистическую значимость параметров регрессии и корреляции.
3) Проверить результаты, полученные в п.2 с помощью ППП Exel.
4) Рассчитать
параметры показательной
5. Обосновано
выбрать лучшую модель и
Решение:
Для нашего примера
Результативный признак (у) – урожайность картофеля, ц/га
Факторный признак (х) – доза внесения органических удобрений, ц/га
Таблица 1.1. – Исходные данные для анализа
№ региона |
Доза внесения удобрений, ц/га х |
Урожайность картофеля, ц/га у |
1 |
115 |
250 |
2 |
98 |
249 |
3 |
105 |
242 |
4 |
109 |
193 |
5 |
102 |
256 |
6 |
116 |
215 |
7 |
97 |
200 |
8 |
92 |
240 |
9 |
112 |
228 |
10 |
110 |
230 |
11 |
104 |
235 |
12 |
100 |
221 |
13 |
95 |
249 |
14 |
98 |
220 |
15 |
107 |
245 |
16 |
106 |
260 |
- Построим поле корреляции, для чего отложим на плоскости в прямоугольной сист
еме координат точки (xi yi) (рис.1.1).
Рис. 1.1. Поле корреляции
Расположение
точек на графике не позволяет
точно определить тип уравнения
регрессии. Для выявления типа зависимости
воспользуемся
2. Для расчета
параметров линейной регрессии
построим расчетную таблицу (
Таблица 1.2. – Расчетные значения
№ |
х |
у |
xy |
х2 |
у2 |
(Ai, %) |
|
|
|
||
1 |
115 |
250 |
28750 |
13225 |
62500 |
230,464 |
7,814 |
381,657 |
118,266 |
8,114 |
278,473 |
2 |
98 |
249 |
24402 |
9604 |
62001 |
234,917 |
5,656 |
198,335 |
37,516 |
2,574 |
246,098 |
3 |
105 |
242 |
25410 |
11025 |
58564 |
233,083 |
3,685 |
79,507 |
0,766 |
0,053 |
75,473 |
4 |
109 |
193 |
21037 |
11881 |
37249 |
232,036 |
20,226 |
1523,775 |
23,766 |
1,631 |
1625,098 |
5 |
102 |
256 |
26112 |
10404 |
65536 |
233,869 |
8,645 |
489,776 |
4,516 |
0,310 |
514,723 |
6 |
116 |
215 |
24940 |
13456 |
46225 |
230,202 |
7,071 |
231,101 |
141,016 |
9,675 |
335,348 |
7 |
97 |
200 |
19400 |
9409 |
40000 |
235,179 |
17,589 |
1237,547 |
50,766 |
3,483 |
1109,723 |
8 |
92 |
240 |
22080 |
8464 |
57600 |
236,488 |
1,463 |
12,331 |
147,016 |
10,087 |
44,723 |
9 |
112 |
228 |
25536 |
12544 |
51984 |
231,250 |
1,425 |
10,561 |
62,016 |
4,255 |
28,223 |
10 |
110 |
230 |
25300 |
12100 |
52900 |
231,774 |
0,771 |
3,146 |
34,516 |
2,368 |
10,973 |
11 |
104 |
235 |
24440 |
10816 |
55225 |
233,345 |
0,704 |
2,738 |
0,016 |
0,001 |
2,848 |
12 |
100 |
221 |
22100 |
10000 |
48841 |
234,393 |
6,060 |
179,372 |
17,016 |
1,167 |
151,598 |
13 |
95 |
249 |
23655 |
9025 |
62001 |
235,703 |
5,340 |
176,819 |
83,266 |
5,713 |
246,098 |
14 |
98 |
220 |
21560 |
9604 |
48400 |
234,917 |
6,780 |
222,513 |
37,516 |
2,574 |
177,223 |
15 |
107 |
245 |
26215 |
11449 |
60025 |
232,559 |
5,078 |
154,768 |
8,266 |
0,567 |
136,598 |
16 |
106 |
260 |
27560 |
11236 |
67600 |
232,821 |
10,453 |
738,678 |
3,516 |
0,241 |
712,223 |
Итого |
1666 |
3733 |
388497 |
174242 |
876651 |
3733,000 |
108,761 |
5642,625 |
769,750 |
52,813 |
5695,438 |
Ср.знач |
104,125 |
233,313 |
24281,063 |
10890,125 |
54790,6875 |
233,313 |
6,798 |
352,664 |
48,109 |
||
σ |
6,936 |
|
|||||||||
σ2 |
48,109 |
355,965 |
2а. Построим
линейное уравнение парной
β= =-0,2619
a = =
Тогда линейное уравнение парной регрессии имеет вид:
Полученное уравнение показывает, что с увеличением дозы внесения органических уравнений на l ц/га урожайность картофеля уменьшается в среднем на 0,2619 ц/га.
Рис. 1.2. Зависимость между дозой внесения органических удобрений и урожайностью картофеля (линейная регрессия).
Подставляя в полученное уравнение регрессии значения xi из исходных данных определяем теоретические (выровненные) значения результативного признака (табл.1.2).
2б. При линейной корреляции между х и у исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи.
Учитывая:
,
оценим тесноту линейной связи с помощью линейного коэффициента парной корреляции
Связь между факторами обратная. В соответствии со шкалой Чеддока теснота характеризуется как слабая.
Изменение результативного признака у обусловлено вариацией факторного признака х. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D. Коэффициент детерминации – квадрат коэффициента корреляции.
R2=rху2·100%
R2= (-0,1105)2 ∙100%=0,0122∙100%=1,22%
Следовательно, вариация урожайности картофеля на 1,22 % объясняется вариацией дозы внесения удобрений, а остальные 98,78% вариации урожайности обусловлены изменением других, не учтенных в модели факторов.
= =
В среднем расчетные значения отклоняются от фактических на 6,113%. Это значение не превышает допустимый предел, следовательно качество построенной модели высокое.
Для оценки силы связи признаков у и х найдем средний коэффициент эластичности:
.= =
Таким образом, в среднем на -0,129% по совокупности изменится урожайность картофеля от своей средней величины при изменении дозы внесения удобрений на 1% от своего среднего значения.
2д) Для
оценки статистической
Выдвигаем нулевую гипотезу Но о статистической незначимости полученного уравнения регрессии.
Fфакт = = · (n-2)
Fфакт= =0,1732
Сравним фактическое значение критерия Фишера с табличным. Для этого выпишем значения критерия Фишера из таблицы «Значения F-критерия Фишера при уровне значимости a=0.05» (приложение 1).
В нашем примере k1=1; k=12-1-1=10.
Таким образом. Fтабл.= 4,6 при =0,05.
Т.к. Fфакт.< Fтабл., то при заданном уровне вероятности g=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.
2е) Для
оценки статистической
Выдвигаем гипотезу Но о статистически незначимом отличии показателей регрессии от нуля a=b=rух =0.
Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:
; ;
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и критическое (табличное) значения t-статистики принимаем или отвергаем гипотезу Но.
Если tтабл < tфакт, то Но отклоняется, т.е. a, b, r не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если tтабл > tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования a, b, r.
; ;
tтабл при уровне значимости g=0,05 и числе степеней свободы равных 12-2=10 равно 2,2281 (приложение 2).
< tтабл, < tтабл, < tтабл,
следовательно нулевая гипотеза о несущественности коэффициентов корреляции и регрессии принимается , т. е. r, b и a статистически незначимы.
Для расчета доверительного интервала определяем предельную ошибку ∆ для каждого показателя:
∆a = tтабл ma=2,2281∙29,92=66,654
∆b = tтабл mb=2,2281∙0,3388=0,7541
Доверительные интервалы:
Для параметра a: (-5,304; 128,011)
Для параметра b: (-0,029; 1,479)
Анализ верхних и нижних границ доверительных интервалов приводит к выводу, что с вероятностью p = 1–γ = 0,95 параметры a и b находятся в указанных пределах, причем оба параметра являются статистически незначимыми, т.к. в границы доверительного интервала попадает ноль.
3. Проверим результаты, полученные в п.2 с помощью ППП Exel.
Встроенная функция ЛИНЕЙН определяет параметры линейной регрессии. В ходе анализа придерживайтесь следующего порядка вычислений:
- введите исходные данные или откройте существующий файл, содержащий исходную информацию для анализа;
- выделите область пустых ячеек 5Í2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики;
- активизируйте Мастер функций одним из способов:
а) в главном меню выберите Вставка/Функция;
б) на панели инструментов Стандартная щелкните по кнопке Вставка функции;
4) в окне Категория (рис. 1.3) выберите Статистические, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК.
5) Заполните аргументы функции (рис. 1.4):
известные_значения_у – диапазон, содержащий данные результативного признака;
известные_значения_х – диапазон, содержащий данные факторов независимого признака;
константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член = 0;
Рис. 1.3. Диалоговое окно «Мастер функций».
статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.
Щелкните по кнопке ОК.
6) В левой
верхней ячейке выделенной
Дополнительная регрессионная статистика будет выводится в порядке, указанном в следующей таблице:
Таблица 1.3.– Регрессионная статистика
Значение коэффициента β |
Значение коэффициента α |
Среднеквадратическое отклонение β |
Среднеквадратическое отклонение α |
Коэффициент детерминации R2 |
Среднеквадратическое отклонение у |
F– статистика |
Число степеней свободы |
Регрессионная сумма квадратов |
Остаточная сумма квадратов |