04. Решение типовых задач
Задача 1.1.
По районам региона приводятся данные за 200Х г. (табл. 1.1).
Таблица 1.6
Номер района |
Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Х |
Среднедневная заработная плата, руб., У |
1 |
78 |
133 |
2 |
82 |
148 |
3 |
87 |
134 |
4 |
79 |
154 |
5 |
89 |
162 |
6 |
106 |
195 |
7 |
67 |
139 |
8 |
88 |
158 |
9 |
73 |
152 |
10 |
87 |
162 |
11 |
76 |
159 |
12 |
115 |
173 |
Требуется:
1. Построить линейное уравнение парной регрессии у от х.
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции.
4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу (табл. 1.2).
;
Таблица 1.2
№ |
Х |
У |
Xy |
X2 |
Y2 |
|
YI- |
|
1 |
78 |
133 |
10374 |
6084 |
17689 |
149 |
-16 |
11,84962 |
2 |
82 |
148 |
12136 |
6724 |
21904 |
152 |
-4 |
3 |
3 |
87 |
134 |
11658 |
7569 |
17956 |
157 |
-23 |
17,19403 |
4 |
79 |
154 |
12166 |
6241 |
23716 |
150 |
4 |
2,805195 |
5 |
89 |
162 |
14418 |
7921 |
26244 |
159 |
3 |
1,925926 |
6 |
106 |
195 |
20670 |
11236 |
38025 |
175 |
20 |
10,50256 |
7 |
67 |
139 |
9313 |
4489 |
19321 |
139 |
0 |
0,258993 |
8 |
88 |
158 |
13904 |
7744 |
24964 |
158 |
0 |
0,025316 |
9 |
73 |
152 |
11096 |
5329 |
23104 |
144 |
8 |
5,157895 |
10 |
87 |
162 |
14094 |
7569 |
26244 |
157 |
5 |
3,061728 |
11 |
76 |
159 |
12084 |
5776 |
25281 |
147 |
12 |
7,597484 |
12 |
115 |
173 |
19895 |
13225 |
29929 |
183 |
-10 |
5,66474 |
Итого |
1027 |
1869 |
161808 |
89907 |
294377 |
69,0435 | ||
Среднее Значение |
85,6 |
156 |
13484 |
7492,25 |
24531,42 |
5,753625 | ||
S |
13,5 |
17,3 | ||||||
S2 |
183 |
298 |
.
Получено уравнение регрессии: .
С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
; .
Это означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
.
Качество построенной модели оценивается как хорошее, так как средняя относительная ошибка аппроксимации не превышает 8-10%.
3. Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Выдвигаем гипотезу Н0 о статистически незначимом отличии показателя от нуля: .
Определим случайные ошибки Ma, mb, :
;
;
.
Тогда
; ;
.
Фактические значения t-статистики превосходят табличные значения:
; ; ,
Поэтому гипотеза Н0 отклоняется, т. е. A, B и Rxy не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительный интервал для A и B. Для этого определим предельную ошибку для каждого показателя:
; .
Доверительные интервалы:
;
;
;
;
;
.
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры A и B, находясь в указанных границах, не принимают нулевые значения, т. е. не являются статистики незначимыми и существенно отличаются от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение промежуточного минимума составит: тыс. руб., тогда прогнозное значение прожиточного минимума составит: тыс. руб.
5. Ошибка прогноза составит:
тыс. руб.
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
.
Доверительный интервал прогноза:
;
руб.;
руб.
Выполненный прогноз среднемесячной заработной платы оказался надежным, но неточным, т. к. диапазон верхней и нижней границ доверительного интервала составляет 1,95 раза (121/62,2).
Задача 1.2.
Зависимость потребления продукта А от среднедушевого дохода по данным 20 семей характеризуется следующим образом:
- уравнение регрессии ;
- индекс корреляции ;
- остаточная дисперсия .
Требуется провести дисперсионный анализ полученных результатов.
Результаты дисперсионного анализа приведены в табл. 1.3.
Таблица 1.3
Вариация результата y |
Число степеней свободы |
Сумма квадратов отклонений, S |
Дисперсия на одну степень свободы, D |
Fрасч |
Fтабл A=0,05 K1=1, K2=18 |
Общая |
Df=n-1=19 |
6,316 | |||
Факторная |
K1=m=1 |
5,116 |
5,116 |
76,7 |
4,41 |
Остаточная |
K2=n-m-1=18 |
1,200 |
0,0667 |
;
;
;
.
В силу того, что , гипотеза о случайности различий факторной и остаточной дисперсий отклоняется. Эти различия существенны, статистически значимы, уравнение надежно, значимо, показатель тесноты связи надежен и отражает устойчивую зависимость потребления продукта А от среднедушевого дохода.
< Предыдущая | Следующая > |
---|