2.15. Адекватность выборочного сглаживающего уравнения регрессии
Построив с помощью метода наименьших квадратов некое сглаживающее выборочное уравнение регрессии (5.54) – например, в линейной форме (5.56) или в какой-то нелинейной форме, мы затем должны проверить его на адекватность выборочным данным (5.52). То есть сделать то, что делалось выше для случая парной корреляции (формулы (5.31 - 5.36)). Для этого:
А) Находим суммы QПовт и QАдекв:
; (5.73)
Б) Находим дисперсии повторности и адекватности
(5.74)
Где Q- число оцениваемых по выборочным данным коэффициентов подобранного сглаживающего уравнения регрессии (5.54) (в случае (5.56) Q = 3);
В) Находим
(5.75)
Где - табличное критическое значение критерия Фишера – Снедекора. И если окажется, что , то подобранное уравнение регрессии (5.54) признаем адекватным выборочным данным (при заданном уравнение значимости ). А если окажется, что , то это уравнение считаем неадекватным, а следовательно, непригодным для оценки истинного (генерального) уравнения регрессии.
Наряду с проверкой адекватности выборочного сглаживающего уравнения регрессии В целом имеется возможность проверить и значимость Каждого его коэффициента в отдельности. Это значит имеется возможность установить, достаточно ли велико по модулю подсчитанное значение интересующего нас коэффициента для статистически обоснованного вывода о том, что он отличен от нуля. То есть значим ли он (нужно его учитывать) или он незначим и учитывать его не нужно. И если окажется, что коэффициент незначим, то его можно положить равным нулю. Это приведёт к упрощению подобранного уравнения регрессии без существенного ущерба для его качества.
Но на этом мы не останавливаемся. Отметим лишь, что такое исследование проводится автоматически, если выборочное сглаживающее уравнение регрессии строится с помощью стандартной программы корреляционно-регрессионного анализа на ЭВМ. В уравнении регрессии, выдаваемом машиной, фигурируют лишь значимые коэффициенты, а заодно и указывается, адекватно ли всё уравнение в целом.
Упражнения.
1. Пусть при исследовании корреляционной зависимости X от Y получено 2N точек корреляционного поля, расположенных симметрично относительно некоторой прямой Y = Kx + B и удаленных от неё в направлении оси Oy на ±δ (см. рис. 3.14). Требуется:
1) Найти выборочное сглаживающее уравнение регрессии ;
2) Найти выборочный коэффициент линейной корреляции
3) Найти выборочное корреляционное отношение
4) Найти выборочный коэффициент детерминации
5) Исследовать вопрос об адекватности выборочным данным найденного уравнения регрессии.
Ответ: 1) - точное сглаживающее выборочное уравнение регрессии;
2); 3); 4);
5) Выборочное уравнение регрессии адекватно выборочным данным при любом уровне значимости .
2. При исследовании корреляционной зависимости урожайности некоторой культуры Y (Ц/га) от глубины орошения X (См) получена следующая корреляционная таблица:
0 |
10 |
20 |
30 |
40 |
50 | ||
10 |
4 |
- |
- |
- |
- |
2 |
6 |
12 |
1 |
2 |
1 |
2 |
2 |
2 |
10 |
14 |
- |
3 |
4 |
2 |
3 |
2 |
14 |
16 |
- |
2 |
4 |
3 |
1 |
- |
10 |
5 |
7 |
9 |
7 |
6 |
6 |
N=40 |
Построить корреляционное поле, соответствующее данной корреляционной таблице. С его помощью из уравнений (5.5) - (5.7) выбрать наиболее подходящую форму для построения выборочного сглаживающего уравнения регрессии И построить это уравнение. Найти выборочное корреляционное отношение И выборочный коэффициент детерминации . При уровне значимости проверить гипотезу об адекватности полученного выборочного уравнения регрессии.
Ответ. По конфигурации корреляционного поля, а также по смыслу рассматриваемых величин X И Y наиболее подходящей формой для выборочного уравнения регрессии является параболическая форма (5.7). Коэффициенты (А0; а1; а2) уравнения (5.7) находятся из решения нормальной системы (5.30). Для формирования матрицы этой системы рекомендуется по данным заданной корреляционной таблицы составить следующую вспомогательную таблицу:
0 |
5 |
10,4 |
0 |
0 |
0 |
0 |
52 |
0 |
0 |
10 |
7 |
14 |
70 |
700 |
7000 |
70000 |
98 |
980 |
9800 |
20 |
9 |
44/3 |
180 |
3600 |
72000 |
1440000 |
132 |
2640 |
52800 |
30 |
7 |
100/7 |
210 |
6300 |
189000 |
5670000 |
100 |
3000 |
90000 |
40 |
6 |
41/3 |
240 |
9600 |
384000 |
15360000 |
82 |
3280 |
131200 |
50 |
6 |
12 |
300 |
15000 |
750000 |
37500000 |
72 |
3600 |
180000 |
40 |
- |
1000 |
35200 |
1402000 |
60040000 |
536 |
13500 |
463800 |
В итоге (убедитесь в этом) получаем следующее выборочное уравнение регрессии:
При этом
Найденное выборочное уравнение регрессии адекватно выборочным данным, причем не только для уровня значимости , но и вообще для любого уровня значимости. Действительно, используя формулы (5.33) - (5.36) и данные предыдущих таблиц получаем:
Но табличное значение критерия Фишера-Снедекора для любых значений . Поэтому для любых значений . А значит, выборочное уравнение регрессии адекватно выборочным данным при любом .
3. Выборочным путем исследовалась корреляционная зависимость некоторой случайной величины Z От двух других случайных величин X и Y. Данные выборки (корреляционная таблица) представлены в первых четырех столбцах таблицы, приводимой ниже:
I |
Xi |
Yi |
Zi |
Xi yi |
Xizi |
Yizi | |||
1 |
25,5 |
17,3 |
85,5 |
441,15 |
2180,25 |
1479,15 |
650,25 |
229,29 |
7310 |
2 |
34,1 |
19,8 |
81,7 |
665,18 |
2785,97 |
1617,66 |
1162,81 |
392,04 |
6675 |
3 |
37,3 |
30,1 |
71,7 |
1122,73 |
2674,41 |
2158,17 |
1391,29 |
906,01 |
5141 |
4 |
44,7 |
31,9 |
62,7 |
1425,93 |
2802,69 |
2000,13 |
1998,09 |
1017,61 |
3931 |
5 |
44,6 |
38,3 |
66,4 |
1708,18 |
2961,44 |
2543,12 |
1989,16 |
1466,89 |
4409 |
6 |
41,0 |
26,5 |
70,6 |
1086,50 |
2894,60 |
1870,90 |
1681,00 |
702,25 |
4984 |
7 |
49,5 |
36,2 |
65,0 |
1791,90 |
3217,50 |
2353,00 |
2450,25 |
1310,44 |
4225 |
8 |
45,1 |
21,0 |
72,8 |
947,10 |
3283,28 |
1528,80 |
2034,01 |
441,00 |
5300 |
9 |
56,5 |
29,5 |
67,6 |
1666,75 |
3819,40 |
1994,20 |
3192,25 |
870,25 |
4570 |
10 |
35,4 |
29,4 |
90,0 |
881,46 |
3186,00 |
2241,00 |
1253,16 |
620,01 |
8100 |
11 |
54,9 |
25,0 |
60,2 |
1372,50 |
3304,98 |
1505,00 |
3014,01 |
625,00 |
3624 |
12 |
32,8 |
28,0 |
74,8 |
918,40 |
2453,44 |
2094,40 |
1075,84 |
784,00 |
5595 |
13 |
55,5 |
33,9 |
63,4 |
1881,45 |
3518,70 |
2149,26 |
3080,25 |
1149,21 |
4020 |
14 |
41,5 |
16,1 |
74,2 |
668,15 |
3079,30 |
1194,62 |
1722,25 |
259,21 |
5506 |
15 |
41,5 |
21,0 |
71,6 |
871,50 |
2971,40 |
1503,60 |
1722,25 |
441,00 |
5127 |
16 |
52,7 |
28,7 |
60,0 |
1512,49 |
3162,00 |
1722,00 |
2777,49 |
823,69 |
3600 |
17 |
37,9 |
20,3 |
81,1 |
769,37 |
3073,69 |
1646,33 |
1436,41 |
412,09 |
6577 |
18 |
43,9 |
19,9 |
71,5 |
873,61 |
3138,85 |
1422,85 |
1927,21 |
396,01 |
5112 |
19 |
35,0 |
22,6 |
77,2 |
791,00 |
2702,00 |
1744,72 |
1225,00 |
510,76 |
5960 |
20 |
27,8 |
20,1 |
91,2 |
558,78 |
2535,36 |
1833,12 |
772,84 |
404,01 |
8317 |
837,2 |
511,1 |
1459,2 |
21964,13 |
59745,26 |
36602,03 |
36555,62 |
13830,77 |
108083 |
Требуется:
1) Построить выборочное сглаживающее уравнение регрессии в линейной форме (5.56).
2) Найти совокупный выборочный коэффициент линейной корреляции R и частные выборочные коэффициенты линейной корреляции и .
3) Найти выборочный коэффициент детерминации .
4) Оценить адекватность выборочным данным построенного уравнения регрессии.
Ответ:
1) Искомое выборочное уравнение регрессии имеет вид
Его можно получить, или составив и решив для коэффициентов (A;B;C) уравнения (5.56) нормальную систему (5.59) (используя для этого результаты приведенной выше таблицы), или воспользовавшись формулами (5.60) - (5.65).
2) R=0,877; = 0,792; =0,374; 3)= R2 = 0.769;
4) Адекватность полученного выборочного уравнения регрессии проверить невозможно, так как корреляционная таблица не содержит результатов повторных опытов для одних и тех же (Xi ; YI), а следовательно, невозможно найти дисперсию повторности .
< Предыдущая | Следующая > |
---|