1.12. Линейные модели с несколькими . объясняющими переменными
Рассмотрим статистические данные о потреблении текстиля (текстильных изделий) в Голландии в период между двумя мировыми войнами с 1923 по 1939 годы. В приведенной ниже таблице T — Реальное потребление текстиля на душу населения, DPI — Реальный располагаемый доход на душу населения, P — Относительная цена текстиля. Все показатели выражены в индексной форме, в процентах к 1925 году.
|
Год |
T |
DPI |
P |
Год |
T |
DPI |
P | |
|
1923 |
99.2 |
96.7 |
101.0 |
1932 |
153.6 |
105.3 |
65.4 | |
|
1924 |
99.0 |
98.1 |
100.1 |
1933 |
158.5 |
101.7 |
61.3 | |
|
1925 |
100.0 |
100.0 |
100.0 |
1934 |
140.6 |
95.4 |
62.5 | |
|
1926 |
111.6 |
104.9 |
90.6 |
1935 |
136.2 |
96.4 |
63.6 | |
|
1927 |
122.2 |
104.9 |
86.5 |
1936 |
168.0 |
97.6 |
52.6 | |
|
1928 |
117.6 |
109.5 |
89.7 |
1937 |
154.3 |
102.4 |
59.7 | |
|
1929 |
121.1 |
110.8 |
90.6 |
1938 |
149.0 |
101.6 |
59.5 | |
|
1930 |
136.0 |
112.3 |
82.8 |
1939 |
165.5 |
103.8 |
61.3 | |
|
1931 |
154.2 |
109.3 |
70.1 |
Для объяснения изменчивости потребления текстиля в указанном периоде мы можем привлечь в качестве объясняющей переменной как располагаемый доход DPI, так и относительную цену на текстильные изделия P. Если исходить из предположения о Постоянстве эластичностей потребления текстиля по доходу и цене, то тогда следует подбирать линейные модели Для логарифмов индексов, а не для самих индексов. Подбор таких моделей методом наименьших квадратов приводит к следующим результатам (использовались десятичные логарифмы):
![]()
![]()
![]()
![]()
![]()
Вторая модель, несомненно, лучше описывает наблюдаемую динамику потребления текстиля. Однако, естественно возникает вопрос о том, нельзя ли для объяснения изменчивости переменной Т Использовать Одновременно и располагаемый доход и относительную цену текстиля, улучшит ли это объяснение изменчивости потребления текстиля.
Чтобы привлечь для объяснения изменчивости потребления текстиля Обе Переменные DPI И T, мы рассматриваем Модель линейной связи логарифмов этих величин
![]()
И соответствующую ей Модель наблюдений
![]()
Оценки параметров
можно опять находить Методом наименьших квадратов, путем минимизации по всем возможным значениям
суммы квадратов
![]()
Минимум этой суммы достигается на некотором наборе
так что
![]()
Это минимальное значение мы опять обозначаем
![]()
И называем остаточной суммой квадратов.
Коэффициент детерминации
Определяется, как и в модели связи между двумя переменными:
![]()
Здесь
![]()
![]()
Где
![]()
![]()
При этом,
![]()
Где
![]()
Так что
![]()
(и опять, разложение
справедливо Только при включении постоянной составляющей
в правую часть соотношения, определяющего линейную модель связи). При этом также
![]()
Т. е. коффициент детерминации
Равен квадрату (обычного) выборочного коэффициента корреляции между переменными
и ![]()
Разности
![]()
Называются Остатками.
По поводу получения явных выражений для оценок наименьших квадратов мы поговорим несколько позднее, а сейчас просто приведем результаты оценивания для нашего примера:
![]()
![]()
Мы видим, что в результате привлечения для объяснения изменчивости потребления текстиля Сразу двух показателей
и
произошло заметное Увеличение коэффициента детерминации по сравнению с лучшей из двух моделей, использовавших только один показатель — от значения
до значения
.
Коэффициент
в подобранной модели связи интерпретируется здесь как Эластичность потребления текстиля По доходу При неизменном значении относительной цены
на текстиль, а коэффициент
— как Эластичность потребления текстиля По относительным ценам При неизменном уровне дохода. Такие значения коэффициентов говорят в пользу того, что потребление текстиля Эластично по доходам и Неэластично по ценам. Вопрос о том, в какой степени можно доверять подобным заключениям, мы рассмотрим далее в контексте Вероятностных моделей.
| < Предыдущая | Следующая > |
|---|