1.04. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
Вернемся теперь к определению выборочной ковариации и отметим некоторые ее свойства.
Пусть
— Некоторая постоянная, а
— Переменные, принимающие в
- М наблюдении значения
,
(N — Количество наблюдений). Тогда
можно рассматривать как переменную, значения которой в
- м наблюдении
равно
, и
![]()
Так что
![]()
Далее, очевидно, что
![]()
И что
![]()
Кроме того,
![]()
Так что
![]()
Наконец,

Так что
![]()
На основе этих свойств, в частности, находим, что
![]()
(постоянная не обладает изменчивостью),
![]()
(при изменений единицы измерения переменной в
раз, во столько же раз изменяется и величина стандартного отклонения этой переменной),
![]()
(сдвиг начала отсчета не влияет на изменчивость переменной).
Наконец,
![]()
Т. е.
![]()
(дисперсия суммы двух переменных отличается от суммы дисперсий этих переменных на величину, равную удвоенному значению ковариации между этими переменными).
Что касается выборочного коэффициента корреляции
, то если Изменяются начало отсчета и единица измерения, скажем, переменной
, так что вместо значений
мы получаем значения
![]()
Переменной
, то тогда

Иными словами, выборочный коэффициент корреляции
, инвариантен Относительно выбора единиц измерения и начала отсчета переменных
и
.
В то же время, этого нельзя сказать об оценке
коэффициента
В модели наблюдений
. Действительно, если, скажем, мы переходим к новой единице измерения переменной
, так что вместо значений
наблюдаются значения переменной
, то тогда оценка
коэффициента
в модели наблюдений
равна
![]()
Таким образом, изменяя единицу измерения переменной
(или переменной
), мы можем получать существенно различные значения
, от сколь угодно малых до сколь угодно больших. (Желательно выбирать единицы измерения таким образом, чтобы сравниваемые переменные имели одинаковый порядок.) Близость значений
к нулю всегда должна интерпретироваться с оглядкой на используемые единицы измерения переменных
и
.
Отметим, в этой связи, полезное представление
в виде
![]()
Действительно,
![]()
Откуда и вытекает указанное представление. Из этого представления получаем, в частности, что при Var (X) = Var (Y) имеет место равенство
, И тогда выраженность линейной связи между
и
непосредственно отражается в близости значения
к
или
.
Рассмотрим теперь коэффициент корреляции
между переменными
и
, где
, а
и
— оценки наименьших квадратов параметров
и
гипотетической линейной связи между переменными
и
. Замечая, что
(т. к.
по определению), находим:

Но ранее мы уже получили (при выводе разложения для
) соотношение
![]()
Которое, с учетом соотношения
, приводит к равенству
![]()
![]()
Левая часть которого есть не что иное как
![]()
Следовательно,

Так что
![]()
Последнее соотношение показывает, что коэффициент детерминации равен квадрату коэффициента корреляции между переменными
и
, так что при достаточно сильно выраженной линейной связи между переменными
и
, что соответствует значению
, близкому к
, оказывается близким к
и коэффициент корреляции между переменными
и
.
По причинам, которые будут ясны из дальнейшего рассмотрения,
называют Множественным коэффициентом корреляции (Multiple-R, Множественный-R).
Отметим также, что переменная
измеряется В тех же единицах, что и переменная
, и при изменении масштаба измерения переменной
значение
не изменяется. Отсюда вытекает, что коэффициент детерминации R2 инвариантен Относительно изменения масштаба и начала отсчета переменных
и
.
Заметим, наконец, что

(здесь sign(z)=-1 для z<0, sign(z)=0 для z=0, sign(z)=1 для z>0)
Поскольку же
![]()
То
и
![]()
Так что
![]()
И мы можем установить значение R2 Еще До построения модели линейной связи.
Замечание
Если
, то
и
; если
, то
и
, так что Всегда ![]()
| < Предыдущая | Следующая > |
|---|