27. Упрошенный способ вычисления коэффициента корреляции
Выше в п. п. 6.2 и 6.3, при составлении уравнений прямых регрессии либо по данным корреляционной таблицы непосредственно вычислялись коэффициенты регрессии, либо по тем же данным предварительно вычислялся коэффициент корреляции. В обоих случаях вычисления были очень громоздкими (операции с многозначными числами).
Между тем при постоянных разностях для рассматриваемых в таблицах значений Х и У (в табл. 1 и , а в табл. 6 и ) можно заметно упростить вычисления, используя линейное преобразование переменных по формулам: и
Где и — произвольно выбираемые значения из заданных значений переменных Х И у, а и И V — Новые переменные.
Так, для рассматриваемых значений Х и У в табл. 1 можно провести преобразования
При которых соответствие между значениями Х И и, а также между Y и V отражено в табл. 8а и 8б.
Если же применяются преобразования
То получается другое соответствие (см. табл. 8в и 8г).
Преобразования второй серии обеспечивают большее упрощение вычислений, так как в этом случае все операции ведутся с меньшими по абсолютной величине числами.
Для обоснования этих линейных преобразований
и
Можно показать, что операции над переменными Х и У, связанные с вычислением коэффициента корреляции и коэффициентов регрессии, сводятся при этих преобразованиях к аналогичным операциям над новыми переменными И и V.
Прежде всего следует заметить, что средним значениям Х и У соответствуют средние значения переменных И и V:
Отсюда, при зависимосТИ будет и
Таким же образом можно установить, что
, или .
Далее, разность а поэтому
Аналогично устанавливается, что .
Эти результаты показывают, что участвующие в Вычислениях средние квадратические отклонения принимают вид и .
Наконец, преобразование разности Дает
.
Таким образом, переход к новым переменным дает преобразованную форму коэффициента корреляции и коэффициентов регрессии:
Для составления уравнений регрессии с помощью новых переменных следует включать в корреляционную таблицу значения этих новых переменных, найденные по формулам:
и .
Удобней всего применять для этой цели исходную таблицу, помещая в ней значения И слева от соответственных значении Х, а значения V — Над соответственными значениями У. При этом вспомогательный характер значений И и V в таблице обычно оттеняется применением для них мелкого шрифта.
Для иллюстрации тех упрощений, которые достигаюТСя введением новых переменных, используем этот способ на уже рассмотренном примере с распределением растений житняка. В виде значений и переменных Х и У выгодней всего используются их средние или ближайшие к ним значения этих переменных. В примере с растениями житняка именно такую замену представляют данные второго преобразования. Поставленные во вторых столбцах табл. 8в и 8г числа получены таким образом: для значений переменной И преобразованием
,
А для значений переменной V преобразованием
.
Вся операция по отыскаНИю параметров уравнений регрессии проводится по отдельным этапам.
1) Корреляционная таблица 1 пополняется значениями И и V.
2) Для отыскания коэффициента корреляциИ составляется Вспомогательная таблица (см. табл. 10) с вычислением ее Итоговых Данных.
3) По данным подсчетов:
Следует заметить, что , а таКжЕ что формулы преобразования и Позволяют: По найденным средним значениям новых переменных
и
Сразу получить средние значения старых переменных:
Совпадение с данными о значениях и , найденных Непосредственным вычислением, подтверждает правильность проведения упрощенных вычислений.
4) Определив значения трех разностей:
Можно записать, что и
Отсюда определяется коэффициент корреляциИ
Коэффициент регрессии У по Х
Коэффициент регрессии Х по У
Расхождения полученных коэффициентов с результатами непосредственных вычислений относятся к третьим десятичным знакам, что связано с приближенным характером вычислений.
< Предыдущая | Следующая > |
---|