27. Упрошенный способ вычисления коэффициента корреляции

Выше в п. п. 6.2 и 6.3, при составлении уравнений прямых регрессии либо по данным корреляционной таблицы непосредственно вычислялись коэффициенты регрессии, либо по тем же данным предварительно вычислялся коэффициент корреляции. В обоих случаях вычисления были очень громоздкими (операции с многозначными числами).

Между тем при постоянных разностях для рассматриваемых в таблицах значений Х и У (в табл. 1 и , а в табл. 6 и ) можно заметно упростить вычисления, используя линейное преобразование переменных по формулам: и

Где и — произвольно выбираемые значения из заданных значений переменных Х И у, а и И VНовые переменные.

Так, для рассматриваемых значений Х и У в табл. 1 можно провести преобразования

и ,

При которых соответствие между значениями Х И и, а также между Y и V отражено в табл. 8а и 8б.

Если же применяются преобразования

и ,

То получается другое соответствие (см. табл. 8в и 8г).

Преобразования второй серии обеспечивают большее упрощение вычислений, так как в этом случае все операции ведутся с меньшими по абсолютной величине числами.

Для обоснования этих линейных преобразований

и

Можно показать, что операции над переменными Х и У, связанные с вычислением коэффициента корреляции и коэффициентов регрессии, сводятся при этих преобразованиях к аналогичным операциям над новыми переменными И и V.

Прежде всего следует заметить, что средним значениям Х и У соответствуют средние значения переменных И и V:

Отсюда, при зависимосТИ будет и

Таким же образом можно установить, что

, или .

Далее, разность а поэтому

Аналогично устанавливается, что .

Эти результаты показывают, что участвующие в Вычислениях средние квадратические отклонения принимают вид и .

Наконец, преобразование разности Дает

.

Таким образом, переход к новым переменным дает преобразованную форму коэффициента корреляции и коэффициентов регрессии:

Для составления уравнений регрессии с помощью новых переменных следует включать в корреляционную таблицу значения этих новых переменных, найденные по формулам:

и .

Удобней всего применять для этой цели исходную таблицу, помещая в ней значения И слева от соответственных значении Х, а значения V — Над соответственными значениями У. При этом вспомогательный характер значений И и V в таблице обычно оттеняется применением для них мелкого шрифта.

Для иллюстрации тех упрощений, которые достигаюТСя введением новых переменных, используем этот способ на уже рассмотренном примере с распределением растений житняка. В виде значений и переменных Х и У выгодней всего используются их средние или ближайшие к ним значения этих переменных. В примере с растениями житняка именно такую замену представляют данные второго преобразования. Поставленные во вторых столбцах табл. 8в и 8г числа получены таким образом: для значений переменной И преобразованием

,

А для значений переменной V преобразованием

.

Вся операция по отыскаНИю параметров уравнений регрессии проводится по отдельным этапам.

1) Корреляционная таблица 1 пополняется значениями И и V.

2) Для отыскания коэффициента корреляциИ составляется Вспомогательная таблица (см. табл. 10) с вычислением ее Итоговых Данных.

3) По данным подсчетов:

Следует заметить, что , а таКжЕ что формулы преобразования и Позволяют: По найденным средним значениям новых переменных

и

Сразу получить средние значения старых переменных:

Совпадение с данными о значениях и , найденных Непосредственным вычислением, подтверждает правильность проведения упрощенных вычислений.

4) Определив значения трех разностей:

Можно записать, что и

Отсюда определяется коэффициент корреляциИ

Коэффициент регрессии У по Х

Коэффициент регрессии Х по У

Расхождения полученных коэффициентов с результатами непосредственных вычислений относятся к третьим десятичным знакам, что связано с приближенным характером вычислений.

© 2011-2024 Контрольные работы по математике и другим предметам!