06.3. Коэффициент корреляции

В рассмотренном примере корреляционной связИ оба коэффициента регрессии и положительны. В таком случае корреляцию называют положительной, что имеет место при изменении изучаемых количественных признаков в одинаковом направлении (Х и У одновременно возрастают или одновременно убывают).

Прямые при положительных коэффициентах регрессии обраЗУют острые углы с соответствующими осями координат (рис. 14) — у прямой регрессии У по Х коэффициент регрессии , где A — острый угол, образованный прямой I с осью Ох, а у прямой регрессии Х по Y коэффициент регрессии , Где B — острый угол, образованный прямой II с осью Оу. При отрицательных коэффициентах регрессии прямые регрессии образуют с соответствующими осями тупые углы.

ДЛЯ большей наглядности на рис. 14 показано положение прямых регрессии относительно новой системы координат с началом в точке пересечения этих прямых.

Рис. 14

Сами по себе значения коэффициентов регрессии не поЗВоляют судить о тесноте связи между Х и У. Это зависит от величины угла, образованного прямыми регрессии. Чем меньше этот угол, теЛ; Теснее корреляционная связь между Х и У.

При слиянии этих двух прямых в одну имеет место линейная функциональная зависимость между Х и У.

В качестве меры тесноты линейной корреляционной связИ прИНимаетСЯ коэффициент корреляции

Со знаком, совпадающим со знаками коэффициентов регрессии. При этом, если прямые I и II совпадают, то и . Но тогда и, следовательно, .

Обращение коэффициента корреляции в 1 или в -1 является, как это можно доказать, Необходимым и достаточным признаком. линейной функциональной зависимости между х и У.

Корреляционная таблица в таких случаях состоит из расположенных лишь на одной диагонали частот значений Х и У.

Вместе с тем, когда, по крайней мере, один из углов A или B равен нулю, то и , а значит, и между рассматриваемыми величинами не существует ни функциональной, ни корреляционной линейной зависимости. Однако в этом случае между Х и У возможны нелинейные корреляционные и даже функциональные связи.

Корреляционная зависимость между Х и У (для положительных коэффициентов регрессии) ИМеет место, когда коэффициент корреляциИ, как это можно доказать, выражается правильной дробью (0 < R < 1). При этом связЬ между переменными тем теснее, чем ближе коэффициент корреляции к 1.

Введенное определение коэффициента корреляции в виде позволяет на основании выражений коэффИЦиентов регрессии получить удобную формулу для непосредственного вычисления коэффициента корреляции.

Если обратитЬСя к выражениям коэффициентов прямых регРЕссии

и ,

То можно ЗАметить, что знаменатели в обоих Выражениях обозначают ДисперсиИ соответствующих рядов распределений:

и .

Отсюда можно получить для коэффициента КорРеляции формулу

,

Которая сразу показывает, что между независимыми величинами корреляции не существует, так как для таких величин выполняется равенство .

Замечание. Последнее равенство является приближенным, а поэтому если коэффициент корреляции очень мал , считают, что линейной коррЕЛяции между Х и У нет.

Записанная выше формула позволяет выразить каждый коэффициент регрессии через коэффициент корреляции.

Так, коэффициент регрессии У по X

,

А коэффициент регрессии Х по У

.

Такие выражения коэффициентов регрессии показывают, что составление уравнений прямых регрессии может быть облегчено, если будет найдено значение коэффициента корреляции. Для его вычисления следует использовать выражения числителя и знаменателя:

.

Тогда можно вычислить коэффициент корреляции по формуле

.

Пример 1. В табл. 6 дана группировка 135 Сахаропесочных Заводов по размеру производственных основных средств в млн. руб. (Х) и по среднесуточной переработке свеклы в тыс. Ц (У). Требуется определить коэффициент корреляции и составить уравнеНИя регрессии.

Таблица 6

Y

X

4

5

6

7

8

9

10

11

12

1,75

2,25

2,75

3,25

3,75

4,25

4

5

¾

3

¾

¾

6

9

4

3

¾

¾

9

15

6

2

3

¾

2

10

7

7

3

2

¾

2

7

8

2

2

¾

1

1

3

1

¾

¾

1

2

2

¾

¾

¾

¾

¾

2

¾

¾

¾

¾

¾

1

21 42 25 24 13 10

12

22

35

31

21

6

5

2

1

135

Расположение рядов распределения значений У в табл. 6 позволяет наметить линейную корреляционную связь между Х и У.

Для отыскания коэффициента корреляции составим вспомогательную таблицу.

Таблица 7

21

42

25

24

13

10

21×1,75

42×2,25

25×2,75

24×3,25

13×3,75

10×4,25

21×3,0625 42×5,0625 25×7,5625 24×10,5625 13×14,0625 10×18,0625

1,75×114 2,25×250 2,75×171 3,25×161 3,75×102 4,25×93

12

22

35

31

21

6

5

2

1

12×4 22×5 35×6 31×7 21×8 6×9 5×10 2×11 1×12

12×16 22×25 35×36 31×49 21×64 6×81 5×100 2×121 1×144

4×28,00

4×51,50

6×83,75

7×87,75

8×65,75

9×21,00

10×18,75 11×8,50

12×4,25

N=135

369,25

1082,9375

2533,25

135

891

6237

2533,25

Следует пояснить, что вторые множители в четвертом столбце получены из данных табл. 6 суммированием произведений каждого числа внутренней строки на соответствующее значение У (например, 114=4×4+6×5+9×6+2×7; 171= 4×5+6×6+7×7+8×7+1×10).

Так как суммирование этих вторых множителей ДаЕт сумму всех значений У, то сумма , и это равенство подтверЖДает правильность подсчета суммы всех значений У. Аналогична структура вторых множителей в последнем столбце. Например, 28 = 4×1,75+5×2,25+3×3,25. Здесь суммирование вторых множителей дает сумму всех значений Х, а потому РАвеНСТВо Служит для подтверждения правильности подсчета. Вместе с тем итоговые суммы по четвертому и последнему столбцам являются в то же время суммами всех участвующих в таблиЦЕ парНЫх Произведений Ху. Отсюда .

По данным подсчетов имеем:

Отсюда и И коэффициент корреляции

.

Для составления уравнений прямых регрессии Определяем коэффициенты регрессии:

Таким образом, уравнение прямой регрессии У по Х

или

А уравнение прямой регрессии Х по У

или

Сравнение коэффициента корреляции в этом примере с коэффициентом корреляции в ранее рассмотренном примере расПределения растений житняка

Показывает на большую тесноту связи между, общим весом и весом семян. Это согласуется со структурой соответствуюЩИх корреляциОнных таблиц. Табл. 1 распределения растений житняка характерна четким смещением рядов распределения значений У при малой степени рассеяния этих значений, а табл. 6 по Сахаропесочным заводам дает малозаметное смещение рядов распределения значений У при значительной степени рассеяния этих значений.

© 2011-2024 Контрольные работы по математике и другим предметам!