17. Корреляционная зависимость

Рассмотрим пример. Между ростом и весом человека существует определенная зависимость. Однако много людей с одинаковым ростом имеют разный вес. Такая зависимость не является функциональной, поскольку для функций каждому Х соответствует единственное значение У.

Можно предположить, что вес зависит не только от роста, но и от размера талии и прочих параметров, но она является очень сложной и пока никем не обнаружена. Можно считать, что вес человека зависит от ряда случайных величин, среди которых рост является одной из основных. Эту зависимость описывают с помощью понятия вероятности. Зависимости такого рода называются стохастическими, вероятностными или статистическими. Важнейшим видом здесь является Корреляционная зависимость.

Рассмотрим в качестве примера вес и рост двадцати курсантов школы МВД:

Номер

1

2

3

4

5

6

7

8

9

10

Рост

178

170

181

173

169

178

177

165

187

182

Вес

72

65

92

75

68

79

78

67

80

81

Номер

11

12

13

14

15

16

17

18

19

20

Рост

159

182

178

173

176

173

198

187

191

170

Вес

56

82

77

63

80

65

85

89

87

72

Изобразим точки графически:


Точки лежат внутри некоторой области, или «облака». Заметно, что облако вытянуто вдоль какой – то наклонной прямой. Это означает, что Х и Y Хорошо коррелированы, т. е. при увеличении роста вес, как правило, тоже увеличивается. Соединим точки отрезками, получим Эмпирическую ломаную регрессии. При большем числе измерений эта ломаная больше похожа на прямую.

Прямая, к которой стремится ломаная, называется Регрессией. Она является наилучшим решением задачи построения прямой, относительно которой сумма квадратов вертикальных отклонений экспериментальных точек будет наименьшей. Это задача Метода наименьших квадратов.

Уравнение искомой прямой имеет вид:

,

Где .

Здесь - средние значения роста, веса и их попарных произведений, - дисперсия роста.

Подставим в формулы, получим:

Получим уравнение прямой:

Это Эмпирическое уравнение регрессии.

Величина R, определяемая по формуле:

,

Называется коэффициентом корреляции. Здесь , , , .

Отсюда

.

Свойства коэффициента корреляции:

1. .

2. Если величины Х и Y независимы, то коэффициент корреляции равен нулю.

3. Если Х и Y связаны линейной зависимостью, то R = 1 или R = - 1, и наоборот.

При совместном изучении двух случайных величин Х и Y прежде всего находят величину коэффициента корреляции, и если он оказывается близким к единице, то имеет смысл описывать корреляционную связь.

© 2011-2024 Контрольные работы по математике и другим предметам!