29. Линейная регрессия
Рассмотрим двумерную случайную величину (X, Y), где X и Y – зависимые случайные величины.
Представим приближенно одну случайную величину как функцию другой. Точное соответствие невозможно. Будем считать, что эта функция линейная.
Для определения этой функции остается только найти постоянные величины a и b.
Определение. Функция G(X) называется Наилучшим приближением случайной величины Y в смысле метода наименьших квадратов, если математическое ожидание
принимает наименьшее возможное значение. Также функция G(X) называется Среднеквадратической регрессией Y на X.
Теорема. Линейная средняя квадратическая регрессия Y На Х вычисляется по формуле:
В этой формуле Mx=M(X), My=M(Y), коэффициент корреляции величин Х И Y.
Величина называется Коэффициентом регрессии Y На Х.
Прямая, уравнение которой
,
Называется Прямой сренеквадратической регрессии Y На Х.
Величина называется Остаточной дисперсией Случайной величины Y относительно случайной величины Х. Эта величина характеризует величину ошибки, образующейся при замене случайной величины Y линейной функцией G(X)=aХ + B.
Видно, что если R=±1, то остаточная дисперсия равна нулю, и, следовательно, ошибка равна нулю и случайная величина Y точно представляется линейной функцией от случайной величины Х.
Прямая среднеквадратичной регрессии Х на Y определяется аналогично по формуле:
Прямые среднеквадратичной регрессии пересекаются в точке (Тх, ту), которую называют Центром совместного распределения Случайных величин Х И Y.
< Предыдущая | Следующая > |
---|