04. Дисперсия и среднее квадратическое отклонение
Для описания многих ситуаций знания только среднего арифметического недостаточно. Представим ситуацию, в которой двух студентов послали на практику в города А и Б. Среднесуточная температура в этих городах в это время года равна нулю. В город А осторожный студент взял только теплые вещи, в город Б – оделся по – летнему. В городе А днем температура составляет +20 С, ночью – минус 20 С. В городе Б днем +150 С, ночью – минус 150 С. Результат такой: хотя средняя температура была нулевой, оба заболели: один перегревался, другой мёрз.
Отсюда видно, что, помимо средней величины, нужно знать еще и то, как заданные числа рассеяны около среднего значения. Для этого вводятся дисперсия и среднее квадратическое отклонение.
Дисперсией величин называется число:
(5)
Пример. На обследование каждого из 10 автомобилей было затрачено следующее время:
Таблица 3.
I |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Xi |
25 |
30 |
22 |
22 |
54 |
36 |
41 |
45 |
25 |
40 |
Здесь Xi – время, затраченное на обследование автомобиля с номером I. Найти дисперсию Xi.
Решение. Составим таблицу из трех столбцов:
Таблица 4.
Xi |
Xi- | |
25 |
- 9 |
81 |
30 |
- 4 |
16 |
22 |
- 12 |
144 |
22 |
- 12 |
144 |
54 |
20 |
400 |
36 |
2 |
4 |
41 |
7 |
49 |
45 |
11 |
121 |
25 |
- 9 |
81 |
40 |
6 |
36 |
0 |
1076 |
В последней строке приведены суммы величин в столбцах. Следует обратить внимание на то обстоятельство, что сумма отклонений (второй столбец) всегда должна равняться нулю! Если это не так, значит, допущена ошибка в вычислениях.
Отсюда
(мин2)
Если известны частоты , то вместо (5) можно использовать формулу:
(6)
Средним квадратическим отклонением величин от их среднего значения называется величина
(7)
В примере среднее квадратическое отклонение равно:
(мин.)
Дисперсия является средним арифметическим квадратов разностей Xi-. Отсюда S можно рассматривать как среднее отклонение величин от их среднего значения . Имеет место следующее свойство величины S: она не превышает наибольшей из величин | Xi- |.
Рассмотрим теперь понятие переменной (случайной) величины. В примере каждому автомобилю ставится в соответствие время его обследования. В этом случае говорят, что время обследования есть переменная величина Х, принимающая значения .
Теперь допустим, что нужно обследовать все автомобили в городе. Число автомобилей очень велико, и описать все значения Х практически невозможно. Однако можно, не проводя самого обследования, предсказать результаты приближенно. Составим таблицу на базе таблицы 3:
Таблица 5
22 |
25 |
30 |
36 |
40 |
41 |
45 |
54 | |
0,2 |
0,2 |
0,1 |
0,1 |
0,1 |
0,1 |
0,1 |
0,1 |
Обычно прогноз содержит следующую информацию о величине Х:
- диапазон значений величины Х;
- среднее квадратическое отклонение S;
- интервал наиболее вероятных значений Х;
- долю значений Х, попадающих в заданный промежуток;
По данным примера:
- время обследования изменяется от 22 до 54 мин.;
- среднее время обследования одного авто =34 мин.;
- среднее отклонение Х от среднего значения составляет 10,4 мин.
Обычно серединой интервала наиболее вероятных значений Х является точка , а в сам интервал попадает более половины значений Х. Рассмотрим интервал : - S = 23,6; + S = 44,4. Из таблицы 5 видно, что в этом интервале (23,6; 44,4) содержатся 5 значений Х: 25, 30, 36, 40, 41. Суммарная частота 0,6 (60%).
Совокупность всех рассматриваемых объектов называется генеральной совокупностью, а часть объектов, каким – либо способом выбранных для обследования, называется выборкой. В данном случае генеральная совокупность – все автомобили в городе, а выборка – те 10 авто, которые рассматривались.
Очень важно сделать выборку правильно. От этого зависит точность и достоверность выводов и результатов прогноза. В математической статистике изучаются способы отбора, позволяющие сделать выборку так, чтобы полученная информация была достаточно полной и адекватной интересующему признаку генеральной совокупности. Тогда величины и D будут близки к значениям, которые могли бы быть получены при обработке всей генеральной совокупности.
< Предыдущая | Следующая > |
---|