04. Дисперсия и среднее квадратическое отклонение

Для описания многих ситуаций знания только среднего арифметического недостаточно. Представим ситуацию, в которой двух студентов послали на практику в города А и Б. Среднесуточная температура в этих городах в это время года равна нулю. В город А осторожный студент взял только теплые вещи, в город Б – оделся по – летнему. В городе А днем температура составляет +20 С, ночью – минус 20 С. В городе Б днем +150 С, ночью – минус 150 С. Результат такой: хотя средняя температура была нулевой, оба заболели: один перегревался, другой мёрз.

Отсюда видно, что, помимо средней величины, нужно знать еще и то, как заданные числа рассеяны около среднего значения. Для этого вводятся дисперсия и среднее квадратическое отклонение.

Дисперсией величин называется число:

(5)

Пример. На обследование каждого из 10 автомобилей было затрачено следующее время:

Таблица 3.

I

1

2

3

4

5

6

7

8

9

10

Xi

25

30

22

22

54

36

41

45

25

40

Здесь Xi – время, затраченное на обследование автомобиля с номером I. Найти дисперсию Xi.

Решение. Составим таблицу из трех столбцов:

Таблица 4.

Xi

Xi-

25

- 9

81

30

- 4

16

22

- 12

144

22

- 12

144

54

20

400

36

2

4

41

7

49

45

11

121

25

- 9

81

40

6

36

0

1076

В последней строке приведены суммы величин в столбцах. Следует обратить внимание на то обстоятельство, что сумма отклонений (второй столбец) всегда должна равняться нулю! Если это не так, значит, допущена ошибка в вычислениях.

Отсюда

(мин2)

Если известны частоты , то вместо (5) можно использовать формулу:

(6)

Средним квадратическим отклонением величин от их среднего значения называется величина

(7)

В примере среднее квадратическое отклонение равно:

(мин.)

Дисперсия является средним арифметическим квадратов разностей Xi-. Отсюда S можно рассматривать как среднее отклонение величин от их среднего значения . Имеет место следующее свойство величины S: она не превышает наибольшей из величин | Xi- |.

Рассмотрим теперь понятие переменной (случайной) величины. В примере каждому автомобилю ставится в соответствие время его обследования. В этом случае говорят, что время обследования есть переменная величина Х, принимающая значения .

Теперь допустим, что нужно обследовать все автомобили в городе. Число автомобилей очень велико, и описать все значения Х практически невозможно. Однако можно, не проводя самого обследования, предсказать результаты приближенно. Составим таблицу на базе таблицы 3:

Таблица 5

22

25

30

36

40

41

45

54

0,2

0,2

0,1

0,1

0,1

0,1

0,1

0,1

Обычно прогноз содержит следующую информацию о величине Х:

- диапазон значений величины Х;

- среднее квадратическое отклонение S;

- интервал наиболее вероятных значений Х;

- долю значений Х, попадающих в заданный промежуток;

По данным примера:

- время обследования изменяется от 22 до 54 мин.;

- среднее время обследования одного авто =34 мин.;

- среднее отклонение Х от среднего значения составляет 10,4 мин.

Обычно серединой интервала наиболее вероятных значений Х является точка , а в сам интервал попадает более половины значений Х. Рассмотрим интервал : - S = 23,6; + S = 44,4. Из таблицы 5 видно, что в этом интервале (23,6; 44,4) содержатся 5 значений Х: 25, 30, 36, 40, 41. Суммарная частота 0,6 (60%).

Совокупность всех рассматриваемых объектов называется генеральной совокупностью, а часть объектов, каким – либо способом выбранных для обследования, называется выборкой. В данном случае генеральная совокупность – все автомобили в городе, а выборка – те 10 авто, которые рассматривались.

Очень важно сделать выборку правильно. От этого зависит точность и достоверность выводов и результатов прогноза. В математической статистике изучаются способы отбора, позволяющие сделать выборку так, чтобы полученная информация была достаточно полной и адекватной интересующему признаку генеральной совокупности. Тогда величины и D будут близки к значениям, которые могли бы быть получены при обработке всей генеральной совокупности.

© 2011-2024 Контрольные работы по математике и другим предметам!