2.3. Интервальный ряд. Гистограмма
При обработке большого числа экспериментальных данных их предварительно группируют и оформляют в виде так называемого Интервального ряда.
Пример 1. Средняя месячная зарплата за год каждого из пятидесяти случайно отобранных работников хозяйства такова:
317 304 230 285 290 320 262 274 205 180 234 221 241 270 257 290 258 296 301 150 160 210 235 308 240 370 180 244 365 130 170 250 370 267 288 231 253 315 201 256 279 285 226 367 247 252 320 160 215 350.
Здесь переменной величиной X является средняя месячная зарплата. Как видно из приведенных данных, наименьшее значение величины Х равно 130, а наибольшее — 370. Таким образом, диапазон наблюдений представляет собой интервал 130 – 370, длина которого равна 370 – 130 = 240.
Разобьем диапазон наблюдений на части (разряды) Так, чтобы каждый разряд содержал несколько экспериментальных данных. Например, разделим интервал 130 – 370 на 6 равных частей, тогда длина каждого разряда будет 40. Границами разрядов будут числа 130, 170, 210, 250, 290, 330, 370 (рис. 3).
Подсчитаем число значений, попавших в каждый разряд. Например, в первый разряд попадают следующие числа: 150 (1 раз), 160 (2 раза), 130 (1 раз), 170 (1 раз). Поскольку число 170 находится на границе между первым и вторым разрядами, мы включим его и в первый и во второй разряды, но с кратностью 1/2. Сложив кратности, мы получим Абсолютную частоту первого разряда:
M1 = 1 + 2 + 1 + 0,5 = 4,5.
Разделив абсолютную частоту на число П всех наблюдений, получим Относительную частоту Попадания величины Х в первый разряд:
Проделав вычисления для всех разрядов, мы получим следующую таблицу.
Таблица 6
Здесь Mi — абсолютные частоты, — относительные частоты. Табл. 6 называется Интервальным рядом.
Сумма всех абсолютных частот равна числу всех приведенных в табл. 6 значений переменной величины:
4,5 + 5 + 12 + 14,5 + 9 + 5 = 50.
Это свойство используется для проверки правильности вычислений. Из него следует, что сумма всех относительных частот равна единице:
0,09 + 0,10 + 0,24 + 0,29 + 0,18 + 0,10 = 1.
Интервальный ряд изображают графически в виде Гистограммы, которая строится так. Сначала вычисляют плотности частот H1, H2, H3, ... , разделив относительную частоту каждого разряда на его длину:
Затем выбирают на плоскости систему координат и откладывают на оси Х значения 40, 80, 120, ... , соответствующие границам разрядов. На каждом из отрезков длины 40, как на основании, строят прямоугольник, высота которого равна плотности частоты соответствую щего разряда. Полученная фигура и называется Гистограммой. Она изображена на рис. 4.
Заметьте, что высоты H1, H2, ... , H6 прямоугольников, образующих гистограмму, выбраны так, что их площади будут , т. е. равны соответствующим относительным частотам. Отсюда вытекает такое правило:
Для того, чтобы найти долю тех значений величины. X, которые попадают в некоторый интервал, нужно найти площадь той части гистограммы, основанием которой является данный интервал.
Определим, например, долю значений величины X, Принадлежащих интервалу 210 – 300. Для этого вычислим площадь фигуры с основанием 210 – 300 (на рисунке она выделена штриховкой). Площади первых двух прямоугольников, составляющих фигуру, равны соответственно = 0,24 и = 0,29; площадь третьего равна 10 • 0,0045 = 0,045. Сумма площадей 0,24 + 0,29 + 0,045 = 0,575 и дает нужное число. Иными словами, 57,5% значений величины Х находится в границах от 210 до 300.
Как мы заметили в начале параграфа, интервальный ряд составляют при обработке больших массивов информации. В таких случаях, как правило, отдельные значения величины Х не фиксируются, а подсчитывается количество ее значений, попавших в каждый разряд (т. е. абсолютные частоты). Поэтому исследователь не знает отдельных значений наблюдаемой величины Х и не может воспользоваться формулами (1), (5) и (7) для вычисления среднего арифметического, дисперсии и среднего квадратического отклонения. Но приближенное значение этих числовых характеристик можно найти с помощью интервального ряда. Для этого сначала находят середины разрядов: (здесь K — Число всех разрядов интервального ряда); затем проводят вычисления по следующим формулам:
Результаты расчетов по данным табл. 6 сведены в следующую таблицу:
Таблица 7
В первом столбце записаны номера разрядов, во втором — числа (середины разрядов), в третьем — произведения , и т. д. Таблица заполняется по столбцам. Середину разряда вычисляем как полусумму его границ:
Согласно формуле (8), сумма чисел третьего столбца дает среднее арифметическое = 256,8. Оно записано в последней строке этого столбца. Сумма чисел последнего столбца равна дисперсии D = 3113,75 [см. формулу (9)]. Наконец, по формуле (10) определяем среднее квадратическое отклонение S = = 55,80.
Интервальный ряд, гистограмма и числовые характеристики, найденные по формулам (8)—(10), составляют Математическую модель средней заработной платы. Она используется при проведении различных социологических исследований, например, при определении уровня жизни работников какой-либо отрасли.
ТИПОВЫЕ ЗАДАНИЯ
1. Для проведения демографических исследований выбрали 50 семей и получили следующие данные о количестве членов семьи:
2 5 3 4 1 3 6 2 4 3 4 1 3 5 2 3 4 4 3 3 2 5 3 4 4
3 3 4 4 3 2 5 3 1 4 3 4 2 6 3 2 3 1 6 4 3 3 2 1 7.
Укажите переменную величину; составьте табл. 5; найдите числовые характеристики — среднее арифметическое, дисперсию, среднее квадратическое отклонение.
2. Управление сельского хозяйства Дрюковского района представило сводку по пятидесяти хозяйствам. Согласно этой сводке, урожайность ржи в них составила (в центнерах с гектара):
17.5 17.8 18.6 18.3 19.1 19.9 20.6 20.1 22 21.4 17.5 18.5 19 20 22 20.6 19.1 18.6 17.9 19.1 22 19 17.5 22 22.6 21 21.4 19 17.8 18.3 19.9 20.1 21.4 18.5 20 20.6 18.6 21.4 21 20 20 18 18 18 17.5 18.6 19.1 20.6 17.5 18.6 .
Постройте интервальный ряд (табл. 6), гистограмму, составьте табл. 7 и по формулам (8)-(10) найдите числовые характеристики — среднее арифметическое, дисперсию, среднее квадратическое отклонение.
< Предыдущая | Следующая > |
---|