УП_Теория статистики_080200 испр.(. Томский политехнический университет н. В. Шаповалова, Н. В. Королева, Т. В. Громова теория статистикИ
Скачать 3.39 Mb.
|
Проверь себяВыберите правильный вариант ответа. 1. К статистической таблице можно отнести: а) таблицу умножения; б) опросный лист социологического исследования; в) таблицу, характеризующую численность населения по полу ивозрасту. 2. Монографические таблицы характеризуют: а) совокупность единиц изучаемого объекта; б) группу единиц совокупности по признаку; в) каждую единицу совокупности. 3. Определите виды статистических графиков по способу построения: а) линейные; б) плоскостные; в) объемные; г) статистические карты. 4. При изображении структуры и структурных сдвигов в совокупности явлений на графике применяются диаграммы: а) полосовые; б) квадратные; в) секторные; г) фигур-знаков. 5. Статистический график – это… а) подробное расписание хода выполнения работ или последовательного изменения состояния чего-либо; б) некоторая кривая, изображающая зависимость функции от фактора; в) условное изображение статистических величин и их соотношений посредством линий, геометрических фигур, точек, рисунков или географических карт-схем. 6. Масштабная шкала – это… а) условная мера перевода статистической величины в графическую и обратно; б) пространство, на котором размещаются используемые в графике геометрические фигуры; в) линия, разделенная на равные отрезки точками. Глава 5 |
Стаж, лет | Число работников | | | | |
1–4 | 7 | 2,5 | 17,5 | –1 | –7 |
4–7 | 10 | 5,5 | 55,0 | 0 | 0 |
7–10 | 8 | 8,5 | 68,0 | 1 | 8 |
10–13 | 6 | 11,5 | 69,0 | 2 | 12 |
13–16 | 9 | 14,5 | 130,5 | 3 | 27 |
16–19 | 5 | 17,5 | 87,5 | 4 | 20 |
Итого | 45 | | 427,5 | | 60 |
Здесь: А – середина интервала с наибольшей частотой, наибольшая частота в данном примере =10, следовательно, А=5,5; h – величина интервала, равная 3 (интервалы равные).
Решение. Используя формулу средней арифметической взвешенной (5.10) и формулу расчета средней по способу моментов (5.11), рассчитаем средний производственный стаж работников предприятия «Агат»:
Вывод. Средний производственный стаж работников предприятия «Агат», рассчитанный двумя способами, составил 9,5 лет.
Средняя гармоническая используется в случае зависимости от характера имеющихся данных, когда существует только одно истинное среднее значение показателя, являющееся следствием реализации его исходного соотношения.
Если вес каждого варианта равен единице, то при n вариантах формула средней гармонической имеет вид
. (5.12)
Формула средней гармонической взвешенной следующая:
, (5.13)
где ;
–i-й вариант осредняемого признака;
– вес i-го варианта;
– количество вариант.
Пример 3. Имеются следующие данные о заработной плате работников фирмы:
Работники | Средняя заработная плата, р. | Фонд заработной платы, тыс. р. |
1 | 7800 | 123 |
2 | 9600 | 140 |
3 | 11500 | 162 |
Решение. Исчислим средюю заработную плату по формуле средней гармонической взвешенной (5.13):
Средняя геометрическая применяется для расчетов средних темпов за определенный период, т.е. тогда, когда определяющий показатель (величина, определяющая вид средней) является не суммой значений, а их произведением:
(5.14)
Этот вид средней используется для вычисления средних коэффициентов (темпов) роста в рядах динамики.
Средняя квадратическая применяется в тех случаях, когда приходится осреднять величины в виде квадратных функций (например, при расчетах диаметра труб, стволов); в статистике используется как мера вариации.
Рассчитывается по формулам (простая и взвешенная):
(5.15)
(5.16)
Средняя квадратическая величина широко применяется при оценке вариации признака, при изучении взаимосвязи явлений.
Правило мажорантности степенных средних состоит в том, что при расчете по одним и тем же данным между числовыми значениями средних, исчисленных по разным формулам, всегда сохраняется следующее неравенство:
5.3. Структурные средние
Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода, медиана, квартили и децили.
Модой в статистике называется значение варианты, которое чаще всего повторяется в ряду распределения.
Способ вычисления моды зависит от вида статистического ряда.
В вариационном ряду это будет варианта, имеющая наибольшую частоту.
В дискретном вариационном ряду модой называют ту варианту, которая имеет наибольшую частоту повторения. Например, по результатам опроса населения относительно определения своего материального состояния по трем оценкам (хорошо, удовлетворительно и неудовлетворительно) большинство респондентов определило свое состояние как неудовлетворительное – это и будет модой. Или модальной ценой на тот или другой товар, продаваемый на рынке, будет та цена, по которой продается максимальное количество товаров. Могут быть распределения, где все варианты встречаются одинаково часто. В этом случае моды нет. В других случаях не одна, а две варианты могут иметь наибольшие частоты. Тогда у признака будут две моды, и распределение будет бимодальным.
В интервальном ряду сначала определяется модальный интервал.
Модальный интервал – это интервал, имеющий наибольшую частоту встречаемости в исследуемом ряду, а затем определяется значение моды по формуле
(5.17)
где – нижняя граница модального интервала;
– частота модального интервала;
– частота интервала, предшествующего модальному интервалу;
– частота интервала, следующего за модальным интервалом;
– величина модального интервала.
Медианой называют варианту, которая делит ранжированный (упорядоченный по мере возрастания или убывания) ряд на две равные по объему части.
Медиана для дискретного ряда с нечетным числом вариант будет отвечать средней варианте , где m – номер кратной варианты первой половины ранжированного ряда.
В интервальном вариационном ряду медиана вычисляется для середины медианного интервала, за который принимается такой, где сумма накопленных частот превышает половину значений частот ряда распределения. В данном случае формула для расчета медианы имеет вид
(5.18)
где – нижняя граница медианного интервала;
– частота медианного интервала;
– сумма накопленных частот интервалов, предшествующих медианному интервалу;
– величина медианного интервала.
Соотношение моды, медианы и средней арифметической указывает направление и степень асимметрии рядов распределения. В симметричных распределениях все три характеристики совпадают. Чем больше расхождение между модой и средней арифметической, тем более асимметричен ряд. Для умеренно асимметричных рядов разность между модой и средней примерно в три раза превышает разность между медианой и средней, т.е.
Таким образом, мода и медиана являются важными дополнительными характеристиками к средней изучаемой совокупности. Особенно ценны эти показатели для характеристик небольших по численности совокупностей.
Для характеристики структуры вариационного ряда, кроме моды и медианы, в статистике исчисляются и другие характеристики: квартили, децили, процентили.
Квартили делят ранжированную совокупность по сумме накопленных частот на четыре равные части: нижний квартиль ( ) отделяет ¼ часть совокупности с наименьшими значениями признака; определяется по накопленной частоте, первой превышающей значение 25% от всей совокупности; верхний квартиль ( ) отделяет ¼ часть совокупности с наибольшими значениями признака; определяется по накопленной частоте, первой превышающей значение 75% от всей совокупности.
Средним квартилем ( ) является медиана.
В интервальном вариационном ряду квартили внутри определенного по накопленным частотам интервала рассчитываются по следующим формулам:
; (5.19)
(5.20)
где – нижняя граница интервала, содержащего нижний квартиль;
–нижняя граница интервала, содержащего верхний квартиль;
–величина интервала, содержащего нижний квартиль;
– величина интервала, содержащего верхний квартиль;
–сумма накопленных частот интервалов, предшествующих интервалу, содержащему нижний квартиль;
– сумма накопленных частот интервалов, предшествующих интервалу, содержащему верхний квартиль;
– частота интервала, содержащего нижний квартиль;
– частота интервала, содержащего верхний квартиль.
Кроме квартилей, в вариационных рядах распределения могут определяться децили – варианты, делящие ранжированный ряд по сумме накопленных частот на десять равных частей. Первый дециль (d1) делит совокупность в отношении 1/10 к 9/10, второй дециль (d2) – в соотношении 2/10 к 8/10 и т.д. Вычисляются они по той же схеме, что и медиана, и квартили.
Для расчета децилей по интервальному вариационному ряду используют следующие формулы:
для определения первого дециля формула
; (5.21)
для определения второго дециля формула
, (5.22)
где – нижняя граница интервала, содержащего первый дециль;
– нижняя граница интервала, содержащего второй дециль;
– величина интервала, содержащего первый дециль;
– величина интервала, содержащего второй дециль;
– сумма накопленных частот интервалов, предшествующих интервалу, содержащему первый дециль;
– сумма накопленных частот интервалов, предшествующих интервалу, содержащему второй дециль;
– частота интервала, содержащего первый дециль;
– частота интервала, содержащего второй дециль.
Остальные децили вычисляются по такому же принципу.
Значения признака, делящие ряд на сто частей, называются процентилями. Эта характеристика используется редко.
Пример 4. Имеются следующие данные о распределении сотрудников рекламного агенства по уровню оплаты труда, данные представлены в табл. 8 (данные условные).
Рассчитайте средний размер заработной платы двумя способами: по формуле средней арифметической и по способу моментов (от условного нуля).
Вычислите структурные средние: моду, медиану, квартили и децили (первый и девятый). Сформулируйте выводы.
Решение. В интервальном вариационном ряду распределения необходимо прежде всего определить середину каждого интервала ( ), которая рассматривается как среднее значение признака у единиц совокупности, попавших в данный интервал (табл.8).
Рассчитаем средний уровень заработной платы по формуле средней арифметической взвешенной (5.10):
тыс.р.
Таблица 8
Группы сотрудников по уровню заработной платы, тыс. р. | Число сотрудников (чел.) | Середина интервала | Накопленные частоты | | |
7-10 | 4 | 8,5 | 4 | 34 | -12 |
10-13 | 6 | 11,5 | 10 | 69 | -12 |
13-16 | 7 | 14,5 | 17 | 101,5 | -7 |
16-19 | 8 | 17,5 | 25 | 140 | 0 |
19-22 | 3 | 20,5 | 28 | 61,5 | 3 |
22-25 | 2 | 23,5 | 30 | 47 | 4 |
| 30 | - | - | 453 | -24 |
Для того чтобы рассчитать средний уровень заработной платы по способу моментов, применим формулу (5.11).
При расчете среднего числа по способу моментов необходимо определить величину А. Величина А – условный нуль, который определяется как середина интервала с наибольшей частотой. В данном примере А=17,5 [т.к. наибольшая частота (8) соответствует интервалу
16-19, середина интервала –17,5]. Величина интервала =3.
Произведем вспомогательные расчеты в табл. 8.
тыс.р.
Вывод. Средний уровень заработной платы у сотрудников рекламного агентства, рассчитанный двумя способами, составил 15,1 тыс. р.
Рассчитаем структурные средние величины:
1. Мода. Для того чтобы определить моду, необходимо найти модальный интервал: наибольшая частота 8 соответствует интервалу
16–19; этот интервал будет модальным.
Модальный интервал (16–19). Определим составляющие формулы (5.17):
– нижняя граница модального интервала;
– частота модального интервала;
– частота интервала, предшествующего модальному интервалу (предмодальная частота);
– частота интервала, следующего за модальным интервалом (послемодальная частота);
– величина модального интервала.
Подставим все значения в формулу (5.17):
тыс.р.
Вывод. Заработная плата у наибольшего числа сотрудников рекламного агенства составляет 16,5 тыс. р.
2. Медиана. При расчете медианы необходимо определить накопленные частоты (табл.8) для нахождения медианного интервала. Определим медианный интервал: сумму всех частот 30 разделим пополам, получим 15, в графе накопленные частоты находим значение первое, превышающее значение 15, – это число 17, ему соответствует интервал 13–16, он и будет являться медианным интервалом.
Медианный интервал (13–16). Определим составляющие формулы (5.18):
– нижняя граница медианного интервала;
– сумма всех частот;
– сумма накопленных частот, предшествующих медианному интервалу;
– частота медианного интервала;
– величина медианного интервала.
Подставим все значения в формулу (5.18):
тыс.р.
Вывод. Половина (50%) сотрудника из данной совокупности имеют заработную плату менее 15,1 тыс. р., и половина (50%) сотрудников имеют заработную плату выше 15,1 тыс. р.
3. Квартили. Для расчета квартилей необходимо определить интервалы, содержащие верхний и нижний квартиль. Интервал, содержащий нижний квартиль имеет накопленную частоту, которая первая превышает (т.е. 25% всей совокупности), ;в графе накопленные частоты находим значение первое, превышающее 7,5, – это 10; эта частота соответствует интервалу 10–13, значит, этот интервал будет содержать нижний квартиль.
Интервал, содержащий нижний квартиль (10–13). Определим составляющие формулы (5.19):
– нижняя граница интервала, содержащего нижний квартиль;
– величина интервала, содержащего нижний квартиль;
– сумма накопленных частот интервалов, предшествующих интервалу, содержащему нижний квартиль;
– частота интервала, содержащего нижний квартиль.
Подставим все значения в формулу (5.19):
тыс.р.
Интервал, содержащий верхний квартиль имеет накопленную частоту, которая первая превышает ; в графе накопленные частоты находим значение первое, превышающее 22,5. Это число 25 соответствует интервалу 16–19, значит, этот интервал будет содержать верхний квартиль.
Интервал, содержащий верхний квартиль (16–19). Определим составляющие формулы (5.20):
– нижняя граница интервала, содержащего верхний квартиль;
– величина интервала, содержащего верхний квартиль;
– сумма накопленных частот интервалов, предшествующих интервалу, содержащему верхний квартиль;
– частота интервала, содержащего верхний квартиль.
Подставим все значения в формулу (5.20):
тыс.р.
Вывод. 25% сотрудников имеют заработную плату менее 11,75 тыс. р., и 25% сотрудников имеют заработную плату более 18,1 тыс. р., а остальные 50% сотрудников имеют заработную плату в пределах от 11,75 до 18,1 тыс. р.
4. Децили. Для расчета децилей необходимо определить интервалы, содержащие первый и девятый дециль. Интервал, содержащий первый дециль, имеет накопленную частоту, которая первая превышает (т.е. 10% всей совокупности), . В графе накопленные частоты находим значение первое, превышающее 3,0. Это значение 4 соответствует интервалу 7–10, значит, этот интервал будет содержать первый дециль.
Интервал, содержащий первый дециль (7–10). Определим составляющие формулы:
– нижняя граница интервала, содержащего первый дециль;
– величина интервала, содержащего первый дециль;
– сумма накопленных частот интервалов, предшествующих интервалу, содержащему первый дециль;
– частота интервала, содержащего первый дециль.
Подставим все значения в формулу:
тыс.р.
Вывод. 10 % сотрудников имеют заработную плату менее 9,25 тыс. р., а 90 % сотрудников имеют заработную плату более 9,25 тыс. р.
Интервал, содержащий девятый дециль, имеет накопленную частоту, которая первая превышает .В графе накопленные частоты находим значение первое, превышающее 27,0. Это число 28 соответствует интервалу 19–22, значит, этот интервал будет содержать девятый дециль.
Интервал, содержащий девятый дециль (19–22).Определим составляющие формулы:
– нижняя граница интервала, содержащего девятый дециль;
– величина интервала, содержащего девятый дециль;
– сумма накопленных частот интервалов, предшествующих интервалу, содержащему девятый дециль;
– частота интервала, содержащего девятый дециль.
Подставим все значения в формулу:
тыс.р.
Вывод. 90% сотрудников имеют заработную плату менее 21 тыс. р., а 10% сотрудников имеют заработную плату более 21 тыс. р.
Вопросы и задания для самоконтроля
Что такое относительная величина?
Какие виды относительных величин вам известны? Приведите примеры.
Что такое средняя величина?
Какие виды средних величин существуют?
Какие средние называются структурными? Как определить модальный интервал?