Статистика Курс лекций 22 год. Курс лекций по дисциплине Статистика Ставрополь 2022 Тема 1 Предмет, метод и задачи статистики
Скачать 4.1 Mb.
|
системные средние, обобщающие неоднородные явления, например, средний валовой внутренний продукт государства на душу населения, средняя заработная плата занятых в экономике, средний реальный доход на душу населения, производительность общественного труда и т.п. Каждая средняя характеризует изучаемую совокупность по какому- либо одному признаку, но для полной характеристики любой совокупности, описания ее типических черт и качественных особенностей нужна система средних показателей. Поэтому в практике отечественной статистики для изучения социально-экономических явлений и их полной характеристики, как правило, исчисляется система средних показателей. Так, например, показатели средней заработной платы оцениваются совместно с показателями средней выработки, фондовооруженности и энерговооруженности труда, степенью механизации и автоматизации работ и др. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя. Поэтому для конкретного показателя, используемого в социально-экономическом анализе, можно исчислить только одно истинное значение средней на базе научного способа расчета. 5.2 Виды средних и способы их вычисления Выбор вида средней величины определяется экономическим содержанием определенного показателя и исходных данных. В статистическом анализе используются два класса средних величин: степенные средние и структурные средние. 5.2.1 Степенные средние К классу степенных средних величин относятся: средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, средняя кубическая. Степенные средние в зависимости от представления исходных данных исчисляются в двух формах: простой и взвешенной. Простая средняя считается по несгруппированным данным и имеет следующий общий вид: m n i m i n x x 1 где x i – варианта (значение) осредняемого признака; m - показатель степени средней; n – число вариант. Взвешенная средняя считается по сгруппированным данным, представленным в виде дискретных или интервальных рядов распределения: m n i m i fi fi x x 1 где x i – варианта (значение) осредняемого признака или среднее значение интервала, в котором измеряется варианта; m - показатель степени средней; – f i частота, показывающая, сколько раз встречается i – e значение осредняемого признака. В зависимости от значения показателя степени m различают следующие виды степенных средних: (1) (2) при m = -1 — средняя гармоническая гар x ; при m = 0 — средняя геометрическая г x ; при m = 1 — средняя арифметическая ар x ; при m = 2 — средняя квадратическая кв x ; при m = 3 — средняя кубическая куб x При использовании одних и тех же исходных данных, чем больше m в формулах 5.1 и 5.2, тем больше значение средней величины: куб кв ар г гар х х х х х Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется в статистике правилом мажорантности средних. Характер имеющихся данных определяет существование только одного истинного среднего значения показателя. Вид средней выбирается в каждом отдельном случае путем конкретного анализа изучаемой совокупности, он определяется материальным содержанием изучаемого явления, а также принципами суммирования и взвешивания. Остановимся подробнее на степенных средних. Средняя арифметическая Средняя арифметическая является наиболее распространенным видом средних величин, она применяется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных ее единиц. Чтобы исчислить среднюю арифметическую, нужно сумму всех значений признаков разделить на их число. Средняя арифметическая применяется в форме простой средней и взвешенной средней. Исходной, определяющей формой, служит простая средняя арифметическая. Средняя арифметическая простая применяется в тех случаях, когда исходные данные представляют собой несгруппированные индивидуальные значения признака, она определяется как отношение суммы отдельных значений осредняемого признака к общему числу этих значений: 1 2 n ap x x … x x x n n где х 1 ,х 2 , ..., х п — индивидуальные значения варьирующего признака (варианты); п — число единиц совокупности. Пример 5.1. Требуется найти среднюю выработку одного рабочего (слесаря), если известно, сколько деталей изготовил каждый из 15 рабочих, т.е. дан ряд индивидуальных значений признака, шт.: 21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20. (3) (4) Средняя арифметическая простая рассчитывается по формуле (5.4), шт.: 21 20 20 19 21 19 18 22 19 20 21 20 18 19 20 15 p x 297 19 8 20 15 Средняя арифметическая взвешенная применяется в тех случаях, когда исходные данные представляют собой сгруппированные значения признака, т.е. дискретный или интервальный вариационный ряд распределения, она рассчитывается по формуле: 1 1 2 2 1 2 n n ap n x f x f … x f xf x f f … f f где f 1 ,f 2 , ...,f n — веса (частоты повторения одинаковых признаков); xf – сумма произведений величины признаков на их частоты; f – общая численность единиц совокупности. Пример 5.2. Технику вычисления средней арифметической взвешенной проиллюстрируем на рассмотренном выше примере 1. Для этого сгруппируем исходные данные, образовав дискретный ряд распределения ( графа 1,2 таблицы 5.1). Таблица 5.1 – Распределение рабочих по выработке деталей Выработка деталей за смену одним рабочим, шт.,(х) Число рабочих (веса) (f) f х 1 2 3 18 19 20 21 22 2 4 5 3 1 36 76 100 63 22 Итого 15 297 По формуле (5.5) средняя арифметическая взвешенная составит, шт.: 36 76 100 63 22 297 19 8 20 15 15 ap x В отдельных случаях веса могут быть представлены не абсолютными величинами, а относительными (в процентах или долях единицы). Тогда формула средней арифметической взвешенной будет иметь вид: ap xd x d (5) (6) где f d f – частость (в процентах или долях единицы). Иногда приходится исчислять среднюю по групповым средним или по средним отдельных частей совокупности (частным средним), т.е. среднюю из средних. Средние из средних рассчитываются так же, как и средние из первоначальных значений признака. При этом средние, которые служат для исчисления на их основе общей средней, принимаются в качестве вариантов. Вычисление средней арифметической взвешенной из групповых средних гр х осуществляется по формуле: гp ap x f x f где f – число единиц в каждой группе. Если расчет средней арифметической взвешенной осуществляется по интервальному ряду распределения, т.е. значения осредняемого признака заданы в виде интервалов («от — до»), вычислительные операции должны проводиться в следующем порядке: - если в ряду распределения имеются открытые интервалы, их необходимо сделать закрытыми, при этом величины открытых интервалов (первый и последний) условно приравниваются к интервалам, примыкающим к ним (второй и предпоследний); - от интервального ряда необходимо перейти к дискретному путем замены интервальных значений признака величиной середины интервала, т.е. их средними значениями (простая средняя между верхней и нижней границами каждого интервала); - рассчитать среднюю арифметическую взвешенную по формуле 5.5 Пример 5.3. Рассчитаем средний уровень оплаты труда (среднюю заработную плату) работников по данным таблицы 5.2, графа 1,2. В графах 3-5 реализованы расчетные процедуры, приведенные выше: - в графе 3 открытые интервалы преобразованы в закрытые: до 15 (10- 15); свыше 30 (30-35); - в графе 4 рассчитаны середины интервалов; - в графе 5 определены произведения вариантов на частоты ( f х ). Таблица 5.2 – Распределение работников по уровню оплаты труда Исходные данные Расчетные значения Группы работников по оплате труда, тыс. руб. Число рабочих, чел., (f) Группы работников по оплате труда, тыс. руб. Середина интервала, руб. (x) f х 1 2 3 4 5 До 15 4 10-15 (10+15):2=12,5 12,5х4=50,0 15-20 16 15-20 (15+20):2=17,5 17,5х16=280,0 20-25 29 20-25 (20+25):2=22,5 22,5х29=652,5 (7) 25-30 35 25-30 (25+30):2=27,5 27,5х35=962,5 Свыше 30 16 30-35 (30+35):2=32,5 32,5х16=520,0 Итого 100 Итого - 2465,0 Рассчитаем средний уровень оплаты труда: f xf x = 2465:100=24,65 тыс.руб. Итак, средний уровень оплаты труда работников составляет 24,65 тыс. руб. в месяц. Вычисление средней арифметической часто сопряжено с большими затратами времени и труда. Однако в ряде случаев процедуру расчета средней можно упростить и облегчить, если воспользоваться ее свойствами. Приведем (без доказательства) некоторые основные свойства средней арифметической. Свойство 1. Если все индивидуальные значения признака (т.е. все варианты) уменьшить или увеличить в i раз, то среднее значение нового признака соответственно уменьшится или увеличится в i раз. Свойство 2. Если все варианты осредняемого признака уменьшить или увеличить на число А, то средняя арифметическая соответственно уменьшится или увеличится на это же число А. Свойство 3. Если веса всех осредняемых вариантов уменьшить или увеличить в k раз, то средняя арифметическая не изменится. Средняя гармоническая Средняя гармоническая представляет собой среднюю из обратных варьирующих значений признака, она применяется в тех случаях, если неизвестна численность изучаемой совокупности. Когда статистическая информация не содержит частот f по отдельным вариантам х совокупности, а представлена как их произведение w = x · f, применяется формула средней гармонической взвешенной: 1 2 гap 1 2 1 2 n n n w w … w w x w w w w … x x x x где w 1 , w 2 , … w n – значение осредняемого признака, взвешенное на их число, т.е. w = x · f; Таким образом, средняя гармоническая применяется тогда, когда средняя предназначается для расчета сумм слагаемых, обратно пропорциональных величине данного признака, когда суммированию подлежат не сами варианты, а обратные им величины. Пример 5.4. По данным (таблицы 5.3) требуется определить среднюю цену 1 кг яблок в апреле. Средняя цена 1 кг яблок, (руб.), по трем коммерческим магазинам может быть исчислена по формуле (5.8) средней гармонической взвешенной: (8) гap 3060 2800 1920 17 20 24 3060 2800 1920 7780 19 45 400 w x w x Таблица 5.3 - Цена и выручка от реализации по трем коммерческим магазинам В тех случаях, когда вес каждого варианта равен единице (индивидуальные значения обратного признака встречаются по одному разу), применяется средняя гармоническая простая, исчисляемая по формуле: гap 1 1 2 3 1 1 1 1 1 1 1 n x x x x x n x где 1 x - отдельные варианты обратного признака, встречающиеся по одному разу; п — число вариантов. Для закрепления знаний по теме рассмотрим задачу на применение в расчетах средней арифметической и средней гармонической. Пример 5.5. Требуется определить средний размер двух видов вклада в банке в октябре и ноябре по данным таблицы 5.4. Таблица 5.4 – Информация о вкладах в банке для расчета средних значений В октябре для расчета среднего размера вклада по двум видам применяем формулу средней арифметической взвешенной, тыс. руб.: ap 350 10000 400 8000 372 22 10000 8000 xf x f Средний размер вклада в ноябре по двум их видам находим по формуле средней гармонической взвешенной, тыс. руб.: гар 4070000 3870000 370 430 4070000 3870000 7940000 397 20000 w x w x Номер магазина Исходные данные Цена яблок, руб., x Выручка от реализации, руб.,w 1-й 2-й 3-й 17 20 24 3060 2800 1920 Итого — 7780 Вид вклада Октябрь Ноябрь Число вкладов, тыс., f Средний размер вклада, тыс. руб., x Сумма вкладов, млн. руб., w Средний размер вклада, тыс.руб., x До востребования Срочный 10 8 350 400 4,07 3,87 370 430 (9) Как отмечено ранее, к числу степенных средних относятся также средняя геометрическая, средняя квадратическая, средняя кубическая. Эти виды средних величин имеют относительно ограниченное применение в статистическом анализе и рассчитываются по формулам, представленным в таблице 5.5. Таблица 5.5 – Методика расчета средней геометрической, средней квадратической и средней кубической Вид средней величины Область применения Формула расчета для несгруппированных данных для сгруппированных данных Средняя геометрическая Расчет среднего размера признака, выраженного цепными относительными величинами динамики n i Ïx X f fi i x Ï X ) ( Средняя квадратическая Расчет среднего размера признака, выраженного в квадратных единицах измерения n X кв X i 2 кв 2 x f f x Средняя кубическая Расчет среднего размера признака, выраженного в кубических единицах измерения 3 куб 3 x n x 3 куб 3 x f f x 5.2.2 Структурные средние Особым видом средних величин являются структурные средние, которые применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К классу структурных средних относятся мода и медиана. Мода (M 0 ) - значение признака, наиболее часто встречающееся в ряду распределения. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.п. В дискретном вариационном ряду мода - это варианта, имеющая наибольшую частоту. В интервальных рядах распределения с равными интервалами мода вычисляется по формуле: 0 0 1 0 0 0 0 1 0 0 1 0 , ( ) ( ) M M M M M M M M f f M X i f f f f где 0 M X - нижняя граница модального интервала; 0 M i — модальный интервал; 0 M f , 0 1 M f , 0 1 M f - частоты в модальном, предыдущем и следующем за модальным интервалах (соответственно). Модальный интервал определяется по наибольшей частоте. (10) Пример 5.6. Группировка предприятий по стоимости основных производственных фондов (ОПФ) представлена следующим распределением (таблица 5.6). Таблица 5.6 – Распределение предприятий региона по стоимости основных производственных фондов (ОПФ) По данным таблицы 5.6 видно, что модальным является интервал: 18- 20, т.к. он имеет наибольшую частоту. Рассчитаем моду, млн. руб.: 0 10 6 18 2 18,8. (10 6) (10 4) M Итак, модальным значением стоимости ОПФ предприятий является стоимость, равная 18,8 млн. руб. Медиана (М е ) - это варианта, который находится в середине вариационного ряда. Медиана делит рад на две равные (по числу единиц) части — со значениями признака меньше медианы и со значениями признака больше медианы. Чтобы найти медиану, необходимо отыскать значение признака, которое находится в середине упорядоченного рада. В ранжированных рядах несгруппированных данных нахождение медианы сводится к отысканию порядкового номера медианы. Пример 5.7. Пусть ряд состоит из показателей цены товара в отдельных торговых точках города, руб.: 630, 650, 680, 690, 700, 710, 720, 730, 750. Номер медианы для нечетного объема вычисляется по формуле: 1 2 e M n N где n — число значений признака в ряду распределения. В нашем примере номер медианы равен 5, медиана равна 700 руб. (т.е. одна половина товара реализуется по цене менее 700 руб., а другая — более 700 руб.). В случае четного объема ряда распределения медиана равна средней из двух вариантов, находящихся в середине ряда. В интервальных рядах распределения медианное значение оказывается в каком-то из интервалов признака – в медианном интервале. Для Группы предприятий по стоимости ОПФ, млн. руб. Число предприятий, 14-16 16-18 18-20 20-22 22-24 2 6 10 4 3 Итого 25 (11) определения медианного интервала необходимо определять накопленную (кумулятивную) частоту каждого последующего интервала до тех пор, пока она не превысит 1/2 суммы всех частот ряда. Значение медианы вычисляется по формуле: 1 2 e e e e f M e M M M S M X i f где e M X - нижняя граница медианного интервала; e M i - величина медианного интервала; 2 f - половина от общего числа совокупности; 1 e M S - накопленная частота интервала, предшествующего медианному; e M f - частота медианного интервала. Пример 5.8. Рассчитаем медиану по данным табл. 5.6. Прежде всего, найдем медианный интервал. Таким интервалом, очевидно, будет интервал стоимости ОПФ предприятий (18-20 млн. руб.), поскольку его кумулятивная частота равна 18 (2+6+10), что превышает половину суммы всех частот (25 : 2 = 12,5). Нижняя граница интервала 18 млн. руб., его частота 10; частота, накопленная до него, равна 8. Подставив данные в формулу (12), найдем значение медианы, млн. руб.: 25 18 2 8 10 18 9 2 e M Полученный результат говорит о том, что из 25 предприятий региона 12 предприятий имеют стоимость ОПФ менее 18 млн. руб., а 12 предприятий - более. Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда. Поэтому соотношение моды, медианы и средней арифметической позволяет оценить асимметрию ряда распределения. Аналогично медиане вычисляются значения признака, делящие совокупность на четыре равные (по числу единиц) части — квартили, на пять равных частей - квинтили, на десять частей - децили, на сто частей — перцентили. Использование в анализе вариационных рядов распределения рассмотренных выше характеристик позволяет более глубоко и детально охарактеризовать изучаемую совокупность. 5.3 Показатели вариации Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более (12) детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Вариация — это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д. Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Для оценки вариации в статистике применяют следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Простейшим показателем вариации является размах вариации (R), который представляет собой разность между максимальным и минимальным значениями признака: R =x max - x min Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака. Среднее линейное отклонение d представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической, рассчитывается по формуле: • для несгруппированных данных: x x d n где п — число членов ряда; • для сгруппированных данных: x x f d f где f — сумма частот вариационного ряда. Дисперсия признака (σ 2 ) представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных): • простая дисперсия для несгруппированных данных: 2 2 ( ) x x n • взвешенная дисперсия для сгруппированных данных: 2 2 ( ) x x f f Формула (5.15) применяется при наличии у вариантов своих весов (или частот вариационного ряда). (14) (13) (15) (16) Формулу для определения дисперсии (15 и 16) можно преобразовать, учитывая, что x nx , тогда расчет дисперсии может быть осуществлен по формуле: σ 2 = 2 2 где n x x 2 2 - для несгруппированных данных; f f x x 2 2 - для сгруппированных данных. Тогда для сгруппированных данных формула дисперсии (17) имеет следующий вид: 2 2 2 x f xf f f т.е. дисперсия равна разности средней из квадратов вариантов и квадрата их средней. Среднее квадратическое отклонение (σ) равно корню квадратному из дисперсии: • для несгруппированных данных: 2 ( ) x x n • для сгруппированных данных: 2 ( ) f x x f Для осуществления сравнений колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации — коэффициент вариации. Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической: 100. V x Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33 %. Пример 5.9. Результаты обследования показали следующее распределение работников торговли по стажу, представленное в таблице 5.7: Таблица 5.7 - Распределение работников торговли по стажу работы Стаж, лет Число работников, чел до 6 15 6 - 12 25 12 - 18 35 18 - 24 15 св. 24 10 (17) (18) (19) (20) (21) ИТОГО 100 На основании этих данных исчислить: 1) средний стаж работников торговли; 2) дисперсию и среднее квадратическое отклонение; 3) коэффициент вариации; Средний стаж работников торговли для открытого интервального ранжированного ряда определим следующим образом. Открытые интервалы сделаем закрытыми (графа 1 таблицы 5.8) и определим середины интервалов (графа 3 таблицы 5.8) по методике рассмотренной в вопросе 2.1 данной темы. Рассчитаем средний стаж работников торговли по данным графы 3 таблицы 5.8 по формуле средней арифметической взвешенной: 8 , 13 100 1380 f xf X года. Таблица 5.8 – Вспомогательные расчеты для определения показателей вариации Стаж, лет Число работн., f Середина интервала, х хf х - x (х - x ) 2 (х- x ) 2 f 1 2 3 4 5 6 7 0 - 6 15 (0 + 6): 2 = 3 3х15 =45 (3-13,8) = -10,8 (3-13,8) 2 =116,64 (3-13,8) 2 х 15 = 1749,6 6 - 12 25 9 225 -4,8 23,04 576,0 12 - 18 35 15 525 1,2 1,44 50,4 18 - 24 15 21 315 7,2 51,84 777,6 24 - 30 10 27 270 13,2 174,24 1742,4 ИТОГО 100 - 1380 - - 4896,0 f = 100 хf =1380 f x x ) ( = 4896 Чтобы исчислить дисперсию по формуле , ) ( 2 2 f f x x продолжим расчет показателей в табл. 5.8 (графа 5 – 7). Итог графы 7 подставим в формулу для дисперсии: 49 100 4896 ) ( 2 2 f f x x (лет). 3. Среднее квадратическое отклонение исчислим по формуле: 7 49 2 (лет) 4. Коэффициент вариации определяется по формуле: % 7 , 50 8 , 13 100 7 100 x v Вывод: проведенные расчеты коэффициента вариации свидетельствует, что уровень вариации стажа работы по изучаемой совокупности является относительно высоким (т.к. коэффициент вариации больше 33,3%). Другими словами совокупность является неоднородной в отношении анализируемого признака (стажа работы). 5.4 Использование показателей вариации в анализе взаимосвязей Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой. Общая дисперсия (σ 2 ) измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей средней x и может быть вычислена как простая дисперсия (по формуле (15) или взвешенная дисперсия по формуле (16). Межгрупповая дисперсия (δ 2 ) характеризует систематическую вариацию результативного признака, обусловленную влиянием признака- фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних i x от общей средней x : 2 2 ( ) , i x x f f где f - численность единиц в группе. Внутригрупповая (частная) дисперсия σ 2 i отражает случайную вариацию, т.е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы x t (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно: 2 2 ( ) ; i i x x n 2 2 ( ) i i x f x f (22) (23) (24) На основании внутригрупповой дисперсии по каждой группе, т.е. на основании σ 2 i можно определить общую среднюю из внутригрупповых дисперсий : 2 2 i i f f Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий: 2 2 2 i Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью — неизвестную, а также судить о силе влияния группировочного признака. Очевидно, чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака (квалификационного разряда) на изучаемый признак (количество изготавливаемых изделий). Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации (η 2 ) — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации: Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обуславливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи - единице. Эмпирическое корреляционное отношение - это корень квадратный из эмпирического коэффициента детерминации: 2 2 , η оно показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение η, как и η 2 , может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии (δ 2 = σ 2 ), т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. (25) (26) (27) (28) Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэддока : Таблица 5.9 – Шкала Чэддока η э 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99 Сила Слабая Умеренная Заметная Тесная Весьма связи тесная Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками. Контрольные вопросы 1. Дайте определение средней величины. 2. Каковы основные условия расчета средних величин? 3. Для чего используются системные средние величины? 4. Что характеризует правило мажорантности средних? 5. Дайте определение и условия применения средней арифметической. 6. Как рассчитываются средняя арифметическая простая и взвешенная? 7. Как рассчитываются средняя гармоническая простая и взвешенная? 8. Какова методика расчета показателей вариации? 9. Как рассчитываются общая, межгрупповая и внутригрупповая дисперсия? 10. Дайте определение правила сложения дисперсий. 11. Что характеризуют и как рассчитываются эмпирический коэффициент детерминации эмпирическое корреляционное отношение? 12. В каких пределах изменяются эмпирический коэффициент детерминации эмпирическое корреляционное отношение? Глоссарий Внутригрупповая (частная) дисперсия σ 2 i отражает случайную вариацию, т.е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины. Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической. Медиана - это варианта, который находится в середине вариационного ряда распределения. Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Мода - значение признака, наиболее часто встречающееся в ряду распределения. Общая дисперсия измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Правило мажорантности средних - свойство степенных средних возрастать с повышением показателя степени определяющей функции. Средняя арифметическая - наиболее распространенный вид средних величин, она применяется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных ее единиц; рассчитывается как отношение суммы всех значений признаков к числу этих признаков. Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчете на единицу качественно однородной совокупности. Средняя гармоническая представляет собой среднюю из обратных варьирующих значений признака, она применяется в тех случаях, если неизвестна численность изучаемой совокупности. Среднее квадратическое отклонение - корень квадратный из дисперсии. Среднее линейное отклонение представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической Размах вариации представляет собой разность между максимальным и минимальным значениями признака. Эмпирический коэффициент детерминации - показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации. Эмпирическое корреляционное отношение - показатель, представляющий собой корень квадратный из эмпирического коэффициента детерминации и характеризующий тесноту связи между группировочным и результативным признаками. |