Статистика. стат практ с отв к. Описательная статистика 3 Виды средних величин 3
Скачать 121.82 Kb.
|
|
Динамика урожайности чечевицы по годам | |||||
Год | 2014 | 2015 | 2016 | 2017 | 2018 |
Урожайность, в ц/га | 98 | 76 | 106 | 116 | 129 |
Решение. В данном случае у нас интервальный ряд с равными временными интервалами - годами (i). Показатель урожайности это Yh т.е. значение уровня ряда в соответствующем интервале (году i). В любой точке внутри изучаемого года значение признака принимается постоянным. Соответственно, средняя урожайность чечевицы за 5 рассматриваемых лет составила: _ И* У* 98+ 76+106 + 116 + 129 У = 1-1 = = 105 ц/га. п 5
Данные о динамике ключевой ставки Банка России за 2018 г. | ||||
период | 01.01-11.02 | 12.02-25.03 | 26.03-16.09 | 17.09-31.12 |
размер ключевой ставки, в % | 7,75 | 7,50 | 7,25 | 7,50 |
16
Решение. В данном случае у нас интервальный ряд с неравными
временными интервалами определяемыми количеством дней (ff). Значение
ключевой ставки это Yh т.е. значение уровня ряда в соответствующем
интервале (например, с 01 января по 11 февраля). В любой точке внутри
изучаемого интервала (ff) значение ключевой ставки принимается
постоянным. Соответственно, средняя величина ключевой ставки Банка
России в 2018 году составила:
-
_ SU Yrti _ 7,IS ■ 42 + 7,50 ■ 42 + 7,25 ■ 175 + 7,50 ■ 106 _ 2 704,25 Y
= 7,41 %.
Несколько иначе рассчитывается средний уровень ряда для моментных временных рядов4. Например, если имеется моментный ряд, содержащий п уровней (Уь Y2, ..., Уп) с равными (п - 1) интервалами между уровнями (моментами времени), то формула для расчета среднего уровня ряда принимает вид:
-
jY1 + Y2 + - + Yn_1+±Yn 72 — 1
Эта средняя носит название средняя хронологическая5.
Если имеется моментный ряд, содержащий п уровней (Уь Y2, ..., Уп) с неравными (п - 1) интервалами между уровнями (моментами времени), то
4 Примером моментного ряда может выступать, например, численность сотрудников предприятия на начало каждого месяца. Моментом для данного ряда является первое число каждого месяца, т.е. момент времени на который и определяется численность сотрудников предприятия.
5 В данной формуле предполагается, что в пределах каждого периода, разделяющего моментные наблюдения, развитие происходит по линейному закону, т.е. значение показателя между двумя моментами времени либо монотонно возрастает, либо монотонно убывает.
17
Показатель | март | апрель | май | июнь | июль | август |
Численность сотрудников на 01 число месяца, чел. | 769 | 1 729 | 676 | 512 | 429 | 299 |
Решение. I способ. В данном случае у нас моментный временной ряд, где моментом «замера» показателя является первое число каждого месяца. Мы примем промежутки между датами (моментами) равными друг другу (не будем делать различия между продолжительностью месяца в 30 и 31 день). В данном временном ряду показатель на начало каждого периода одновременно является показателем на конец предыдущего периода. Например, на 01 марта, численность сотрудников составила 769 чел., а на конец марта - 1 729 чел. Очевидно, что значение среднего показателя внутри каждого интервала зависит от того, как шло развитие в рамках интервалов, происходило это постепенно или скачкообразно. Мы этого не знаем. Принято предполагать, что в пределах каждого периода, разделяющего моментные наблюдения, развитие происходило по линейному закону. А значит, среднее
18
значение показателя внутри каждого интервала может быть вычислено как полусумма значений на начало и конец данного интервала.
Например, в марте численность сотрудников в среднем была равна (769 + 1 729) /2= 1 249 чел.
Количество таких средних будет равно количеству интервалов между моментами «замера» показателя. В нашем случае 6 уровней ряда, интервалов между уровнями будет 6-1 = 5.
Как результат, среднее значение показателя за все пять периодов можно вычислить как среднее арифметическое средних в каждом интервале.
Для нашего примера среднесписочная численность сотрудников предприятия за пять месяцев равна:
769 + 1 729 1 729 + 676 676 + 512 512 + 429 429 + 299
Y — 2 + 2 2 2 2
6-1
-
249 + 1 202,5 + 594 + 470,5 +364
= 776 чел.
5
-
способ - воспользоваться для расчетов формулой средней хронологической:
у + У2 + ■< Ь7П_1 + у
^1 ' где гг = 6 (количество моментов ряда - 01 число каждого месяца).
В нашем случае
^+У2+Уо+У4+Уг+^ ^+1729+676+512+429+^
Y = 2 2 3 4 5 2 = -2 г- = 776 чел.
-
5
т.е. среднесписочная численность сотрудников за пять месяцев (с
начала марта по начало августа) составила 776 человек.
Примечание. Заметим, что наш первый и второй способы эквивалентны:
_ ^+^+1з±П+1^+15±1б y_X+Y+Y+Y+Y+y_A
Y — 2 2 2 2 2 _ 2 z d 4 a 2
6-1 5
19
Показатель | декабрь | январь | февраль | март |
Стоимость ОФ (здания, оборудование и пр.) на конец месяца, млн. руб. | 92 | 102 | 149 | 180 |
§ 2. Структурные средние и анализ формы распределения
-
Структурные средние.
Важной характеристикой центра распределения, помимо средней, являются, так называемые структурные средние - мода {Мо) и медиана (Me). В отличие от средней арифметической, на которую влияют все значения изучаемого признака хь структурные средние не зависят от крайних значений признака. Потому они являются лучшей, чем среднее арифметическое, характеристикой центра распределения для рядов с неопределенными границами (например, для рядов с открытыми крайними границами интервалов).
По определению мода это значение признака наиболее часто встречающееся в вариационном ряду. А медианой называют значение признака, которое делит упорядоченную последовательность х,- на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианный, а у другого - превышает медианный уровень.
Для дискретного ряда мода и медиана находятся непосредственно по определению.
Так, по данным табл. 1.3 определим, что типичным исходом футбольного матча во время Чемпионата мира 2018 г. был один забитый гол, т.е. мода равна 1 (наибольшее число матчей - 46, это матчи с одним забитым
20
Число забитых мячей в матче | Число матчей |
0 | 21 1 |
| _ У 67 (= 21 +46) |
1 | 46 J |
2 | 34 |
3 | 14 |
4 | 9 |
Для списка банков Санкт-Петерурга (табл. 1.4), упорядоченных по размеру собственного капитала, медианным банком будет банк «Петровский», а медианой - 268 млн руб., именно это значение признака делит упорядоченную (в данном случае по возрастанию) последовательность значений (169, 237, 268, 290, 1 007) на две равные по численности части (169, 237) и (290, 1 007). Таблица 1.4 Банки Санкт-Петербруга, ранжированы по размеру собственного капитала Название | Собственный капитал, млн. руб. |
Балтонэксимбанк | 169 |
Банк «Санкг - Петербург» | 237 |
Петровский | 268 |
Балтийский | 290 |
Промстройбанк | 1 007 |
При четном числе элементов вариационного ряда за медиану принимают среднюю арифметическую из двух центральных вариант упорядоченного ряда. Так, по данным табл. 1.3 из 124 элементов (21 + 46 +
21
Наиболее предпочитаемая опция | Количество респондентов, чел. |
Фокусы | 57 |
Клоуны | 26 |
Театр кукол | 19 |
Костюмированный балл | 22 |
Квест по мотивам мультфильма / фильма | 21 |
Конкурсы и музыкальная программа | 14 |
Мастер классы (рисование, кулинария) | 34 |
Участие в дне рождения слона | 57 |
Если данные признака хг представлены в виде интервального ряда, то расчет моды и медианы ведется по формулам. При этом, для расчета моды используют две формулы - первая для случая интервального ряда с равными
22
интервалами, вторая для случая интервального ряда с неравными интервалами.
Для случая равных интервалов моду определяют по формуле:
Mo = хМо + hMo ■
ЧМо JMo-l'+4Mo JMo+1>
где хМо - нижняя граница модального интервала; hMo- ширина модального интервала; fMo частота в модальном интервале; fMo_i - частота интервала, предшествующего модальному;
/мо+i частота интервала, следующего за модальным.
Данная интерполяционная формула была предложена P.M. Орженцким. Для выведения формулы принято допущение, что в модальном и двух соседних с ним интервалах кривая распределения признака представляет собой параболу 2-го порядка, и мода находится как абсцисса точки максимума кривой распределения6.
Для случая неравных интервалов моду вычисляют по формуле:
Мо = хш + hU0 ■
где хМо - нижняя граница модального интервала; hMo- ширина модального интервала;
Гмо плотность в модальном интервале;
Гмо-i плотность интервала, предшествующего модальному;
Гмо+i — плотность интервала, следующего за модальным; а плотность это отношение частоты к ширине соответствующего
интервала (/' = 0.
Для расчета медианы неважно являются интервалы равными или нет, при расчете используется одна универсальная формула: