Главная страница

Лекция 6. Моделирование рядов распределения. Лекции Вопрос Эмпирическое и теоретическое распределение


Скачать 0.9 Mb.
НазваниеЛекции Вопрос Эмпирическое и теоретическое распределение
Дата27.05.2022
Размер0.9 Mb.
Формат файлаpdf
Имя файлаЛекция 6. Моделирование рядов распределения.pdf
ТипЛекции
#553092

ЛЕКЦИЯ 6. МОДЕЛИРОВАНИЕ РЯДОВ
РАСПРЕДЕЛЕНИЯ
МОСТОВЩИКОВА ИРИНА АЛЕКСАНДРОВНА, СТ. ПРЕП. КАФ. «ЭКОНОМИКА И ФИНАНСЫ»
07.04.2022 1

СОДЕРЖАНИЕ ЛЕКЦИИ

Вопрос 1. Эмпирическое и теоретическое распределение

Вопрос 2. Проверка гипотезы о нормальном законе распределения

Вопрос 3. Практическое значение моделирования рядов распределения
07.04.2022 2

ВОПРОС 1. ЭМПИРИЧЕСКОЕ И ТЕОРЕТИЧЕСКОЕ
РАСПРЕДЕЛЕНИЕ
07.04.2022 3

ЭМПИРИЧЕСКОЕ И ТЕОРЕТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ
Изучение любого экономического процесса, протекающего на рынке или на предприятии, как правило, начинается со статистического наблюдения, построения вариационного ряда, графического его отображения и заканчивается анализом полученных данных для выявления закономерностей, которые могут иметь место в исследуемом процессе.
Закономерности распределения наиболее отчетливо проявляются только при большом количестве наблюдений.
Эмпирическое (фактическое) распределение
– вариационный ряд (или график), построенный на основании статистического наблюдения (фактических данных).
Теоретическое распределение
– вариационный ряд (или график), построенный по данным, полученным расчетным путем на основе аппроксимации (приближения, упрощения) фактических данных.

Эмпирическое распределение отличается от теоретического тем, что на значения признака в нем влияют случайные факторы.

С увеличением объема статистической совокупности влияние случайных факторов ослабевает, и эмпирическое распределение все менее отличается от теоретического.

Для оценки близости распределений используются особые показатели – критерии согласия. Они основаны на использовании различных мер расстояний между эмпирическим и теоретическим распределением.
07.04.2022 4

ТЕОРЕТИЧЕСКАЯ КРИВАЯ РАСПРЕДЕЛЕНИЯ
Теоретическая кривая распределения
– это кривая, которая выражает закономерность изменения вариационного ряда распределения. Выявление закономерностей с помощью теоретических кривых распределения является одной из главных задач статистики.
Выявленная теоретическая кривая распределения
позволяет решить ряд задач
:
1)
описать теоретическую кривую распределения с помощью уравнения кривой;
2)
найти с помощью уравнения теоретической кривой распределения значения частот (частостей) вариантов признака, которые могут отсутствуют в эмпирическом ряде распределения;
3)
планировать или прогнозировать экономические процессы, показатели на основе уравнения теоретических кривых распределения.
07.04.2022 5

ЭТАПЫ НАХОЖДЕНИЯ НЕОБХОДИМОЙ ТЕОРЕТИЧЕСКОЙ КРИВОЙ
На практике нахождение и описание необходимой теоретической кривой проводится в несколько этапов:
1 этап:
Сбор исходных данных, построение вариационного (эмпирического) ряда и его графической формы (полигон, гистограмма). На основе анализа выдвигается гипотеза о наличии, характере и форме закономерности эмпирического ряда.
2 этап:
Из числа хорошо известных теоретических кривых распределений выбирается одна (или несколько), которая наиболее полно может описать закономерность исследуемого экономического процесса. К числу таких теоретических кривых распределения можно отнести кривую нормального распределения, кривую логнормального распределения,
кривую распределения Пуассона и т.д.
Процесс подбора теоретической кривой распределения называется
моделированием (выравниванием)
эмпирического ряда распределения.
3 этап:
С помощью специальных критериев согласия оценивается степень расхождения (случайное или неслучайное) между теоретическим и эмпирическим рядами распределения. К числу таких критериев относятся χ2 (хи-квадрат, критерий согласия Пирсона), критерий Романовского, критерий Колмогорова и т.д.
07.04.2022 6

КРИВАЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Кривая нормального распределения
наиболее часто используется в экономических исследованиях, поскольку многие теоретические кривые в пределе сходятся к нормальному распределению.
Нормальное распределение (распределение Гаусса)
зависит от двух параметров:

математического ожидания
(среднее взвешенное по вероятностям значение случайной величины);

среднего квадратического отклонения
Нормальное распределение является симметричным, для него коэффициент асимметрии
𝐴
𝑠
= 0
При таком распределении случайной величины мода, медиана и математическое ожидание совпадают
Закон нормального распределения лежит в основе многих теорем математической статистики,
применяемых для оценки репрезентативности выборок, при измерении связей и.т.д.
07.04.2022 7
Пример графика функции нормального распределения
𝐴
𝑠
= 0
𝑀
𝑜
= 𝑀
𝑒
= 𝑚
𝑥

ВОПРОС 2. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ
ЗАКОНЕ РАСПРЕДЕЛЕНИЯ
07.04.2022 8

КРИТЕРИЙ СОГЛАСИЯ ХИ-КВАДРАТ ПИРСОНА
Для проверки эмпирического распределения на «нормальность» наиболее распространенным является критерий согласия К. Пирсона (
χ
2
− хи-квадрат Пирсона
).
Идея критерия Пирсона
заключается в расчете и последующей оценке размера отклонений фактических значений частоты появления признака по интервалам от их теоретических значений (т.е. значений которые бы имели место в случае нормального характера распределения).
Чем больше размер отклонений фактических значений признака
от теоретических, тем меньше оснований считать распределение
близким к нормальному.
Предельные значения, определяющие условия отклонения гипотезы о нормальном характере распределения, приводятся в специальной таблице «Распределение Пирсона».
07.04.2022 9
Теоретические частоты
Фактические частоты

ХИ-КВАДРАТ ПИРСОНА
Значение критерия хи-квадрат Пирсона
можно представить как сумму отношений квадратов расхождений между эмпирическими и теоретическими частотами к теоретическим частотам:
𝜒
расч
2
= ෍
𝑗=1
𝑘
(𝑓
𝑗
− 𝑓
𝑗

)
2
𝑓
𝑗

𝑓
𝑗
, 𝑓
𝑗

– частоты попадания признака в j-тый интервал соответственно в эмпирическом и теоретическом ряду распределения;
k – количество выделенных групп (интервалов).
Теоретическая частота
появления признака определяется по формуле:
𝑓
𝑗

= (σ 𝑓
𝑗
) ×
𝑙
σ
× 𝑓
𝑗
(𝑡)
𝑙 − длина интервала;
σ − среднее квадратическое отклонение признака;
𝑓
𝑗
𝑡 − плотность вероятности нормального распределения (по таблице).
07.04.2022 10

ЭТАПЫ МОДЕЛИРОВАНИЯ РЯДА РАСПРЕДЕЛЕНИЯ
07.04.2022 11 1.
Определяем
𝑥
и
𝜎
2.
По фактическому ряду рассчитываем значение нормированных отклонений для каждой группы по формуле:
𝑡
𝑗
=
𝑥
𝑗

−𝑥
𝜎
3.
По таблице плотности вероятности нормального закона распределения находим для каждого
𝑡
𝑗
соответствующее значение плотности вероятности
𝑓
𝑗
𝑡
4.
Находим теоретические частоты по формуле
𝑓
𝑗

= (σ 𝑓
𝑗
) ×
𝑙
σ
× 𝑓
𝑗
(𝑡)
5.
Рассчитываем критерий «хи-квадрат».
6.
Определяем табличное значение критерия «хи-квадрат» в зависимости от уровня значимости
α
и числа степеней свободы
𝑑. 𝑓. = 𝑘 − 3 7.
Сравниваем табличное и расчетное значение критерия «хи-квадрат».

РАССМОТРИМ АЛГОРИТМ ПРОВЕРКИ НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ
НА ПРИМЕРЕ (СТЕПЕНЬ ВЫПОЛНЕНИЯ НОРМ ВЫРАБОТКИ РАБОЧИМИ)
07.04.2022 12
Норма
выработки
Центр
интервала
(𝒙
𝒋

)
Число
рабочих
(𝒇
𝒋
)
Нормированное
отклонение
(
𝑡
𝑗
=
𝑥
𝑗

−𝑥
𝜎
)
Плотность вероятности
нормированного распределения
по таблице (𝑓
𝑗
𝑡
𝒋
)
Теоретическая
частота
(𝑓
𝑗

)
До 100 95 2
-2,03 0,0508 4
100…110 105 15
-1,30 0,1714 12 110…120 115 26
-0,58 0,3372 25 120…130 125 32 0,14 0,3951 29 130…140 135 12 0,87 0,2732 20 140…150 145 9
1,59 0,1127 8
Свыше 150 155 4
2,32 0,0270 2
Итого
-
100
-
-
100

РАССМОТРИМ АЛГОРИТМ ПРОВЕРКИ НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ
НА ПРИМЕРЕ (СТЕПЕНЬ ВЫПОЛНЕНИЯ НОРМ ВЫРАБОТКИ РАБОЧИМИ)
07.04.2022 13
Эмпирическая
частота
(𝒇
𝒋
)
Теоретическая
частота
(𝑓
𝑗

)
𝒇
𝒋
− 𝑓
𝑗

(𝒇
𝒋
−𝑓
𝑗

)
𝟐
(𝒇
𝒋
−𝑓
𝑗

)
𝟐
𝑓
𝑗

2 4
-2 4
1,000 15 12 3
9 0,750 26 25 1
1 0,040 32 29 3
9 0,310 12 20
-8 64 3,200 9
8 1
1 0,125 4
2 2
4 2,000 100 100
х х
7,425

РАССМОТРИМ АЛГОРИТМ ПРОВЕРКИ НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ
НА ПРИМЕРЕ (СТЕПЕНЬ ВЫПОЛНЕНИЯ НОРМ ВЫРАБОТКИ РАБОЧИМИ)
07.04.2022 14

Рассчитанное значение хи-квадрат составило
χ
расч
𝟐
= 𝟕, 𝟒𝟐𝟓

Сравниваем рассчитанное и табличное значения.

Табличное значение χ
𝟐
определяется по «Распределению Пирсона» (вспомогательные таблицы) по двум входным параметрам: число степеней свободы (d.f.) и степени значимости (α).

Степень значимости α
обычно в таких задачах принимается равной 0,05. Но если необходимо ввести более строгий критерий оценки, значение α можно взять выше.

Число степеней свободы при проверке гипотезе о нормальном характере распределения равно:
d. f . = k − 3
, где k – число интервалов в вариационном ряду.

По таблице находим, что при степени значимости
α = 0,05
и количестве степеней свободы d. f . = 4 табличное значение хи-квадрат составит
χ
табл
𝟐
= 𝟗, 𝟒𝟖

Фактическое значение оказалось меньше табличного (
𝟕, 𝟒𝟐𝟓 < 𝟗, 𝟒𝟖
), следовательно, отклонение фактических от теоретических частот можно оценить как случайное и гипотезу о нормальном характере распределения показателя выполнения норм выработки не отклонять.

РАССМОТРИМ АЛГОРИТМ ПРОВЕРКИ НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ
НА ПРИМЕРЕ (СТЕПЕНЬ ВЫПОЛНЕНИЯ НОРМ ВЫРАБОТКИ РАБОЧИМИ)
07.04.2022 15
На графике представлены кривые фактического (ломаная линия) и теоретического (аппроксимированная кривая) распределения норм выработки
𝑥
𝑗
𝑓
𝑗

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
07.04.2022 16

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
07.04.2022 17

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
07.04.2022 18

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
07.04.2022 19

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
07.04.2022 20

ВОПРОС 3. ПРАКТИЧЕСКОЕ ЗНАЧЕНИЕ МОДЕЛИРОВАНИЯ
РЯДОВ РАСПРЕДЕЛЕНИЯ
07.04.2022 21

ПРАКТИЧЕСКОЕ ЗНАЧЕНИЕ МОДЕЛИРОВАНИЯ РЯДОВ РАСПРЕДЕЛЕНИЯ
07.04.2022 22

соответствие распределения какому-либо закону позволяет прогнозировать, какое число (или доля) единиц совокупности попадет в тот или иной интервал значений признака без проведения трудоемкого и дорогого статистического наблюдения;

если известен закон распределения признака, достаточно просто рассчитать искомое значение по соответствующему аналитическому выражению;

подтверждение гипотезы о соответствии распределения нормальному закону позволяет сделать вывод о невозможности существенно снизить вариацию признака, воздействуя только на 1 или 2 управляемых фактора, т.к. нормальное распределение возникает при действии множества факторов;

аналитическое выражение распределения позволяет на основе 2-3 характеристик (для нормального распределения это: 𝑥 и σ ) получить представление о характере распределения во всей совокупности;

теоретическая кривая позволяет выявить и сгладить отклонения эмпирического ряда, вызванные случайными факторами;

полученное уравнение позволяет находить частоты и доли для интервалов, которые не встречались в эмпирическом ряду.

ГЛОССАРИЙ
07.04.2022
Моделирование (выравнивание) эмпирического ряда распределения
– процесс подбора теоретической кривой распределения.
Теоретическая кривая распределения
– это кривая, которая выражает закономерность изменения вариационного ряда распределения.
Теоретическое распределение
– вариационный ряд (или график), построенный по данным, полученным расчетным путем на основе
аппроксимации фактических данных. Теоретическое распределение однозначно описывается аналитическим выражением, функционально
связывающим частоты вариационного ряда с соответствующими значениями признака.
Фактическое распределение
– вариационный ряд (или график), построенный на основе фактических данных.
23


написать администратору сайта