Главная страница

Доп материал. Доп матер Дияр 12. Правило трех сигм (3sigma rule)


Скачать 42.13 Kb.
НазваниеПравило трех сигм (3sigma rule)
АнкорДоп материал
Дата19.10.2022
Размер42.13 Kb.
Формат файлаdocx
Имя файлаДоп матер Дияр 12.docx
ТипДокументы
#742411

Правило трех сигм (3-sigma rule)

Разделы: Алгоритмы

Loginom: Редактирование выбросов (обработчик)

Правило, утверждающее, что для любой случайной величины ξ с конечной дисперсией вероятность того, что случайная величина отклонится от своего математического ожидания M[ξ] не менее, чем на три среднеквадратических отклонения σ, не более 19:

P(|ξ−M[ξ]|≥3σ)≤19

Для большинства случайных величин эта вероятность меньше, например, для нормального распределения:



На рисунке видно, что в пределах одного среднеквадратического отклонения лежит 68,26% значений, принимаемых нормально распределенной случайной величиной (соответствует доли площади под кривой распределения). В пределах двух среднеквадратических отклонений — уже 95,44%, а в пределах трех — 99,72%. Это означает, что вероятность того, что случайная величина примет значение, отклоняющееся от математического ожидания больше чем на три среднеквадратических отклонения, не превышает 0,28%, т.е. пренебрежимо мала.

Например, пусть имеется выборка наблюдений за ежедневными продажами в магазине. Значения наблюдений распределены по нормальному закону со средним значением 150 000 руб. и среднеквадратическим отклонением 20 000 руб. Тогда, в соответствии с правилом 3-х сигм, продажи ниже, чем 150 000 - 20 000 x 3 = 90 000, и выше, чем 150 000 + 20 000 х 3 = 210 000, являются практически невозможными событиями. Фактически это означает, что рассматривать данные объемы продаж как потенциально возможные не имеет смысла.


написать администратору сайта