Лабораторная работа1. Лабораторная работа 1 Проверка статистических гипотез о виде распределения
Скачать 1.6 Mb.
|
Лабораторная работа №1 Проверка статистических гипотез о виде распределения Цель работы. Проверка гипотезы о виде распределения с помощью критерия согласия Пирсона. Для достижения поставленной цели необходимо решить следующие задачи: 1. Изучить теоретические положения, касающиеся критерия согласия Пирсона; 2. Для эмпирических данных подобрать теоретический закон распределения. 1. Теоретические сведения Аппроксимация закона распределения экспериментальных данных При определении закона распределения рекомендуется аппроксимировать экспериментальные данные в указанной последовательности: 1. Подготовка опытных данных. 2. Определение закона распределения, наиболее подходящего для аппроксимации экспериментальных оценок (графически или аналитическим способом). 3. Проверка допустимости предполагаемого закона распределения, используя определенные критерии согласия (Колмогорова, Пирсона и др.). Вид закона распределения может определяться графическим или аналитическим способом. Выбор вида закона распределения осуществляется посредством анализа гистограммы распределения, оценок коэффициентов асимметрии и эксцесса. По степени "похожести" гистограммы и графиков плотностей распределения типовых законов или по "близости" значений оценок коэффициентов и диапазонов их теоретических значений выбираются распределения – "кандидаты" для последующей оценки параметров. Рисунок 1.1 - Логнормальное распределение Рисунок 1.2 - Экспоненциальное распределение Преимущество применения типовых законов распределения состоит в их хорошей изученности и возможности получения состоятельных, несмещенных и относительно наиболее эффективных оценок параметров. Однако типовые законы распределения не обладают необходимым разнообразием форм, поэтому их применение не дает необходимой общности представления случайных величин, которые встречаются при исследовании систем. В таблице 1.1 приведен пример функции плотности и теоретические параметры распределений. Таблица 1.1 - Функции плотности и теоретические параметры распределений. Тип и функция плотности распределения Математическое ожидание, дисперсия Оценка параметров распределения по выборочным данным Группированный ряд Несгруппированный ряд Нормальное Р = 1 𝜎√2𝜋 𝑒𝑥𝑝(−(𝑥 − 𝜇 1 ) 2 /(2𝜎 2 )) −∞ < 𝑥 < ∞ 𝑥̅ = 𝜇 1 𝜎 2 = 𝜇 2 𝐴 𝑠 = 0 𝐸 𝑠 = 0 𝜇 1 = 1 𝑁 ∑ 𝑥 𝑖 𝑘 𝑖=1 ∗ 𝑛 𝑖 𝜎 2 = 1 𝑁 ∑(𝑥 𝑖 − 𝜇 1 ) 2 ∗ 𝑛 𝑖 𝑘 𝑖=1 𝜇 1 = 1 𝑁 ∑ 𝑥 𝑖 𝑁 𝑖=1 𝜎 2 = 1 𝑁 ∑(𝑥 𝑖 − 𝜇 1 ) 2 𝑁 𝑖=1 Экспоненциальное Р = 𝜆 exp(−𝜆𝑥) , 𝑥 ≥ 0 0, 𝑥 < 0 𝑥̅ = 1/𝜆 𝜎 2 = 1/𝜆 2 𝜆 = 1 1 𝑁 ∑ 𝑥 𝑖 ∗ 𝑛 𝑖 𝑘 𝑖=1 𝜆 = 1 1 𝑁 ∑ 𝑥 𝑖 𝑛 𝑖=1 Пуассоновское Р = 𝜆 𝑖 𝑖! exp (−𝜆) i=0,1,… 𝑥̅ = 𝜆 𝜎 2 = 𝜆 𝜆 = ∑ 𝑥 𝑖 ∗ 𝑛 𝑖 𝑘 𝑖=1 𝑁 𝜆 = ∑ 𝑥 𝑖 𝑛 𝑖=1 𝑁 Асимметрия и эксцесс эмпирического распределения определяется соответственно равенствами: 𝐴 𝑠 = 𝜇 3 𝜎 3 ; 𝐸 𝑠 = 𝜇 4 𝜎 4 − 3 𝜇 3 и 𝜇 4 – центральные эмпирические моменты третьего и четвертого порядков: Центральный эмпирический момент Оценка параметров распределения по выборочным данным Группированный ряд Несгруппированный ряд третьего порядка 𝜇 3 = 1 𝑁 ∑( 𝑥 𝑖 − 𝜇 1 ) 3 ∗ 𝑛 𝑖 к 𝑖=1 𝜇 3 = 1 𝑁 ∑( 𝑥 𝑖 − 𝜇 1 ) 3 𝑛 𝑖=1 четвертого порядка 𝜇 4 = 1 𝑁 ∑( 𝑥 𝑖 − 𝜇 1 ) 4 ∗ 𝑛 𝑖 к 𝑖=1 𝜇 4 = 1 𝑁 ∑( 𝑥 𝑖 − 𝜇 1 ) 4 𝑛 𝑖=1 Асимметрия и эксцесс оценивают степень близости данного распределения к нормальному, а также характеризуют форму закона распределения вероятностей изучаемой случайной величины. Замечание 1. Если асимметрия более 0,5, то независимо от знака она считается значительной. Если асимметрия меньше 0,25, то она считается незначительной. Замечание 2. Положительный эксцесс свидетельствует о том, что в совокупности есть слабо варьирующее по данному признаку «ядро», а в плосковершинных распределениях такого «ядра» нет, и единицы рассеяны по всем значениям признака более равномерно. Предельным значением отрицательного эксцесса является значение Еs = -2, величина положительного эксцесса является величиной бесконечной. Если отношение |Е 𝑠 | 𝜎 𝐸𝑠 имеет значение больше 3, то это свидетельствует о существенном характере эксцесса 𝜎 𝐸 𝑠 = √ 24𝑁(𝑁 − 2) ∗ (𝑁 − 3) (𝑁 − 1) 2 ∗ (𝑁 + 3) ∗ (𝑁 + 5) N - число единиц в совокупности Критерий согласия Пирсона позволяет осуществлять проверку гипотезы о предполагаемом законе эмпирических данных. В учебных задачах обычно используется следующий алгоритм: 1. Выбор теоретического закона распределения (обычно задан заранее, если не задан - анализируем выборку, например, с помощью гистограммы относительных частот, которая имитирует плотность распределения). 2. Оценка параметров распределения по выборке (для этого вычисляется математическое ожидание, дисперсия, асимметрия и эксцесс). 3. Вычисление теоретические значения частот (через теоретические вероятности попадания в интервал) и сравниваются с исходными (выборочными). 4. Анализ значений статистики χ2 и делается вывод о соответствии (или нет) теоретическому закону распределения 2. Пример выполнения лабораторной работы Задание 1 (Экспоненциальное распределение) Необходимо проанализировать выборочную совокупность реального информационного потока (таблица 2.1) для определения характера закона распределения промежутков между поступлениями заявок. Длительности интервалов располагаем в порядке возрастания и группируем в соответствии с интервалом разбиения Таблица 2.1 - Выборочная совокупность информационного потока Нижняя граница, с Верхняя граница, с Эмпирические частоты(𝑛 𝑖 ) 0 5 301 5 10 77 10 15 16 15 20 4 20 25 1 25 30 1 Для доказательства предположения о соответствии распределения выборочной совокупности теоретическому распределению воспользуемся критерием согласия 2 Пирсона. Статистический анализ выборочных данных начинают обычно с вычисления выборочных моментов. При расчете выборочной средней для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем — среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним. Таблица 2.2 – Вспомогательная таблица Нижняя граница,с Верхняя граница,с Эмпирические частоты(𝑛 𝑖 ) Среднее значение интервала Произведение середины интервала на эмпирические частоты 0 5 301 2,5 752,5 5 10 77 7,5 577,5 10 15 16 12,5 200 15 20 4 17,5 70 20 25 1 22,5 22,5 25 30 1 27,5 27,5 Итого 400 1650 Тогда выборочная средняя: 𝑥 = ∑ 𝑥 𝑖 ∗ 𝑛 𝑖 ∑ 𝑛 𝑖 = 1650 400 = 4.13, 𝑐 В качестве оценки параметра λ показательного распределения принимаем величину, обратную выборочной средней: 𝜆 = 1 𝑥 = 1 4.13 = 0.24 заявок/с Найдем вероятность попадания случайной величины P i в интервалы: P i = e −λx i − e −λx i+1 , P 1 = e −0.24∗0 − e −0.24∗5 = 0.70 Следующим шагом найдем теоретические частоты n i ′ : n i ′ = P i ∗ ∑ n i = 0.70 ∗ 400 = 281, Остальные расчеты приведены в таблице 2.3. Для того, чтобы сравнить эмпирические и теоретические частоты с помощью критерия Пирсона необходимо: - составить расчетную таблицу (таблица 2.3), по которой находят наблюдаемое значение критерия Пирсона 𝜒 набл 2 = ∑ (𝑛 𝑖 − 𝑛 𝑖 ′ ) 2 𝑛 𝑖 ′ - по таблице критических точек распределения 𝜒 кр 2 , по заданному уровню значимости, и числу степеней свободы находят критическую точку правосторонней критической области 𝜒 кр 2 . Если 𝜒 набл 2 < 𝜒 кр 2 — нет оснований отвергнуть гипотезу о законе распределении генеральной совокупности. Если 𝜒 набл 2 > 𝜒 кр 2 — гипотезу отвергают. Таблица 2.3 –Расчетная таблица Нижняя граница Верхняя граница Эмпирические частоты(𝑛 𝑖 ) 𝑃 𝑖 Теоретические частоты (𝑛 𝑖 ′ ) (𝑛 𝑖 − 𝑛 𝑖 ′ ) 2 𝑛 𝑖 ′ 0 5 301 0,70 281 1,43 5 10 77 0,21 84 0,52 10 15 16 0,06 25 3,17 15 20 4 0,02 7 1,56 20 25 1 0,01 2 0,66 25 30 1 0,00 1 0,18 Итого 7,52 При использовании критерия Пирсона число степеней свободы k = s—1—r, где r — число параметров, оцениваемых по выборке. Экспоненциальное распределение определяется одним параметром λ. Так как этот параметр оценивается по выборке, то r =1 и, следовательно, число степеней свободы k = s—1—1=s—2 . Из таблицы 2.3 видно: χ кр 2 = 7,52. По таблице критических точек распределения χ кр 2 (рисунок 2.1), на уровне значимости α = 0,05 и числу степеней свободы k=6-2=4 находим критическую точку правосторонней критической области 𝜒 теор 2 = 9.5 Так как χ набл 2 < χ кр 2 —нет оснований отвергнуть гипотезу о распределении по экспоненциальному закону Рисунок 2.1 - Таблица критических точек Задание 2 (Нормальное распределение) Необходимо проанализировать выборочную совокупность реального информационного потока (таблица 2.4) для определения закона распределения длительности обслуживания заявок. Таблица 2.4 - Выборочная совокупность реального информационного потока Длительность обслуживания (𝑥 𝑖 ), с Эмпирические частоты(𝑛 𝑖 ) 5 15 7 26 9 25 11 30 13 26 15 21 17 24 19 20 21 13 итого 200 Для доказательства предположения о соответствии распределения выборочной совокупности теоретическому распределению воспользуемся критерием согласия 2 Пирсона. Статистический анализ выборочных данных начинают обычно с вычисления выборочных моментов. Тогда выборочная средняя: 𝑥 = ∑ 𝑥 𝑖 ∗ 𝑛 𝑖 ∑ 𝑛 𝑖 = 5 ∗ 15 + 7 ∗ 26 + ⋯ + 21 ∗ 13 200 = 12,63 𝑐 Выборочное среднее квадратическое отклонение: 𝜎 = √ 1 𝑁 ∑(𝑥 𝑖 − 𝜇 1 ) 2 ∗ 𝑛 𝑖 𝑘 𝑖=1 = √ (5 − 12,63) 2 ∗ 15 + (7 − 12,63) 2 ∗ 26 + ⋯ 200 = 4,695 с Выборочная асимметрия: 𝐴 𝑠 = 𝜇 3 𝜎 3 = 1 𝑁 ∑ ( 𝑥 𝑖 − 𝜇 1 ) 3 ∗ 𝑛 𝑖 к 𝑖=1 𝜎 3 = 0,12 > 0 то есть, распределение обладает правосторонней асимметрией Выборочный эксцесс: Е 𝑠 = 𝜇 4 𝜎 4 − 3 = 1 𝑁 ∑ ( 𝑥 𝑖 − 𝜇 1 ) 4 ∗ 𝑛 𝑖 к 𝑖=1 𝜎 4 − 3 = −1,07 распределение ниже, чем нормальное распределение. Вычислим теоретические частоты: 𝑛 𝑖 = 𝑁 ∗ ℎ 𝜎 ∗ 𝜑(𝑢 𝑖 ) h – шаг (разность между соседними вариантами) 𝑢 𝑖 = 𝑥 𝑖 − 𝑥 𝜎 𝜑(𝑢 𝑖 ) = 𝑒 −𝑢 2 /2 √2𝜋 Для того, чтобы сравнить эмпирические и теоретические частоты с помощью критерия Пирсона необходимо: - составить вспомогательную таблицу (таблица 2.5), по которой находят наблюдаемое значение критерия Пирсона 𝜒 набл 2 = ∑ (𝑛 𝑖 − 𝑛 𝑖 ′ ) 2 𝑛 𝑖 ′ - по таблице критических точек распределения 𝜒 кр 2 , по заданному уровню значимости, и числу степеней свободы находят критическую точку правосторонней критической области 𝜒 кр 2 . Если 𝜒 набл 2 < 𝜒 кр 2 — нет оснований отвергнуть гипотезу о законе распределении генеральной совокупности. Если 𝜒 набл 2 > 𝜒 кр 2 — гипотезу отвергают. Таблица 2.5 – Вспомогательная таблица i 𝑛 𝑖 𝑥 𝑖 𝑢 𝑖 𝜑(𝑢 𝑖 ) 𝑛 𝑖 ′ 𝑛 𝑖 − 𝑛 𝑖 ′ ( 𝑛 𝑖 − 𝑛 𝑖 ′ ) 2 𝑛 𝑖 ′ 1 15 5 -1,62 0,1074 9,1 5,9 3,8 2 26 7 -1,20 0,1942 16,5 9,9 5,5 3 25 9 -0,77 0,2966 25,3 -0,3 0,0 4 30 11 -0,35 0,3752 32,0 -2,0 0,1 5 26 13 0,08 0,3977 33,9 -7,9 1,8 6 21 15 0,51 0,3503 29,8 -8,8 2,6 7 24 17 0,93 0,2589 22,0 2,0 0,2 8 20 19 1,36 0,1582 13,5 6,5 3,1 9 13 21 1,78 0,0818 7,0 6,0 5,1 Сумма 200 190 22,2 При использовании критерия Пирсона число степеней свободы k = s—r—1, где г — число параметров, оцениваемых по выборке. Нормальное распределение определяется двумя параметрами. Так как этот параметр оценивается по выборке, то r =2 и, следовательно, число степеней свободы k = s—2—1=s—3 . Из таблицы 2.5 видно: χ кр 2 = 22,2. По таблице критических точек распределения χ кр 2 (рисунок 1,1), на уровне значимости α = 0,05 и числу степеней свободы k=9-3=6 находим критическую точку правосторонней критической области 𝜒 теор 2 = 12,6 Так как χ набл 2 > χ кр 2 —гипотезу о распределении по нормальному закону отвергают. Другими словами, эмпирические и теоретические частоты различаются значимо. Задание 3 (распределение Пуассона) Необходимо проанализировать выборочную совокупность реального информационного потока (таблица 2.6) для определения закона распределения поступления заявок на обслуживающее устройство. Таблица 2.6 - Выборочная совокупность реального информационного потока 𝑥 𝑖 𝑛 𝑖 𝑥 𝑖 𝑛 𝑖 0 403 4 12 1 370 5 2 2 167 Итого 1000 3 46 Для доказательства предположения соответствия распределения выборочной совокупности теоретическому распределению воспользуемся критерием согласия 2 Пирсона. Статистический анализ выборочных данных начинают обычно с вычисления выборочных моментов. Тогда выборочная средняя: 𝑥 = ∑ 𝑥 𝑖 ∗ 𝑛 𝑖 ∑ 𝑛 𝑖 = 0,9 В качестве оценки параметра λ, распределения Пуассона принимаем выборочную среднюю 𝑥̅ = 𝜆 = 0,9 Предполагаемый закон Пуассона: 𝑃 𝑖 = 𝜆 𝑖 𝑖! exp(−𝜆) = 0,9 𝑖 𝑖! exp(−0,9), i=0,1…5 Найдем теоретические частоты: 𝑛 𝑖 ′ = 𝑁 ∗ 𝑃 𝑖 = 1000 ∗ 𝑃 𝑖 Для того, чтобы сравнить эмпирические и теоретические частоты с помощью критерия Пирсона необходимо: - составить расчетную таблицу (таблица 2.7), по которой находят наблюдаемое значение критерия Пирсона 𝜒 набл 2 = ∑ (𝑛 𝑖 − 𝑛 𝑖 ′ ) 2 𝑛 𝑖 ′ - по таблице критических точек распределения 𝜒 кр 2 , по заданному уровню значимости, и числу степеней свободы находят критическую точку правосторонней критической области 𝜒 кр 2 . Если 𝜒 набл 2 < 𝜒 кр 2 — нет оснований отвергнуть гипотезу о законе распределении генеральной совокупности. Если 𝜒 набл 2 > 𝜒 кр 2 — гипотезу отвергают. Таблица 2.7 – Расчетная таблица i 𝑛 𝑖 𝑃 𝑖 𝑛 𝑖 ′ (𝑛 𝑖 − 𝑛 𝑖 ′ ) 2 (𝑛 𝑖 − 𝑛 𝑖 ′ ) 2 𝑛 𝑖 ′ 0 403 0,401 406,57 12,74 0,031 1 370 0,366 365,91 16,73 0,046 2 167 0,165 164,66 5,48 0,033 3 56 0,049 49,40 43,56 0,881 4 12 0,011 11,11 0,79 0,071 5 2 0,002 2,0 0,0 0,0 Итого 1,06 При использовании критерия Пирсона число степеней свободы k = s—r—1, где г — число параметров, оцениваемых по выборке. Распределение Пуассона определяется одним параметром λ. Так как этот параметр оценивается по выборке, то r =1 и, следовательно, число степеней свободы k = s—1—1=s—2 . Из таблицы 2.3 видно: χ кр 2 = 1,06. По таблице критических точек распределения χ кр 2 (рисунок 2.1), на уровне значимости α = 0,05 и числу степеней свободы k=6-2=4 находим критическую точку правосторонней критической области 𝜒 теор 2 = 9.5 Так как χ набл 2 < χ кр 2 —нет оснований отвергнуть гипотезу о распределении Пуассона. Приложение А Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала. Сводка - это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализировать связи между отдельными признаками. Построение статистических группировок осуществляется по следующим этапам: 1. Определение группировочного признака. 2. Определение числа групп. 3. Расчет ширины интервала группировки. 4. Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу. Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. Число групп зависит от: - задач исследования; - объема изучаемой совокупности; - степени вариации признака. При определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оценить вариацию признака между крайними значениями признака – максимальным (x max ) и минимальным (x min ) и определяется по следующей формуле: 𝑅 = 𝑋 𝑚𝑎𝑥 − 𝑋 𝑚𝑖𝑛 Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы наблюдения. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из размаха вариации признака, но и из особенностей объекта и показателей, его характеризующих, а также цели исследования. Определение числа групп можно осуществить несколькими способами. Математический способ предполагает использование формулы Стерджесса: 𝑘 = 1 + 3,322 ∗ lg (𝑁) где k - число групп, N - число единиц совокупности. Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности. Применение данной формулы дает хорошие результаты, в том случае, если совокупность состоит из большого числа единиц наблюдения. Когда определено число групп, то следует определить интервалы группировки. Интервал группировки - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала. Ширина равного интервала определяется по формуле: ∆𝑥 = 𝑅 𝑘 Ряды распределения представляют собой простейшую группировку, в которой каждая выделенная группа характеризуется одним показателем. Дискретный вариационный ряд – это ряд распределения, в котором группы составлены по признаку, изменяющемуся прерывно, т.е. через определенное число единиц и характеризуют распределение единиц совокупности по дискретному признаку, принимающему только целые значения (например, таблица 2.6). Интервальный вариационный ряд распределения – это ряд распределения, в котором группировочный признак, составляющий основание группировки, может принимать в интервале любые значения, отличающиеся друг от друга на сколь угодную малую величину (например, таблица 2.1). Решение задачи группировки в среде MS Excel. Дана негруппированная выборка (выборка называется негруппированной, если выборочные значения представляют собой индивидуальные значения наблюдений из области определения случайной величины): Найдем величины X max , X min , k, ∆𝑥, используя встроенные функции Excel МАКС, МИН и СЧЕТ: Результат расчета: Замечание. При выполнении деления или работе с дробными числами, Excel производит округление. Это связано, прежде всего, с тем, что абсолютно точные дробные числа редко когда бывают нужны, но оперировать громоздким выражением с несколькими знаками после запятой не очень удобно. Кроме того, существуют числа, которые в принципе точно не округляются. В то же время, недостаточно точное округление может привести к грубым ошибкам в ситуациях, где требуется именно точность. Все числа, с которыми работает Microsoft Excel, делятся на точные и приближенные. В памяти хранятся числа до 15 разряда, а отображаются до того разряда, который укажет сам пользователь. Все расчеты выполняются согласно хранимых в памяти, а не отображаемых на мониторе данных. Если необходимо изменить величину округления при расчете относительно одной или нескольких ячеек, но при этом не понизить точность расчетов в целом для документа, в этом случае лучше всего воспользоваться возможностями, которые предоставляет функция «ОКРУГЛ» и различные ее вариации, а также некоторые другие функции. Сформируем столбец интервалов варьирования от значения Xmin = 0,219 с шагом Δx = 2,396. Первое значение набираем с клавиатуры, а последующие вычисляем (не забываем фиксировать ячейку, содержащую значение шага). Число интервалов группировки округляем до ближайшего целого: 𝑘 = 6,907 ≈ 7 Результат расчета Первый способ расчета количества попаданий признака в заданный интервал (с помощью функции «ЧАСТОТА»). Сформируем столбец «Количество попаданий» и с помощью функции «ЧАСТОТА», то есть найдем частоту появления значений исследуемой случайной величины Х в каждом из интервалов. Для решения выделим области из 7 ячеек (M13:М19) и введем функцию «=ЧАСТОТА»: Описание аргументов: E6:S9 – массив данных; L13:L19 – массив критериев нахождения частоты вхождений в массиве данных. Контролируем, чтобы диапазон M13:М19 был выделен и жмем сначала клавишу F2, а потом комбинацию клавиш Ctrl+Shift+Enter, чтобы функция ЧАСТОТА была выполнена в массиве. Подтверждением того что все сделано правильно будут служить фигурные скобки {} в строке формул по краям. Это значит, что формула выполняется в массиве. В результате получим: Контролируем правильность расчета. Сумма попаданий признака в каждый интервал должна быть равна общему числу совокупности: ∑ 𝑛 𝑖 = 𝑁 𝑁 𝑖=1 Второй вариант расчета количества попаданий признака в заданный интервал (с помощью надстройки Пакет анализа). Вызвав диалоговое окно надстройки Пакет анализа, выберите пункт Гистограмма и нажмите ОК. В появившемся окне необходимо как указать: входной интервал (E6:S9), интервал карманов (L13:L19 – массив критериев нахождения частоты вхождений в массиве данных) и левую верхнюю ячейку выходного интервала. После нажатия кнопки ОК будут: автоматически рассчитаны интервалы значений (карманы); подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот). Третий вариант расчета количества попаданий признака в заданный интервал (с помощью функции «СЧЁТЕСЛИМН»). Функция СЧЁТЕСЛИМН предназначена для подсчета числа ячеек из диапазона, удовлетворяющих установленным одному или нескольким критериям, и возвращает соответствующее числовое значение. Для вычислений используем следующую формулу: =СЧЁТЕСЛИМН($E$6:$S$9;">="&K13;$E$6:$S$9;"<="&L13) Синтаксис функции выглядит следующим образом: СЧЕТЕСЛИМН(диапазон1;условие1; [диапазон2;условие2]…) диапазон1 (обязательный) - определяет первую область, к которой должно применяться первое условие ( условие1). В рассматриваемом примере массив данных E6:S9 (так как необходимо посчитывать количество значений, попадающих в несколько интервалов, не забываем фиксировать ссылки на ячейки). условие1 (обязательное) - устанавливает требование к отбору в виде числа , ссылки на ячейку , текстовой строки , выражения или другой функции Excel. Определяет, какие ячейки должны учитываться. В рассматриваемом примере условие отбора задано в виде ссылок на ячейки, поэтому аргумент «Критерий» нужно заключать в кавычки добавить амперсанд (&) перед ссылкой. [диапазон2;условие2]… (необязательные) - это дополнительные области и связанные с ними критерии. Вы можете указать до 127 таких пар. Результат расчета количества попаданий признака в заданный интервал тремя способами совпадают: |