Главная страница
Навигация по странице:

  • Ключевые слова

  • EXPRESS EVALUATION OF THE NORMALITY OF THE DISTRIBUTION OF MEASUREMENT RESULTS BY THE PIRSON ACCEPTANCE CRITERIA

  • Ctr+Shift+Enter.

  • Экспресс-оценка нормальности распределения результатов измерений по критерию согласия Пирсона. Статья (Фаюстов). Экспрессоценка нормальности распределения результатов измерений по критерию согласия пирсона


    Скачать 1.89 Mb.
    НазваниеЭкспрессоценка нормальности распределения результатов измерений по критерию согласия пирсона
    АнкорЭкспресс-оценка нормальности распределения результатов измерений по критерию согласия Пирсона
    Дата19.02.2020
    Размер1.89 Mb.
    Формат файлаdocx
    Имя файлаСтатья (Фаюстов).docx
    ТипДокументы
    #109167
    страница1 из 4
      1   2   3   4

    УДК 519.26
    ЭКСПРЕСС-ОЦЕНКА НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ ПО КРИТЕРИЮ СОГЛАСИЯ ПИРСОНА
    А.А.Фаюстов

    Федеральное государственное бюджетное образовательное учреждение высшего образования «Государственный университет управления», Россия, Москва, E-mail: afayust@yandex.ru

    Аннотация

    В статье рассматривается созданный автором шаблон Excel и опыт его применения для автоматического построения гистограмм и кривых Гаусса по результатам измерений с одновременной оценкой согласия по критерию Пирсона. Показываются преимущества данного метода в скорости обработки данных перед ручным счетом по проверке рассмотренного критерия.

    Ключевые слова: шаблон Excel, гистограмма, кривая распределения, результаты измерений, критерий согласия Пирсона.
    EXPRESS EVALUATION OF THE NORMALITY OF THE DISTRIBUTION OF MEASUREMENT RESULTS BY THE PIRSON ACCEPTANCE CRITERIA
    A.A. Fayustov

    Federal State Budgetary Educational Institution of Higher Education "State University of Management", Moscow, Russia, E-mail: afayust@yandex.ru
    Annotation
    The article discusses the Excel template created by the author and the experience of its application for the automatic construction of histograms and Gaussian curves based on measurement results with a simultaneous assessment of agreement according to Pearson's criterion. The advantages of this method in data processing speed over manual counting by checking the considered criterion are shown.

    Keywords: Excel template, histogram, distribution curve, measurement results, Pearson agreement criterion.
    Целью первичной обработки экспериментальных наблюдений обычно является выбор закона распределения, наиболее хорошо описывающего случайную величину, выборку которой мы наблюдали. Проверка того, насколько хорошо наблюдаемая выборка описывается теоретическим законом, осуществляется с использованием различных критериев согласия. Целью проверки гипотезы о согласии опытного распределения с теоретическим, является стремление удостовериться в том, что данная модель теоретического закона не противоречит наблюдаемым данным, и использование ее не приведет к существенным ошибкам при вероятностных расчетах. Некорректное использование критериев согласия может приводить к необоснованному принятию или необоснованному отклонению проверяемой гипотезы [1].

    Сходимость результатов наблюдений можно оценить наиболее полно, если их распределение является нормальным. Поэтому исключительно важную роль при обработке результатов наблюдений играет проверка нормальности распределения.

    Эта задача представляет собой частный случай более общей проблемы, заключающейся в подборе теоретической функции распределения, в некотором смысле наилучшим образом согласующейся с опытными данными. Сама процедура проверки нормальности распределения относится к распространенной стандартной и довольно тривиальной задаче обработки данных и достаточно подробно и широко описана в различной литературе по метрологии и статистической обработке данных измерений [2- 4].

    Данные, получаемые в результате измерений при контроле технологических процессов, оценке характеристик различных объектов и др. для дальнейшей обработки желательно представлять в виде теоретического распределения, максимально соответствующего экспериментальному распределению. Проверку гипотезы о виде функции распределения в настоящее время проводят по различным критериям согласия – Пирсона, Колмогорова, Мизеса–Смирнова и другим в соответствии с новыми разработанными нормативными документами – ГОСТ Р 8.736 – 2011 [5].

    Наиболее часто используется критерий Пирсона c2. Однако применение критериев согласия требует обычно довольно значительного объёма данных. Так, критерий Пирсона обычно рекомендуется использовать при объёме выборки не менее 50..100. Поэтому при небольшом объёме выборки проверку гипотезы о виде функции распределения проводят приближёнными методами – графическим методом или по асимметрии и эксцессу. Применение критерия Пирсона для ручной обработки данных очень подробно было рассмотрено в известной работе [2]. Как свидетельствует опыт проверок согласия экспериментальных данных с теоретическими по различным критериям, с использованием классических известных таблиц математической статистики [4], эта процедура является очень трудоемкой, требует некоторой усидчивости и особого внимания при обработке от исследователя, как правило, не исключает ошибок в работе и не вызывает особого энтузиазма у выполняющего эту работу.

    Решение задач статистического анализа связано со значительными объемами вычислений. Проведение реальных многовариантных статистических расчетов в ручном режиме является очень громоздкой и трудоемкой задачей и без использования компьютера в настоящее время практически невозможно. В настоящее время разработано достаточное количество универсальных и специализированных программных средств для статистического анализа и обработки экспериментальных данных. Автор предлагает для использования достаточно простой и эффективный шаблон для быстрого построения гистограммы и кривой нормального распределения.

    По виду гистограммы можно предположить (принять гипотезу) о том, что выборка случайных чисел (или реальных результатов измерений) подчиняется нормальному закону распределения. Далее, для того чтобы убедиться в правильности выбранной гипотезы надо, первое – построить график гипотетического нормального закона распределения, выбрав в качестве параметров (математического ожидания и среднего квадратического отклонения) их оценки (среднее и стандартное отклонение), и совместить график гипотетического распределения с графиком гистограммы. И, второе – используя в данном случае, как пример, критерий согласия Пирсона, установить справедливость выбранной гипотезы.

    Рассмотрим порядок действий при работе с шаблоном в среде Excel.

    1. Полученные в результате измерений значения 100 случайных результатов измерений внести в ячейки A1:A100 шаблона Excel и приступить к построению гистограммы на основе данных, назначая длину интервала (карман) и выбирая необходимое число интервалов.

    2. Затем на этом же листе Excel создается таблица, в которую посредством формул Excel вносятся основные расчетные величины, используемые для построения гистограммы и кривой Гаусса: среднее арифметическое, стандартное отклонение, минимальное и максимальное значения выборки, размах, величина кармана (рис. 1).



    Рис. 1. Фрагмент шаблона с таблицей исходных данных

    В таблице исходных данных в ячейку D2 вносится формула =СРЗНАЧ(A1:A100), D3: =СТАНДОТКЛОН(A1:A100), D4: =МИН(A1:A100), D5: =МАКС(A1:A100), D6: =D5-D4, D7: =D6/D8. В ячейку D8 вводится число интервалов, которое для числа измерений, равного 100, в соответствии с рекомендациями ГОСТ Р 8.736-2011 может быть принято от 7 до 12.

    1. Интервал карманов (ширину интервала) вычисляют так: разность максимального и минимального значений массива, деленная на количество интервалов: .

    2. Теперь в каждой ячейке шаг за шагом прибавляем полученное значение ширины интервала: сначала к минимальному значению нашего массива (ячейка D4), затем в следующей ячейке ниже – к полученной сумме и т.д. Так постепенно доходим до максимального значения. Таким образом, мы и построили границы интервалов в виде столбца значений.

    3. Выделяем столбец рядом с нашими карманами, нажимаем «F2» и вводим функцию: =ЧАСТОТА (массив_данных; массив_интервалов) и нажимаем Ctr+Shift+Enter.

    4. В выделенном нами столбце напротив границ интервалов (а мы знаем, что это нестрогие верхние границы) появилось количество значений исходного массива, которые попадают в интервал (рис. 2).



    Рис. 2. Количество значений исходного массива, попавших в интервалы (частоты)

      1   2   3   4


    написать администратору сайта