Главная страница

эконометрика. Эконометрика. Магистратура. Долганева А.. 1 Общие сведения 5 2 Особенности проверки статистических гипотез 9


Скачать 32.02 Kb.
Название1 Общие сведения 5 2 Особенности проверки статистических гипотез 9
Анкорэконометрика
Дата30.08.2021
Размер32.02 Kb.
Формат файлаdocx
Имя файлаЭконометрика. Магистратура. Долганева А..docx
ТипРеферат
#228305


Содержание




Введение 3

1 Общие сведения 5

2 Особенности проверки статистических гипотез 9

Заключение 16

Список использованной литературы 18



Введение


Актуальность. Последние годы отмечены быстрым расширением области применения теоретико-вероятностных и статистических методов. Они используются в различных науках: физике, технике, геологии, биологии, лингвистике, медицине, социологии, менеджменте и др. Одним из основных разделов статистики является теория проверки статистических гипотез. Понятие практической статистики, процедура обоснованного сравнения гипотезы о природе или величине неизвестных статистических параметров анализируемого явления с выборочными данными (выборкой), доступными исследователю.

Статистическая проверка гипотез проводится по некоторому статистическому критерию по общей логической схеме, в том числе по результатам наблюдений (критическая статистика) нахождение функции определенного типа, на основании которой принимается окончательное решение. Например, могут быть рассмотрены гипотезы об общем законе распределения исследуемой случайной величины, об однородности двух или более обработанных выборок, о численных значениях параметров исследуемой генеральной совокупности и т.д. Результат теста может быть как отрицательным (данные наблюдения противоречат высказанной гипотезе), так и неотрицательным. В первом случае гипотеза ошибочна, во втором ее нельзя считать доказанной: она просто не противоречит имеющимся выборочным данным, но другие гипотезы могут обладать таким же свойством наряду с ней. Для проверки статистических гипотез используются разные критерии. В частности, когда проверяется соответствие между выборочным и гипотетическим распределениями, используется критерий согласия, например, критерий хи-квадрат Пирсона, критерий Колмогорова-Смирнова и т.д.

Статистические критерии перечислены вместе с указанием как тех областей, где их использование оправдано, так и тех областей, где применение требует осторожности. Большое внимание уделяется построению критериев, в том или ином смысле наилучшего.

Цель работы – рассмотреть статистические выводы и проверка статистических гипотез.

1 Общие сведения


Статистическая гипотеза - это гипотеза, которую можно проверить на основе наблюдаемых данных, смоделированных как реализованные значения, полученные с помощью набора случайных величин [1]. Набор данных моделируется как реализованные значения набора случайных величин, имеющих совместное распределение вероятностей в некотором наборе возможных совместных распределений. Проверяемая гипотеза - это именно тот набор возможных распределений вероятностей. Проверка статистической гипотезы - это метод статистического вывода. Альтернативная гипотеза предлагается для распределения вероятностей данных, явно или только неформально. Сравнение двух моделей считается статистически значимым, если в соответствии с пороговой вероятностью - уровнем значимости - данные вряд ли будут получены, если нулевая гипотеза верна. Проверка гипотезы определяет, какие результаты исследования могут привести к отклонению нулевой гипотезы на заранее заданном уровне значимости, при этом используется заранее выбранная мера отклонения от этой гипотезы (тестовая статистика или критерий согласия. мера). Заранее выбранный уровень значимости - это максимально допустимая «частота ложных срабатываний». Один хочет контролировать риск неправильного отклонения истинной нулевой гипотезы.

Процесс различения нулевой гипотезы и альтернативной гипотезы облегчается рассмотрением двух типов ошибок. Ошибка типа I возникает, когда отклоняется истинная нулевая гипотеза. Ошибка типа II возникает, когда ложная нулевая гипотеза не отклоняется.

Проверка гипотез, основанная на статистической значимости, - это еще один способ выражения доверительных интервалов (точнее, наборов достоверности). Другими словами, каждая проверка гипотезы, основанная на значимости, может быть получена с помощью доверительного интервала, а каждый доверительный интервал может быть получен с помощью проверки гипотезы на основе значимости [2].

Проверка гипотез на основе значимости является наиболее распространенной структурой для проверки статистических гипотез. Альтернативной структурой для проверки статистических гипотез является определение набора статистических моделей, по одной для каждой гипотезы-кандидата, а затем использование методов выбора модели для выбора наиболее подходящей модели [3]. Наиболее распространенные методы отбора основаны либо на информационном критерии Акаике (= AIC), либо на байесовском информационном критерии (= BIC).

В процессе статистического анализа иногда необходимо сформулировать и проверить предположения (гипотезы) относительно значения независимых параметров или закона распределения исследуемой генеральной совокупности (популяций).

Например, исследователь предполагает, что «образец взят из нормальной генеральной совокупности» или «общие средние значения двух проанализированных популяций равны». Такие предположения называются статистическими гипотезами.

Сравнение высказанной гипотезы в отношении генеральной совокупности с доступными выборочными данными, сопровождаемое количественной оценкой степени достоверности полученного заключения и проведенного с использованием того или иного статистического критерия, называется статистической проверкой гипотез.

Под статистической гипотезой понимаются различные виды предположений о характере или параметрах распределения случайной величины, которые могут быть проверены на основе результатов наблюдений в случайной выборке.

Другими словами, статистическая гипотеза - это предположение о свойстве генеральной совокупности, которое может быть проверено на основе выборочных данных. Гипотеза обозначается буквой N. Таким образом, можно выдвинуть гипотезу о том, что среднее значение в генеральной совокупности равно определенной величине.

Целью проверки статистической гипотезы является принятие или отклонение статистической гипотезы на основе имеющихся статистических данных с минимальным риском ошибки. Эта проверка проводится по определенным правилам.

Следует иметь в виду, что статистическая проверка гипотез носит вероятностный характер. С помощью статистической проверки гипотез можно определить вероятность принятия ложного решения на основании определенных результатов статистического исследования этого явления. Если вероятность ошибки мала, то статистические показатели, рассчитанные при исследовании явления, можно использовать в практических целях с небольшим риском ошибки.

Гипотезы, в свою очередь, подразделяются на:

- простые и сложные;

- параметрические и непараметрические;

- основные (выраженные) и альтернативные (конкурирующие).

Если выдвинутая гипотеза сводится к утверждению, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданному значению, то эта гипотеза называется простой.

Например: «Среднедушевой совокупный доход населения России составляет 10 000 рублей в месяц»; «Уровень безработицы (доля безработных в экономически активном населении) в России составляет 9%».

Сложная гипотеза называется гипотезой, которая состоит из конечного или бесконечного набора простых гипотез, при этом указывается определенный диапазон возможных значений параметров.

Гипотезы о параметрах генеральной совокупности называются параметрическими, о распределениях - непараметрическими.

Выдвинутая гипотеза называется нулевой (основной). Обычно обозначать H0. В этом случае предполагается, что фактическая разница между сравниваемыми значениями равна нулю, а отличие от нуля, выявленное из данных, носит случайный характер. Нулевая гипотеза отклоняется, когда выборка дает результат, который, если нулевая гипотеза верна, маловероятен.

В отношении заявленной (основной) гипотезы всегда можно сформулировать альтернативную (конкурирующую) гипотезу, которая ей противоречит. Альтернативная (конкурирующая) гипотеза обычно обозначается H1.

В качестве нулевой гипотезы H0 принято выдвигать простую гипотезу, поскольку обычно удобнее проверять более строгое утверждение.

По своему содержанию статистические гипотезы можно разделить на несколько основных типов:

- гипотезы о виде закона распределения исследуемой случайной величины;

- гипотезы о численных значениях параметров исследуемой генеральной совокупности;

- гипотезы об однородности двух и более выборок или некоторых характеристик анализируемых популяций;

- гипотезы об общем виде модели, описывающей статистическую связь между признаками; и так далее.

2 Особенности проверки статистических гипотез


В статистической литературе основополагающую роль играет проверка статистических гипотез [4]. Можно использовать два математически эквивалентных процесса [5].

Обычно рассуждают следующим образом:

1. Существует первоначальная исследовательская гипотеза, истина которой неизвестна.

2. Первый шаг - сформулировать соответствующие нулевые и альтернативные гипотезы. Это важно, так как неверная формулировка гипотез запутает остальную часть процесса.

3. Второй шаг - рассмотреть статистические допущения, сделанные в отношении выборки при проведении теста; например, предположения о статистической независимости или о форме распределений наблюдений. Это не менее важно, поскольку неверные предположения будут означать, что результаты теста недействительны.

4. Решите, какой тест подходит, и укажите соответствующую статистику теста.

5. Выведите распределение тестовой статистики при нулевой гипотезе из допущений. В стандартных случаях это будет хорошо известный результат. Например, статистика теста может следовать t-распределению Стьюдента с известными степенями свободы или нормальному распределению с известным средним и дисперсией. Если распределение тестовой статистики полностью фиксируется нулевой гипотезой, мы называем гипотезу простой, иначе она называется составной.

6. Выберите уровень значимости (α), порог вероятности, ниже которого нулевая гипотеза будет отклонена. Общие значения 5% и 1%.

7. Распределение тестовой статистики при нулевой гипотезе делит возможные значения T на те, для которых нулевая гипотеза отклоняется (так называемая критическая область), и те, для которых это не так. Вероятность критической области равна α. В случае составной нулевой гипотезы максимальная вероятность критической области равна α.

8. Вычислите на основе наблюдений наблюдаемые значения tobs тестовой статистики.

Общая альтернативная формулировка этого процесса выглядит следующим образом:

1. Вычислите из наблюдений наблюдаемое значение tobs тестовой статистики T.

2. Рассчитайте p-значение. Это вероятность при нулевой гипотезе выборки тестовой статистики, по крайней мере, столь же экстремальной, как наблюдаемая (максимальная вероятность того события, если гипотеза составная).

3. Отвергнуть нулевую гипотезу в пользу альтернативной гипотезы тогда и только тогда, когда значение p меньше (или равно) пороговому значению уровня значимости (выбранной вероятности).

Первый процесс был выгоден в прошлом, когда были доступны только таблицы тестовой статистики с общими порогами вероятности. Это позволяло принимать решение без вычисления вероятности. Его было достаточно для работы в классе и для оперативного использования, но было недостаточно для отчета о результатах. Последний процесс опирался на обширные таблицы или вычислительную поддержку, которая не всегда доступна. Явный расчет вероятности полезен для составления отчетов. Теперь вычисления легко выполняются с помощью соответствующего программного обеспечения.

Разница в двух процессах, примененных к примеру с радиоактивным чемоданом (ниже):

• «Счетчик Гейгера показывает 10. Предел - 9. Проверьте чемодан».

• «Показания счетчика Гейгера высокие; 97% безопасных чемоданов имеют более низкие показания. Предел - 95%. Проверьте чемодан».

Первый отчет является адекватным, второй дает более подробное объяснение данных и причин, по которым чемодан проверяется.

Разница между принятием нулевой гипотезы и просто неспособностью ее отвергнуть очень важна. Терминология «не удалось отклонить» подчеркивает тот факт, что несущественный результат не дает возможности определить, какая из двух гипотез верна, поэтому все, что можно сделать, - это то, что нулевая гипотеза не была отвергнута. Фраза «принять нулевую гипотезу» может означать, что она доказана просто потому, что не была опровергнута, - логическая ошибка, известная как аргумент от незнания. Если не использовать тест с особенно высокой мощностью, идея «принятия» нулевой гипотезы, вероятно, будет неверной. Тем не менее терминология преобладает в статистике, где фактически подразумеваемое значение хорошо понимается.

Описанные здесь процессы идеально подходят для вычислений. Они серьезно пренебрегают планированием экспериментов [6].

Особенно важно оценить соответствующие размеры выборки перед проведением эксперимента.

Фраза «критерий значимости» была придумана статистиком Рональдом Фишером [7].

Значение p - это вероятность того, что данный результат (или более значимый результат) будет иметь место при нулевой гипотезе. При уровне значимости 0,05 ожидается, что честная монета (ошибочно) отвергнет нулевую гипотезу примерно в 1 из 20 тестов. Значение p не обеспечивает вероятность того, что какая-либо гипотеза верна (общий источник путаницы).

Если значение p меньше выбранного порога значимости (эквивалентно, если наблюдаемая статистика теста находится в критической области), то мы говорим, что нулевая гипотеза отклоняется на выбранном уровне значимости. Отказ от нулевой гипотезы - это вывод. Это похоже на обвинительный приговор в уголовном процессе: доказательств достаточно, чтобы отрицать невиновность, таким образом подразумевая виновность.

Если значение p не меньше выбранного порога значимости (эквивалентно, если наблюдаемая статистика теста выходит за пределы критической области), то доказательства недостаточны для подтверждения вывода. (Это похоже на вердикт «невиновен».) Исследователь обычно уделяет особое внимание тем случаям, когда значение p близко к уровню значимости.

В примере «Леди, дегустирующая чай» (ниже) Фишер потребовал, чтобы Леди должным образом классифицировала все чашки чая, чтобы обосновать вывод о том, что результат маловероятен. Его тест показал, что если женщина эффективно гадала наугад (нулевая гипотеза), была 1,4% вероятность того, что наблюдаемые результаты (идеально заказанный чай) произойдут.

Отказ от гипотезы о том, что большой отпечаток лапы произошел от медведя, не сразу доказывает существование снежного человека. Проверка гипотез делает упор на отказе, который основан на вероятности, а не на принятии, что требует дополнительных логических шагов.

«Вероятность отклонения нулевой гипотезы зависит от пяти факторов: одно- или двустороннего теста, уровня значимости, стандартного отклонения, величины отклонения от нулевой гипотезы и количества наблюдений» [8]. Эти факторы являются источником критики; Факторы, находящиеся под контролем экспериментатора / аналитика, придают результатам видимость субъективности.

Статистика полезна при анализе большинства наборов данных. Это в равной степени верно и для проверки гипотез, которая может оправдать выводы, даже если не существует научной теории. В примере с чаем «Леди дегустация» было «очевидно», что не существует разницы между (наливание молока в чай) и (наливание чая в молоко). Данные противоречили «очевидному».

Реальные приложения проверки гипотез включают [1]:

• Проверка того, страдают ли от кошмаров больше мужчин, чем женщин.

• Установление авторства документов

• Оценка влияния полнолуния на поведение

• Определение дальности, на которой летучая мышь может обнаружить насекомое по эхо.

• Принятие решения о том, приводит ли больничное ковровое покрытие к увеличению числа инфекций.

• Выбор лучших способов бросить курить

• Проверка того, отражают ли наклейки на бампере поведение автовладельца.

• Проверка утверждений аналитиков почерка

Статистическая проверка гипотез играет важную роль во всей статистике и в статистических выводах. Например, Леманн (1992) в обзоре фундаментальной статьи Неймана и Пирсона (1933) говорит: «Тем не менее, несмотря на свои недостатки, новая парадигма, сформулированная в статье 1933 года, и многие разработки, осуществленные в ее рамках, продолжают оставаться в силе. играют центральную роль как в теории, так и в практике статистики, и можно ожидать, что они сделают это в обозримом будущем».

Тестирование значимости было предпочтительным статистическим инструментом в некоторых экспериментальных социальных науках (более 90% статей в Журнале прикладной психологии в начале 1990-х). В других областях предпочтение отдается оценке параметров (например, размера эффекта). Проверка значимости используется вместо традиционного сравнения прогнозируемого значения и экспериментального результата, лежащего в основе научного метода. Когда теория способна только предсказать знак взаимосвязи, направленный (односторонний) тест гипотез можно настроить так, чтобы только статистически значимый результат поддерживал теорию. Эта форма оценки теории является наиболее критикуемым применением проверки гипотез.

«Если бы правительство потребовало, чтобы статистические процедуры наносили предупредительные надписи, как на лекарствах, большинство методов вывода действительно имели бы длинные ярлыки» [3]. Это предупреждение относится к проверкам гипотез и их альтернативам.

Успешная проверка гипотезы связана с вероятностью и частотой ошибок первого типа. Вывод может быть неверным.

Заключение теста настолько же убедительно, насколько и образец, на котором он основан. Дизайн эксперимента имеет решающее значение. Наблюдался ряд неожиданных эффектов, в том числе:

• Умный эффект Ганса. Оказалось, что лошадь способна выполнять простую арифметику.

• Эффект Хоторна. Промышленные рабочие были более производительны при лучшем освещении и наиболее продуктивны при худшем.

• Эффект плацебо. Таблетки без медицинских активных ингредиентов были чрезвычайно эффективными.

Статистический анализ вводящих в заблуждение данных приводит к неверным выводам. Вопрос качества данных может быть более тонким. Например, в прогнозировании нет согласия относительно меры точности прогноза. В отсутствие согласованного измерения ни одно решение, основанное на измерениях, не будет бесспорным.

Книга «Как лгать со статистикой» [4] - самая популярная из когда-либо опубликованных книг по статистике. В нем не особо рассматривается проверка гипотез, но его предостережения применимы, в том числе: Многие утверждения делаются на основе слишком малых выборок, чтобы их можно было убедить. Если в отчете не упоминается размер выборки, сомневайтесь.

Проверка гипотез действует как фильтр статистических выводов; только те результаты, которые соответствуют порогу вероятности, подлежат публикации. Экономика также действует как фильтр публикаций; Для публикации могут быть представлены только те результаты, которые благоприятны для автора и источника финансирования. Влияние фильтрации на публикацию называется предвзятостью публикации. Связанная с этим проблема - это множественное тестирование (иногда связанное с интеллектуальным анализом данных), при котором к одному набору данных применяются различные тесты для различных возможных эффектов, и сообщаются только те, которые дают значительный результат. Часто с ними справляются с помощью процедур коррекции множественности, которые контролируют частоту ошибок семейства (FWER) или частоту ложных обнаружений (FDR).

Те, кто принимает важные решения на основе результатов проверки гипотез, благоразумно рассматривают детали, а не только выводы. В физических науках большинство результатов полностью принимаются только при независимом подтверждении. Общий совет относительно статистики: «Цифры никогда не лгут, но фигура лжецы» (анонимно).

Заключение


Статистическая проверка гипотез - необходимый метод, используемый для получения данных в статистике.

Проделанная работа позволила сделать следующие выводы:

- Под статистической гипотезой понимаются различные виды предположений о характере или параметрах распределения случайной величины, которые могут быть проверены на основе результатов наблюдений в случайной выборке.

- Целью проверки статистической гипотезы является принятие или отклонение статистической гипотезы на основе имеющихся статистических данных с минимальным риском ошибки. Эта проверка проводится по определенным правилам.

- Гипотезы делятся на: простые и сложные; параметрические и непараметрические; основной (выраженный) и альтернативный (конкурирующий).

- Проверка гипотез проводится на основе выявления соответствия эмпирических данных гипотетическим (теоретическим).

- Особенно часто процедура проверки статистических гипотез проводится для оценки значимости расхождений в сводных характеристиках отдельных популяций (групп): средних, относительных значений. Проблемы такого рода часто возникают в социальной статистике.

- Проверка статистических гипотез проводится с использованием статистического критерия (назовем его в общем K), который является функцией результатов наблюдения.

- В статистике на данный момент существует большое количество критериев для проверки практически любой гипотезы.

- Выбор критерия проверки статистических гипотез может осуществляться на основе различных принципов. Чаще всего для этого используется принцип отношения правдоподобия, который позволяет построить критерий, который является наиболее сильным среди всех возможных критериев.

- Для каждой проверки статистических гипотез существует свой алгоритм.

Список использованной литературы


  1. Антохонова, И. В. Методы прогнозирования социально-экономических процессов : учеб. пособие для вузов / И. В. Антохонова. — 2-е изд., испр. и доп. — М. : Издательство Юрайт, 2018. — 213 с.

  2. Бабайцев, В. А. Математические методы финансового анализа : учеб. пособие для вузов / В. А. Бабайцев, В. Б. Гисин. — 2-е изд., испр. и доп. — М. : Издательство Юрайт, 2019. — 215 с.

  3. Гармаш, А. Н. Экономико-математические методы и прикладные модели : учебник для бакалавриата и магистратуры / А. Н. Гармаш, И. В. Орлова, В. В. Федосеев ; под ред. В. В. Федосеева. — 4-е изд., перераб. и доп. — М. : Издательство Юрайт, 2017. — 328 с.

  4. Ковалев, Е. А. Теория вероятностей и математическая статистика для экономистов : учебник и практикум для бакалавриата, специалитета и магистратуры / Е. А. Ковалев, Г. А. Медведев ; под общ. ред. Г. А. Медведева. — 2-е изд., испр. и доп. — М. : Издательство Юрайт, 2019. — 284 с.

  5. Красс, М. С. Математика в экономике. Базовый курс : учебник для бакалавров / М. С. Красс. — 2-е изд., испр. и доп. — М. : Издательство Юрайт, 2019. — 470 с. 

  6. Малугин, В. А. Математический анализ для экономистов : учебник и практикум для СПО / В. А. Малугин. — 3-е изд., перераб. и доп. — М. : Издательство Юрайт, 2018. — 557 с. 

  7. Попов, А. М. Математика для экономистов. В 2 ч. Часть 1 : учебник и практикум для СПО / А. М. Попов, В. Н. Сотников. — 2-е изд., перераб. и доп. — М. : Издательство Юрайт, 2019. — 271 с. 

  8. Ризниченко, Г. Ю. Математическое моделирование биологических процессов. Модели в биофизике и экологии : учеб. пособие для бакалавриата и магистратуры / Г. Ю. Ризниченко. — 2-е изд., перераб. и доп. — М. : Издательство Юрайт, 2019. — 181 с.


написать администратору сайта