Главная страница

Методичка статистика. Методичка4-ОЗЗ-Леч-Проверка гипотез. Методические указания для студентов третьего курса лечебного факультета к проведению практического занятия по дисциплине Общественное здоровье и здравоохранение, экономика здравоохранения


Скачать 1.08 Mb.
НазваниеМетодические указания для студентов третьего курса лечебного факультета к проведению практического занятия по дисциплине Общественное здоровье и здравоохранение, экономика здравоохранения
АнкорМетодичка статистика
Дата16.05.2023
Размер1.08 Mb.
Формат файлаpdf
Имя файлаМетодичка4-ОЗЗ-Леч-Проверка гипотез.pdf
ТипМетодические указания
#1136141

УТВЕРЖДАЮ
Зав. кафедрой общественного здоровья и здравоохранения
В.Л.Аджиенко
02.06.2022
Методические указания для студентов
третьего курса лечебного факультета к проведению практического занятия по дисциплине
«Общественное здоровье и здравоохранение, экономика здравоохранения»
Тема №4. Проверка статистических
гипотез, критерий Стьюдента
Волгоград
ВолгГМУ
2022 г
Ред.18.02.2022 г.

1
ВОПРОСЫ ДЛЯ ПОДГОТОВКИ К ВЫПОЛНЕНИЮ ЗАДАНИЙ
1. Как обозначаются статистические гипотезы.
2. Какая гипотеза используется при сравнении средних величин?
3. Как называется вероятность опровержения рабочей гипотезы?
4. Какой уровень значимости используется в медико-биологических исследованиях?
5. Формула вычисления критерия Стьюдента для оценки достоверности различий средних величин?
6. Методика вычисления критерия Стьюдента для относительных величин?
7. Какие функции и модули Excel применяются для оценки значимости различий средних и относительных величин на основе критерия
Стьюдента?
Статистические гипотезы
В научно-исследовательской практике часто требуется сопоставить средние арифметические, например, при сравнении результатов в контрольной и экспериментальной группах, при оценке показателей здоровья населения в различных местностях за несколько лет и т. д.
Методологической основой любого исследования является формулировка рабочей гипотезы. При этом основной целью исследования является получение данных, на основании которых выдвинутую еще до начала исследования
(априори) гипотезу можно было бы принять, т. е. признать истинной, либо отвергнуть - признать ложной.
Выдвинутую гипотезу называют основной или нулевой (H
0
)
.
Гипотезу, которая противоречит нулевой и является ее логическим отрицанием, называют конкурирующей или альтернативной (H
1
).
Гипотезы H
0
и Н
1
предоставляют выбор только одного из двух вариантов.
Например, если нулевая гипотеза предполагает, что среднее арифметическое
М = 15, то логическим отрицанием будет М ≠ 15. Коротко это записывается так:
H
0
: М=15; Н
1
: М≠15. В медико-биологических исследованиях при сравнении регистрируемых признаков в качестве нулевой гипотезы принимают гипотезу об отсутствии различий.
Например, при оценке токсичности какого-либо вещества обычно берутся две группы лабораторных животных. Подбираются животные одинакового возраста, пола, одинакового содержания и т. п. Таким образом, делается все, чтобы эти группы животных представляли собой единую, как можно более однородную статистическую совокупность, с тем, чтобы максимально снизить исходную вариабельность анализируемых данных. Оптимальным с этой точки зрения считается ситуация, когда отличия сравниваемых групп заключаются только в том, что одна из групп (опытная) подвергается воздействию токсического вещества, а другая (контрольная) - нет. В любом случае, произошли ли после воздействия токсического вещества изменения в опытной группе или нет, различия средних показателей в обеих группах обязательно будут. Вопрос состоит в следующем: являются ли эти различия только следствием выборочного исследования, или разница возникла из-за того, что

2 произошли существенные сдвиги физиологических функций животных опытной группы, которые будут обнаруживаться всегда, т. е. в генеральной совокупности.
Значит, проверяется вопрос: принадлежат ли животные опытной и контрольной групп к той же самой генеральной совокупности или опытная группа принадлежит к другой генеральной совокупности (совокупности с измененными физиологическими параметрами)?
Методы оценки достоверности различий средних величин позволяют установить, насколько выявленные различия существенны (носят ли они закономерный характер или являются результатом действия случайных причин).
Эту оценку можно выполнить только с определенной степенью вероятности, когда после установленного уровня вероятности допущение о наличии различий могут считаться закономерными или, наоборот, отвергаются.
Выдвинутая гипотеза может оказаться правильной или неправильной. При ее статистической проверке может быть отвергнута правильная гипотеза.
Вероятность совершить такую ошибку называют уровнем значимости. Этот параметр принято обозначать знаком α (альфа) или p (пи). В биологии и медицине уровень значимости, как правило, принимают не выше 0,05. Это означает, что в 5 случаях из 100 (в 5%) мы рискуем отвергнуть правильную гипотезу. Соответственно, вероятность принятия такой гипотезы (P) равняется
(P = 1 - p) 0,95 (или 95%.)
Таким образом, статистическая значимость выборочных характеристик представляет собой меру уверенности в их «истинности». Уровень значимости находится в убывающей зависимости от надежности результата. Более высокая статистическая значимость соответствует более низкому уровню доверия к найденной в выборке средней величине. Именно уровень значимости представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю генеральную совокупность.
Выбор порога уровня значимости, выше которого результаты отвергаются как статистически не подтвержденные, во многом произвольный. Как правило, окончательное решение обычно зависит от традиций и накопленного практического опыта в данной области исследований. Верхняя граница p < 0,05 статистической значимости содержит довольно большую вероятность ошибки
(5%). Поэтому в тех случаях, когда требуется особая уверенность в достоверности полученных результатов, принимается значимость p < 0,01 или даже p < 0,001.
В практике медико-биологических исследований наиболее часто используются следующие значения показателей значимости: 0,1; 0,05; 0,01;
0,001. Традиционная интерпретация уровней значимости, принятая в этих исследованиях, представлена в таблице 1.
Таблица 1. Интерпретация уровня значимости (p)
Величина уровня значимости (
p
)
Интерпретация
≥ 0,1
Данные согласуются с нулевой гипотезой (H
0
), различия не подтверждены
≥ 0,05
Есть сомнения в истинности как нулевой (H
0
), так и альтернативной гипотез
(H
1
)
< 0,05
Нулевая гипотеза (H
0
) может быть отвергнута.
≤ 0,01
Нулевая гипотеза (H
0
) может быть отвергнута. Сильный аргумент
≤ 0,001
Нулевая гипотеза (H
0
) наверняка не подтверждается. Очень сильный аргумент

3
m
2

m
2 1
2
Для проверки статистических гипотез, выдвигаемых в медико- биологических исследованиях, как правило, используются два статистических подхода: оценка значимости различий на основании критерия Стьюдента и критерий соответствия Хи-квадрат.
Критерий Стьюдента
Сравнивая две средние величины можно судить о наличии достоверных различий между ними по их доверительным границам. Если обнаруживается пересечение верхней границы одного из интервалов и нижней границы второго, можно предположить, что полученная разница средних является случайной и может не повториться в следующих экспериментах с вероятностью, которая использовалась при вычислении этих границ (как правило, 95%). Однако такая оценка является лишь приблизительной. Более точную оценку можно выполнить на основе критерия достоверности Стьюдента.
Критерий Стьюдента (t) используется для проверки гипотезы H
0
:
«Средние двух выборок относятся к одной и той же совокупности». Его принято называть «Коэффициент достоверности – t » поскольку он позволяет найти вероятность того, что две сравниваемые средние величины относятся к одной и той же генеральной совокупности. Если эта вероятность p ниже уровня значимости (p < 0,05), то принято считать, что выборки относятся к двум разным совокупностям, то есть различия статистически достоверны.
Использование t-критерия для сравнения средних величин оправдано, если признак подчиняется нормальному закону распределения. При этом выделяют два типа задач, которые определяют выбор модификации вычисления данного критерия.
В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этих задачах сравнивают две разные выборки, количество вариант (n) в которых может быть разным (n
1
≠ n
2
).
Во втором случае данные получают в одной и той же группе объектов в разные промежутки времени или при различных воздействиях. В результате сравниваемые выборки являются связанными друг с другом, имеют одинаковое значение количества вариант (n
1
= n
2
). В таких задачах для проверки гипотез о равенстве средних используется парный t-критерий.
Если допустить, что изучаемый признак подчиняется закону нормального распределения Гауса и рассматривать общий принцип вычисления критерия
Стьюдента (t) , то величина этого коэффициента определяется модулем отношения разности сравниваемых средних величин к их стандартной ошибке.
При этом стандартная ошибка разности средних будет равна корню квадратному из суммы квадратов стандартных ошибок сравниваемых величин:

4
M
1

M
2
m
2

m
2 1
2
P
1

P
2
m
2

m
2 1
2
Таким образом, коэффициент достоверности (t) при сравнении средних величин определяется по формуле:
t

, где: M
1
– средняя арифметическая 1-го вариационного ряда,
M
2
– средняя арифметическая 2-го вариационного ряда,
m
1
– ошибка репрезентативности 1-го вариационного ряда,
m
2
– ошибка репрезентативности 2-го вариационного ряда.
Для сравнения относительных величин (показателей) применяется модифицированная формула:
t

, где: P
1
– относительная величина (показатель) 1-й группы;
P
2
– относительная величина (показатель) 2-й группы;
m
1
– ошибка репрезентативности 1-го показателя;
m
2
– ошибка репрезентативности 2-го показателя.
При этом ошибка репрезентативности относительной величины может быть вычислена по формуле: m=√
где: Р – величина относительного показателя;
q – величина, обратная Р и вычисленная как (1-Р), (100-Р), (100-
Р) и т. д., в зависимости от основания, на которое рассчитан показатель;
n – число наблюдений.
Чтобы подтвердить достоверность различий между средними, необходимо сравнить расчетное значение t
расч.
с критическим значением t
крит.
, которое зависит от числа вариант в сравниваемых вариационных рядах n
1
и n
2
и называется «Степень свободы». В медико-биологических исследованиях, где число наблюдений n больше 30, допускается использование сравнения вычисленного значения t
расч.
с критическим значением (t
крит.
) равным 2. Если t- критерий больше 2, различия между средними считаются закономерными (не случайными, достоверными), т. е. они статистически подтверждены с вероятностью более 95%. Если значение критерия меньше 2, то разница считается не доказанной, то есть носит случайный характер, и статистически не подтверждается, поскольку вероятность этой гипотезы менее 95%. При меньшем числе наблюдений значение критического уровня для сравнения с расчетным значением необходимо искать в книгах с таблицами Стьюдента или вычислять в статистической компьютерной программе.

5
В программе Excel критическое значение критерия Стьюдента может быть вычислено функцией = СТЬЮДРАСПОБР(Уровень значимости (p); Степени свободы (df)).
Расчетное значение t-критерия можно вычислить по формулам или используя соответствующие модули «t-тест» пакета анализа. Выбор модуля определяется условием задачи. При сравнении связанных выборок должен использоваться модуль «Парный двухвыборочный t-тест для средних». Если требуется сравнить не связанные выборки, может использоваться оlин из вариантов двухвыборочного t-теста с одинаковыми дисперсиями или разными дисперсиями.
Для вычисления вероятности нулевой гипотезы по критерию Стьюдента может применяться функция ТТЕСТ, которая позволяет определить, вероятность того, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее. Для применения такой функции необходимо учитывать вид распределения признака (хвосты) и тип модификации критерия (независимый - двухвыборочный или связанный - парный).
Пример определения достоверности различий между средними
величинами по критерию Стьюдента
Задача: сравнить средние значения частоты сердечных сокращений (ЧСС) детей 1-го года жизни в отделениях №1, №2.
Задания: а) оценить достоверность различий между ЧСС пациентов 1го и
2-го отделений с помощью доверительных границ; б) вычислить критерий Стьюдента для сравнения ЧСС детей в этих отделениях, сделать вывод о достоверности различий средних величин.
Решение: необходимо запустить программу Excel, создать новый лист, ввести данные и выполнить вычисления, как показано на рис.1, сохранить файл.
Рис. 1. Вычисление доверительных границ и критерия Стьюдента в Excel

6
M
1

M
2
m
2

m
2 1
2 а) вычисление доверительных границ колебаний средних в каждом отделении при уровне значимости p < 0,05, т.е. с вероятностью прогноза более 95%, составляет M ±2m, где M – средняя арифметическая, m – ошибка репрезентативности.
По условию задачи в 1-м отделении M
1
=121,9, m
1
=1,64. Т.е. 121,9 ±2*1,64
= 121,9 ±3,28 уд/мин. В ячейках таблицы вводятся формулы: = 121,9 + 3,28 и
= 121,9 - 3,28. Получаем доверительные границы колебаний средней частоты пульса в 1-м отделении от 118,62 до 125,18 уд/мин.
Аналогично определяем доверительные границы средней ЧСС во 2-м отделении. По условию задачи M
2
= 126,2, m
2
= 2,04. Т.е. 126,29 ± 2 * 2,04 =
126,2 ±4,08 уд/мин. Формулы вычисления = 126,29 + 4,08 и = 126,29 - 4,08.
Получаем доверительные границы колебаний средней частоты пульса в 2-м отделении от 122,21 до 130,37 уд/мин.
Величина доверительных границ частоты пульса в 2-х отделениях больницы позволяют утверждать, что при повторных экспериментах в 95% случаях будут получены средние величины, укладывающиеся в пределах вычисленных значений границ в 1-м отделении от 118,62 до 125,18 уд/мин, во 2- ом - от 122,21 до 130,37 уд/мин. Поскольку доверительные границы этих отделений имеют пересечение верхней границы 1-го и нижней границы 2-го отделений, можно предположить, что полученная разница средних является случайной и может не повториться в следующих экспериментах. б) оценка достоверности различий средней частоты пульса детей, поступающих в 1-е и 2-е отделение больницы по критерию Стьюдента.
Формула вычисления критерия Стьюдента:
t

, где: M
1
– средняя арифметическая 1-го вариационного ряда - 121,8;
M
2
– средняя арифметическая 2-го вариационного ряда - 126,2;
m
1
– ошибка репрезентативности 1-го вариационного ряда - 1,64;
m
2
– ошибка репрезентативности 2-го вариационного ряда - 2,04.
В программе Excel эта формула принимает вид:
=(121,8 – 126,2)/КОРЕНЬ(1,64^2+2,04^2) = -1,64667.
Модуль числа может быть получен с помощью функции =ABS(Число) =
ABS(-1,64667) = 1,64667. Округление числа выполняется функцией
=ОКРУГЛ(Число; Разрядность) = ОКРУГЛ(1,64667;2) =
1,65
Вычисленное значение t-критерия (-1,65) оценивается по модулю числа
(1,65) в сравнении с критическим значением, которое при числе наблюдений
n>30 составляет 2. При числе наблюдений n < 30 критическое значение находят по таблицам Стьюдента при степенях свободы df = n
1
+ n
2
– 2 = 16 + 17 – 2 =
31. В программе Excel критическое значение критерия Стьюдента вычисляется функцией = СТЬЮДРАСПОБР(Уровень значимости p; Степени свободы df) =
= СТЬЮДРАСПОБР(0,05;(16+17-2)) =
2,04
Если t > 2,04 – статистическая гипотеза о равенстве средних с уровнем значимости p < 0,05 опровергается, следовательно, истинной будет являться

7 гипотеза об их различии. Если t < 2,04 – гипотеза равенства средних подтверждается.
В нашем примере получаем:
t = 1,65 < 2,04.
Если в сравниваемых вариационных рядах равное число наблюдений
(n
1
=n
2
), программа Excel позволяет выполнить вычисления при помощи функции
ТТЕСТ. =ТТЕСТ(Диапазон1;Диапазон2;H;Тип), где:
Диапазон1 – первый вариационный ряд (множество данных);
Диапазон2 – второй вариационный ряд (множество данных);
H – число хвостов распределения (1 или 2), как правило, используется число 2. Если Н = 1, то функция ТТЕСТ использует одностороннее распределение, при Н = 2 используется двустороннее распределение.
Тип – цифра модификации теста 1, 2 или 3. Как правило используется цифра 3. Если указана цифра 1 – это парный тест для связанных выборок, 2 – двухвыборочный с равными дисперсиями, 3 – двухвыборочный с неравными дисперсиями.
В большинстве задач статистической обработки медицинских данных эта функция применяется с параметрами =ТТЕСТ(Диапазон1;Диапазон2;2;3), что считается более грубой оценкой, но вполне достаточной для опровержения нулевой гипотезы.
Функция ТТЕСТ возвращает уровень значимости основной гипотезы при сравнении 2-х числовых массивов, вычисленный по критерию Стьюдента. Он выражает вероятность того, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее.
В нашем случае можно выполнить вычисление этой функцией на основе данных 16-и человек в каждой группе. Получаем опытный уровень значимости
0,12. Это означает, что выдвинутая гипотеза о равенстве средних в генеральной совокупности подтверждается с вероятностью 12%. Поскольку значение опытного уровня значимости больше принятого критического уровня (p = 0,05 или 5%), то альтернативная гипотеза о различии средних величин не может быть принята, и значит, различия не подтверждены. В такой ситуации можно провести дополнительное исследование с теми же условиями опыта, но с увеличенным числом единиц наблюдения, что на более качественном уровне подтвердит или опровергнет рабочую гипотезу.
Вывод: Различия средней частоты пульса пациентов 1-го и 2-го отделений
НЕдостоверны. Значит, более высокая средняя частота пульса во 2-м
отделении больницы (126,2 уд/мин) по сравнению с ЧСС в 1-м отделении
(121,9 уд/мин) не подтверждается при уровне значимости p=0,05.
Пример сравнения относительных величин и определения достоверности
различий между ними по критерию Стьюдента
Условие задачи: группа животных в количестве 120 особей получала препарат А.
Из них у 98 животных произошло восстановление функций организма.
Контрольная группа животных в составе 50 особей содержалась в аналогичных

8 условиях без применения этого препарата, из них восстановление наблюдалось у
15 особей.
Задание: а) вычислить показатели частоты восстановления функций организма животных (интенсивные относительные величины) в 1-ой и 2-ой группах животных; б) вычислить ошибки репрезентативности относительных величин; в) определить доверительные границы колебаний относительной величины в каждой группе; г) вычислить критерий Стьюдента для оценки достоверности различий относительных величин в изучаемых группах; д) сделать вывод о проявления эффекта препарата в генеральной совокупности с вероятностью более 95%.
Решение: необходимо запустить программу Excel и выполнить вычисления, как показано на рис. 2, сохранить файл.
Рис. 2. Вычисление критерия Стьюдента для относительных величин а) расчет относительных величин частоты восстановления функций организма животных в 2-х группах по формуле:
P

Уровень явления
* основание
,
Уровеньсреды
P
1
= 98/120*100 =
81,7%;

9
P
1

P
2
m
2

m
2 1
2
P
2
= 15/50*100 =
30,0%. б) вычисление ошибок репрезентативности относительных величин:
𝑚 =

𝑃𝑞
,
𝑛−1
m
1
=
m
2
=

3,53%;

4
,63%. в) определение доверительных границ относительных величин в каждой группе: при уровне значимости p < 0,05, т.е. с вероятностью прогноза более 95%, границы вычисляют по формуле P ±2m, где P – относительная величина, m – ошибка репрезентативности.
По условию задачи в 1-й группе животных P
1
= 81,67, m
1
= 3,53.
Следовательно, 81,7 ± 2*3,53 = 81,7 ± 7,06%. Получаем доверительные границы колебаний относительных величин в 1-й группе от 74,6% до 88,7%, во 2-й группе от 20,7% до 39.3%. Поскольку доверительные границы не пересекаются, с вероятностью 95% справедливо утверждение, что полученная разница относительных величин не случайна. г) вычисление критерия Стьюдента для относительных величин:
t

,
t = ABS((81,7 – 20,7) / КОРЕНЬ(3,53^2 + 4,63^2)) = 8,9 > 2.
Вывод: восстановление функций организма животных на фоне действия
препарата А проявляется в 81,6%. Этот показатель достоверно выше, чем в
контрольной группе животных, не получавших препарат, при уровне
значимости p<0,05.
81,67 *(100

81,67)
120

1 15,31 * (100

15,31)
50

1


написать администратору сайта