Информатика и математика, (для юристов), 2011. Информатика и математика проблемнотематический комплекс
Скачать 3.34 Mb.
|
В ЧЕМ ОСОБЕННОСТИ МАЛОЙ ВЫБОРКИ ? 9 Малые выборки, статистические выборки столь малого объема n, что к ним нельзя применить простые классические формулы, действующие лишь асимптотически при n . Особенности статистической оценки парамет- ров по малой выборке легче всего понять на примере нормального распре- деления (для которого малыми обычно считают выборки объема n ≤ 30). Пусть необходимо оценить неизвестное среднее значение a выборки x 1 , x 2 , ..., x n из нормальной совокупности с неизвестной дисперсией s 2 . Обозначим , Информатика и математика 220 Исходным пунктом при оценке a служит то обстоятельство, что рас- пределение вероятностей величины не зависит от параметров а и s. Вероятность w неравенства – t w < t < t w и равносильного ему неравенства (1) вычисляется при этом по формуле w = (2) где s (t, n – 1) есть плотность вероятности для так называемого рас- пределения Стьюдента с n – 1 степенями свободы. Определяя для задан- ных n и w (0 < w < 1) критическое значение параметра Стьюдента t w (по соответствующим таблицам), получают правило нахождения доверительных границ для величины а, имеющей значимости уровень w. При больших n формула (2), связывающая w и t w , приближенно может быть заменена формулой (3) Эту формулу иногда неправильно применяют для определения t w при небольших n, что приводит к грубым ошибкам. Так, для w = 0,99 по фор- муле (3) находим t 0,99 = 2,58; истинные значения t 0,99 для малых n приведе- ны в следующей таблице 3. Таблица 3 Значения параметра Стьюдента при малом объеме выборки n 2 3 4 5 10 20 30 t 0,99 63,66 9,92 5,84 4,60 3,25 2,86 2,76 Если пользоваться формулой (3) при n = 5, то получится вывод, что неравенство выполняется с вероятностью 0,99. В действительности в случае пяти наблюдений вероятность этого неравенства равна лишь 0,94, а вероятно- стью 0,99 обладает в соответствии с приведенной таблицей неравенство Разработаны также аналогичные методы оценки по малым выборкам па- раметров многомерных распределений (например, коэффициента корреляции). 3. Консультационный курс 221 К АК ОЦЕНИТЬ ДОСТОВЕРНОСТЬ РЕЗУЛЬТАТОВ СТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЙ ? 10 Для определения пределов колеблемости, полученной по данным ма- лой выборки средней величины и оценки достоверности различий сравни- ваемых средних (относительных величин) используют таблицу критерия t (Стьюдента). В графах таблицы помещены величины доверительного коэффициен- та (t), показывающие, во сколько раз разность сравниваемых величин при данном малом числе наблюдений должна превышать свою среднюю ошиб- ку для того, чтобы эта разность могла быть признана достоверной с дан- ным уровнем вероятности, а результаты статистического исследования – достаточно надежными. Значение коэффициента t Стьюдента зависит не только от вероятно- сти (р t ), но и от объема выборки (при n` = n-1). Ясно, что чем меньше вы- борка, тем больше значение t. Обращаться к таблице следует по графе 1, в которой указано число степеней свободы n` = n-1, т.е. числу проведенных наблюдений, умень- шенному на единицу. Так, например, если после восьми испытаний дейст- вия спинномозговой анестезии на уровень кровяного давления установле- но, что средняя величина снижения кровяного давления составляла 5,75 мм при средней ошибке 0,65, то из таблицы t видно, что при n` = 8-1 = 7; t =2,36. Это значит, что с вероятностью ошибки не более чем 5% можно ут- верждать, что размеры снижения кровяного давления при спинномозговой анестезии находятся в пределах 5,75±(2,36 х 0,65), т.е. в пределах 5,75±1,53 или от 4,22 до 8,26 мм; с вероятностью ошибки не более чем 1% можно ут- верждать, что размеры снижения кровяного давления в результате спин- номозговой анестезии составляют 5,75±(3,50 х 0,65) или от 3.48 до 8,02 мм. Если оценивается достоверность разности коэффициентов или сред- них, т.е. , то n 1 + n 2 – 2 . Среднее падение артериального давления при спинномозговой ане- стезии , а при эфирном наркозе ; случайна ли разность средних или действительно эфирный наркоз вызывает меньшее падение артериального давления, чем спинномозговая анестезия? Таблица 4 Падение артериального давления в зависимости от вида обезболивания Вид обезболивания Падение артериального давления в мм во время опыта Спинномозговая анестезия (v 1 ) 6 5 7 4 8 3 8 5 Эфирный наркоз (v 2 ) 2 3 4 2 7 5 4 3 Информатика и математика 222 Вычисления и m x для каждого ряда можно произвести обычным путем, но для упрощения расчетов можно использовать следующую фор- мулу, удобную для применения при малых числах наблюдений: Упрощение расчетов при использовании этой формулы достигается тем, что вместо вычисления σ и m ограничиваются определением для каждого ряда чисел, что значительно облегчает вычислительную работу (v – отдельные наблюдения, варианты). В данном примере: Σv 1 2 = 6 2+ 5 2 +7 2 +4 2 +8 2 +5 2 =288 , Σv 2 2 = 2 2 +3 2 +4 2 + 2 2 +7 2 +5 2 4 2 +3 2 =132, Подставив все эти значения в приведенную выше формулу, получим: Оценивая t по данным таблицы Стьюдента, получаем, что при n` =8 +8-2=14 в графе этой таблицы стоит величина 2.14. Следовательно, для достоверности утверждения неслучайности различия величин и , с ве- роятностью ошибки не более чем 0, 05 (не более чем 5%) достаточно, что- бы t было не менее чем 2.14. В данном примере t =2,25. Значит, действие двух приведенных видов обезболивания на снижение кровяного давления действительно различно и это различие может считаться статистически доказанным. Оценка достоверности интенсивных коэффициентов заболеваемости при наличии повторных заболеваний. Формула средней ошибки показателя пригодна для оценки показателей только в случаях так называемо- го альтернативного варьирования, т.е. тогда, когда возможны только два исхода (умер или не умер, заболел данной болезнью или не заболел, при- вить против данного заболевания или не привит и т.п.). Однако характер распределения медико-биологических явлений не- редко отличается от нормального. Проводя новые исследования, врач- экспериментатор часто не знает, какому закону варьирования будут следо- вать результаты, полученные в нескольких опытах, а относительно не- большое число проведенных наблюдений не позволяет ему определить форму распределения. В этих случаях оценку достоверности следует про- изводить с применением так называемых непараметрических критериев. 3. Консультационный курс 223 И НФОРМАТИКА И МАТЕМАТИКА Проблемно-тематический комплекс Редактор М.В. Егорова Выпускающий редактор Т.А. Поверина Корректор Г.В. Платова Лицензия ИД № 00871 от 25.01.00. Подписано в печать 14.09.2011 Формат 70×90 1 / 16 . Усл. печ. л. 13.0. Тираж 2000 экз. Изд. № 2240 Отпечатано в типографии МИЭП 105082, Москва, Рубцовская наб., д. 3, стр. 1 |