Биостатистика. Выборка Методы отбора, расчета и анализа
Скачать 0.51 Mb.
|
ВыборкаМетоды отбора, расчета и анализаТерминыГенеральная совокупность Выборка Доверительный интервал Процедуры анализа ВыборкаВыборка – часть генеральной совокупности, соответствующая ей по заданным критериям (характеристикам) Невероятностный метод построения
Выборка по усмотрению Метод квот Метод снежного кома (snowball)
Все единицы отбора имеют равную вероятность для включения в выборку Применяется или нет стратификация Простой или систематический случайный отбор Отбор через одну или несколько стадий Типы выборки
Описание выборкиИсследуемая совокупность … Основа выборки Способ построения выборки Размер выборки Процесс построения выборки Определение размера выборкиПроизвольный (напр. 5% от совокупности) По аналогичным исследованиям Стоимость исследования Расчетный метод – мин. объем с т.зр. надежности и достоверности На основании доверительного интервала Выборка или перепись?Ошибка выборки – точность выборкиОпределение размера выборки расчетным методомгде n – объем выборки; z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности - а; р – найденная вариация для выборки; q = (100 – p); е – доверительный интервал, в десятичной форме, желаемая погрешность (например, 0,04 = ±4%). Значение нормированного отклонения оценки z от среднего значения в зависимости от доверительной вероятности (а) полученного результата
Доверительный интервалНевозможно узнать истинное значение среднего генеральной совокупности на основе данных выборки
Но можно оценить интервал значений, в который с определённой вероятностью входит истинное значение среднего Такой интервал называется доверительным интервалом Для нахождения доверительного интервала, мы сначала определяем вероятность, с которой мы хотим быть уверены в нашей оценке истинного среднего значения как правило мы хотим быть уверены в нашей оценке как минимум на 95% или хотим доверять нашей оценке истинного значения среднего на 95%. ВероятностьВероятность – это мера возможности появления события (благоприятного исхода)p= Число благоприятных исходовОбщее число исходовРаспределение вероятностейИмеет среднее, дисперсию и стандартное отклонение, которые помечаются следующими буквами: (мю) –среднее распределения вероятности 2 и (сигма) дисперсия и стандартное отклонение Форма распределения – Гауссова кривая (нормальное распределение Площадь под кривой равняется 100 % всех наблюдений или вероятности = 1,0 Частотное распределение и распределение вероятностиРаспределение вероятности (РВ) основано на теории вероятности, а частотное распределение (ЧР) основано на эмпирических (наблюдаемых) данных РВ – идеал, ЧР - реальность у РВ форма нормального распределения, а у ЧР форма приближается к нормальному распределению наблюдений Как перевести любое значение переменной в стандартную оценку (z-score)? = среднее = стандартное отклонениеz = стандартная оценкаСтандартная оценка говорит нам, на сколько стандартных отклонений выше или ниже данное значение переменной от среднего значенияИспользуя эту информацию можно рассчитать вероятность того, что переменная принимает значения выше или ниже заданного (заданных) показателейСтандартное отклонение среднегоВыборка Генеральная совокупность средняя и ст. отклонение выборки средняя и ст. отклонение генеральной совокупности ст. отклонение среднего Доверительный интервалДоверительный интервалДоверительный интервал, можно понимать как погрешность, задает размах части кривой распределения по обе стороны от выбранной точки, куда могут попадать ответы. Например, выборка в 384 человека для генеральной совокупности более 500 000 человек (например, один из районов города) означают доверительную вероятность 95% и доверительный интервал ±5%. То есть при проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного. Доверительная вероятностьпоказывает, с какой вероятностью случайный ответ попадет в доверительный интервал. Для простоты можно понимать её как точность выборки. Как правило, используется 95%, но при низких бюджетах ее можно уменьшить до 90% или 85%.Это приведет к снижению точности, что нужно учесть в выводах. Расчет выборки -2Если мы знаем размер генеральной совокупности: 1) n – объем выборки;2) N - размер генеральной совокупности:3) z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности;4) р – найденная вариация для выборки;q = (100 – p);5) ∆ – допустимая ошибка – 5%. |