Главная страница
Навигация по странице:

  • Тип выборки Описание

  • Доверительный интервал

  • Доверительная вероятность

  • Биостатистика. Выборка Методы отбора, расчета и анализа


    Скачать 0.51 Mb.
    НазваниеВыборка Методы отбора, расчета и анализа
    АнкорБиостатистика
    Дата09.08.2019
    Размер0.51 Mb.
    Формат файлаpptx
    Имя файла409839.pptx
    ТипДокументы
    #84952

    Выборка

    Методы отбора, расчета и анализа

    Термины


    Генеральная совокупность
    Выборка
    Доверительный интервал
    Процедуры анализа

    Выборка


    Выборка – часть генеральной совокупности, соответствующая ей по заданным критериям (характеристикам)
    Невероятностный метод построения
            Выборка согласных
            Выборка по усмотрению
            Метод квот
            Метод снежного кома (snowball)

      Вероятностный метод – классификация способов

        Отбор элементов или кластеров
        Все единицы отбора имеют равную вероятность для включения в выборку
        Применяется или нет стратификация
        Простой или систематический случайный отбор
        Отбор через одну или несколько стадий

    Типы выборки


    Тип выборки

    Описание

    Простая случайная

    Лотерейный выбор из генеральной совокупности

    Стратифицированная случайная

    Совокупность делится на страты (сегменты), внутри выборка случайная

    Районированная (кластерная)

    Случайный выбор групп (районов), внутри которого опрашивается каждый

    Многоступенчатая

    Случайно выбранные группы – города – улицы - дома

    Доступная

    Доступные в данное время респонденты

    Квотированная

    Выбираются квоты и опрашиваются респонденты

    Описание выборки


    Исследуемая совокупность …
    Основа выборки
    Способ построения выборки
    Размер выборки
    Процесс построения выборки

    Определение размера выборки


    Произвольный (напр. 5% от совокупности)
    По аналогичным исследованиям
    Стоимость исследования
    Расчетный метод – мин. объем с т.зр. надежности и достоверности
    На основании доверительного интервала

    Выборка или перепись?

    Ошибка выборки – точность выборки

    Определение размера выборки расчетным методом


    где n – объем выборки;
    z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности - а;
    р – найденная вариация для выборки;
    q = (100 – p);
    е – доверительный интервал, в десятичной форме, желаемая погрешность (например, 0,04 = ±4%).


    Значение нормированного отклонения оценки z от среднего значения

    в зависимости от доверительной вероятности (а) полученного результата

    а, %

    60

    70

    80

    90

    90

    95

    97

    99,0

    99,7

    z

    0,84

    1,03

    1,29

    1,44

    1,65

    1,96

    2,18

    2,58

    3,0

    Доверительный интервал


    Невозможно узнать истинное значение среднего генеральной совокупности на основе данных выборки
      Ошибка выборки неизбежна

      Но можно оценить интервал значений, в который с определённой вероятностью входит истинное значение среднего
      Такой интервал называется доверительным интервалом
      Для нахождения доверительного интервала, мы сначала определяем вероятность, с которой мы хотим быть уверены в нашей оценке истинного среднего значения

      как правило мы хотим быть уверены в нашей оценке как минимум на 95% или хотим доверять нашей оценке истинного значения среднего на 95%.

    Вероятность

    Вероятность – это мера возможности появления события (благоприятного исхода)

    p= Число благоприятных исходов

    Общее число исходов

    Распределение вероятностей


    Имеет среднее, дисперсию и стандартное отклонение, которые помечаются следующими буквами:
     (мю) –среднее распределения вероятности
    2 и  (сигма) дисперсия и стандартное отклонение
    Форма распределения – Гауссова кривая (нормальное распределение


    Площадь под кривой равняется 100 % всех наблюдений или вероятности = 1,0

    Частотное распределение и распределение вероятности


    Распределение вероятности (РВ) основано на теории вероятности, а частотное распределение (ЧР) основано на эмпирических (наблюдаемых) данных
    РВ – идеал, ЧР - реальность у РВ форма нормального распределения, а у ЧР форма приближается к нормальному распределению наблюдений

    Как перевести любое значение переменной в стандартную оценку (z-score)?

     = среднее

     = стандартное отклонение

    z = стандартная оценка

    Стандартная оценка говорит нам, на сколько стандартных отклонений выше или ниже данное значение переменной от среднего значения

    Используя эту информацию можно рассчитать вероятность того, что переменная принимает значения выше или ниже заданного (заданных) показателей

    Стандартное отклонение среднего


    Выборка

    Генеральная совокупность

    средняя и ст. отклонение выборки

    средняя и ст. отклонение генеральной совокупности

    ст. отклонение среднего

    Доверительный интервал

    Доверительный интервал


    Доверительный интервал, можно понимать как погрешность, задает размах части кривой распределения по обе стороны от выбранной точки, куда могут попадать ответы.
    Например, выборка в 384 человека для генеральной совокупности более 500 000 человек (например, один из районов города) означают доверительную вероятность 95% и доверительный интервал ±5%. То есть при проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного.

    Доверительная вероятность


    показывает, с какой вероятностью случайный ответ попадет в доверительный интервал. Для простоты можно понимать её как точность выборки. Как правило, используется 95%, но при низких бюджетах ее можно уменьшить до 90% или 85%.Это приведет к снижению точности, что нужно учесть в выводах.

    Расчет выборки -2


    Если мы знаем размер генеральной совокупности:

    1) n – объем выборки;

    2) N - размер генеральной совокупности:

    3) z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности;

    4) р – найденная вариация для выборки;

    q = (100 – p);

    5) ∆ – допустимая ошибка – 5%.




    написать администратору сайта