Главная страница

Статистика. Введение. Предмет и метод статистической науки История развития статистической науки


Скачать 1.71 Mb.
НазваниеВведение. Предмет и метод статистической науки История развития статистической науки
Дата03.01.2019
Размер1.71 Mb.
Формат файлаdoc
Имя файлаСтатистика.doc
ТипДокументы
#62406
страница4 из 7
1   2   3   4   5   6   7

2. Анализ вариационных рядов

  • 2.1. Показатели вариации


    Вариацией называется изменяемость, колеблемость величины признака. Вариация проявляется в отклонениях от средних и зависит от множества факторов, влияющих на социально-экономическое явление. Вариация бывает случайной и систематической, существует в пространстве и во времени. Показатели вариации делятся на абсолютные и относительные (таблица 2.1).
    Таблица 2.1 - Показатели вариации

    ПоказательФормула расчета показателяпростойвзвешенныйАбсолютныеРазмах (2.1)Среднее

    линейное

    отклонение (2.2)* (2.3)Дисперсияσ2 (2.4) (2.5)Среднее

    квадратическое отклонение (2.6) (2.7)относительныеКоэффициент

    вариации (2.8)Линейный

    коэффициент

    вариации (2.9)Коэффициент

    осцилляции (2.10)* – Здесь fi – частота ().

    Относительные показатели (коэффициент вариации, линейный коэффициент вариации, коэффициент осцилляции) строятся с учетом базы (в виде средней), выражаются в процентах и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации

    . (2.11)

    Для расчета дисперсии можно использовать модифицированную формулу:

    . (2.12)

    Выведем эту формулу из формулы (2.5)



    Для расчета дисперсии можно использовать способ отсчета от условного нуля, который позволяет упростить вычисления при больших значениях признака. Тогда дисперсия вычисляется по формуле:

    , (2.13)

    где h – величина интервала;

    А – условный нуль, в качестве которого можно использовать как середину серединного интервала, так и середину интервала с наибольшей частотой.
    2.1.1. Свойства дисперсии

    1. Дисперсия постоянной величины равна нулю.

    2. Если у всех значений вариантов отнять какое-то постоянное число А, то средний квадрат отклонений (дисперсия) от этого не изменится

    . (2.14)

    Это значит, что дисперсию можно вычислить не по заданным значениям признака, а по их отклонениям от какого-то постоянного числа, например условного нуля (см. формулу 2.13).


    1. Если все значения вариантов разделить на какое-то постоянное число А, то дисперсия уменьшится в А2 раз:

    . (2.15)


    1. Если распределение признака близко к нормальному или симметричному, то по правилу мажорантности (т.к. среднее квадратическое отклонение – средняя геометрическая величина, а среднее линейное отклонение – средняя арифметическая) среднее квадратическое отклонение больше среднего линейного отклонения (), причем

    , . (2.16)
    Размах вариации, среднее линейное и среднее квадратичное отклонение – это именованные величины. Единицей измерения у них и у исходных значений признака совпадают. Дисперсия может быть задана в ед.2 признака или в % отклонений.
    2.1.2 Вариация альтернативного признака
    Альтернативные признаки – два противоположных, взаимоисключающих друг друга качественных признака, которыми одни единицы совокупности обладают (значение варианта 1), а другие не обладают (значение варианта 0) (например, пол – мужской и женский, население – городское и сельское, продукция – годная и бракованная).

    Частостью (p) является доля единиц, обладающих данным признаком, в общей численности совокупности и (q = 1 – p) – доля единиц, не обладающих данным признаком, в общей численности совокупности.

    xifi1p0q = 1 – pСредняя арифметическая альтернативного признака

    . (2.18)

    Дисперсия альтернативного признака

    , (2.19)

    т.е. дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, и доли единиц, не обладающих этим признаком.

    Исходя из того, что p + q= 1:

    ; . (2.20)
    2.2. Виды дисперсий в совокупности, разделенной на части. Правило сложения дисперсий
    Если исходная совокупность является такой, что по значениям признака она делится на l групп, то общая дисперсия складывается из частных дисперсий. В таблице 2.2 представлен анализ такой совокупности.

    Таблица 2.2 - Определение исходной совокупности по группам

    Значение признака хЧисло единиц в j-й группеИтого1…jlх1f11f1jf1l…………………хifi1fijfil…………………хkfk1fkjfklИтогоЗдесь j – номер группы ();

    хii-е значение признака ();

    fij – частота i-го значения признака, число единиц в j-й группе;

    mi – сумма частот i-го значения признака в каждой группе;

    nj – сумма частот всех значений признака в j-й группе;

    N – сумма частот всех значений признака во всех группах (объем совокупности).

    Сначала вычисляем l частных средних (), т.е. среднее значение признака в каждой группе:

    . (2.22)

    На основе частных средних определяем общую среднюю () по формулам

    или . (2.23)
    Общая дисперсия совокупности

    . (2.24)

    Общая дисперсия отражает вариацию признака за счет всех факторов, действующих в данной совокупности.

    Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия, которая исчисляется как средний квадрат отклонений групповой средней от общей средней:

    . (2.25)

    Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, т.е. вариацию между группами за счет признака-фактора, положенного в основу группировки.

    Вариацию внутри каждой группы изучаемой совокупности отражает внутригрупповая дисперсия, которая исчисляется как средний квадрат отклонений значений признака х от частной средней :

    или . (2.26)

    Для всей совокупности внутригрупповую вариацию будет выражать средняя из внутригрупповых дисперсий, которая рассчитывается как средняя арифметическая из внутригрупповых дисперсий:

    . (2.27)

    Внутригрупповаядисперсия отражает случайную вариацию, т.е. часть вариации обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основу группировки.

    Между представленными видами дисперсий существует определенное соотношение, которое известно как правилосложениядисперсий:

    . (2.28)

    Таким образом, общая дисперсия складывается из двух слагаемых: первое – средняя из внутригрупповых дисперсий – измеряет вариацию внутри частей совокупности, второе – межгрупповая дисперсия – вариацию между средними этих частей.

    Правило сложения дисперсий позволяет выявить зависимость результатов от определяющих факторов с помощью соотношения межгрупповой и общей дисперсий. Это соотношение называется эмпирическим коэффициентом детерминации2) и показывает долю вариации результативного признака под влиянием факторного.

    . (2.29)

    Эмпирическое корреляционное отношение (η) показывает тесноту связи между исследуемым явлением и группировочным признаком.

    . (2.30)

    η2 и η [0, 1]. (2.31)

    Если связь отсутствует, то h = 0. В этом случае межгрупповая дисперсия равна нулю (δ2=0), т.е. все групповые средние равны между собой и межгрупповой вариации нет. Это означает, что группировочный признак не влияет на вариацию исследуемого признака х.

    Если связь функциональная, то h = 1. В этом случае дисперсия групповых средних равна общей дисперсии (). Это означает, что группировочный признак полностью определяет характер изменения изучаемого признака.

    Чем больше значение корреляционного отношения приближается к единице, тем полнее (сильнее) корреляционная связь между признаками (таблица 2.3).

    Таблица 2.3 - Качественная оценка связи между признаками (шкала Чэддока)

    Значение Характер связиЗначение Характер связиη = 0Отсутствует0,5 ≤ η < 0,7Заметная0 < η < 0,2Очень слабая0,7 ≤ η < 0,9Сильная0,2 ≤ η < 0,3Слабая0,9 ≤ η < 1Весьма сильная0,3 ≤ η < 0,5Умереннаяη = 1Функциональная

    Пример 2.1.

    Определим групповые дисперсии, среднюю из групповых дисперсий, межгрупповую дисперсию, общую дисперсию по данным о производи­тельности труда в двух бригадах:

    Изготовлено
    деталей за час, шт. (производительность труда)Количество рабочих,
    имеющих соответствующую
    производительность трудав бригаде 1в бригаде 2хifi1fi2101012301431162318122004

    Промежуточные расчеты занесем в таблицы:
    хiБр. 1Бр. 2miマå跿鐱 褪û 蓁…
    ⅰ蒟å湜… 裝湜õ 粢èífi1fi2хi·fi1хi·fi2хi·mi101011001012303360361431442145616235324880181231836542004408080Σn1=10n2=10N=20Σхi·fi1=138Σхi·fi2=178Σхi· mi =316

    хiマå跿鐱 褪û 蓁… ⅰ蒟å湜… 蒻褞é(хi)(хi)(хi)(хi )2·fi1 (хi )2·fi2(хi)2·mi 10-3,8-7,8-5,814,440,0033,6412-1,8-5,8-3,89,720,0043,32140,2-3,8-1,80,1214,4412,96162,2-1,80,29,689,720,20184,20,22,217,640,0814,52206,22,24,20,0019,3670,56Σ–––51,6043,60175,20

    Средняя производительность труда для 1-й бригады:

    = 13,8 шт./ч.

    Средняя производительность труда для 2-й бригады:

    = 17,8 шт./ч.

    Средняя производительность труда для 1-й и 2-й бригады:

    = 15,8 шт./ч.

    Дисперсия 1-й группы (бригады)

    = 5,16Дисперсия 2-й группы (бригады)

    = 4,36Средняя из групповых дисперсий

    = 4,76Межгрупповая дисперсия

    = 4,0Общая дисперсия=8,76Проверка по правилу сложения дисперсий:= 4,76 + 4,00 = 8,76

    Эмпирический коэффициент детерминации:

    = 0,457 = 45,7%.

    Отсюда можно сделать вывод, что общая вариация производительности труда на 45,7% обусловлена вариацией между группами.

    Эмпирическое корреляционное отношение

    = 0,6757.

    Значение h = 0,6757 показывает заметную связь по шкале Чэддока (см. таблицу 2.3) между исследуемым явлением (производительностью труда) и группировочным признаком (бригады).

    3. Моменты распределения Показатели формы распределения

    3.1. Моменты распределения

    Для подробного описания особенностей распределения используют дополнительные характеристики – моменты распределения.

    Момент распределения k-го порядка – средняя величина отклонений k-й степени от некоторой постоянной величины А:

    . (3.1)

    Практически используют моменты первых четырех порядков. Если А = , то моменты центральные; А = 0, то моменты начальные; А – произвольное число, то моменты условные.
    Начальные моментыЦентральные моментыНормированные
    моменты (3.2)

    m0 = 1;

    m1 – средняя арифметическая () (3.3)

    = 1; = 0

    – средний квадрат отклонений, дисперсия (s2) (3.4)

    μ0=1; μ1=0; μ2=1;

    – показатель асимметрии

    3.2. Показатели формы распределения

    Нормированный момент третьего порядка является показателем асимметрии распределения :

    . (3.5)

    Степень существенности асимметрии характеризуется средней квадратической ошибкой, которая зависит от объема наблюдения:

    , (3.6)

    Если , то асимметрия существенна.

    При симметричном распределении варианты, равноудаленные от , имеют одинаковую частоту, поэтому = 0, а следовательно, и μ3=0.

    Если μ3 < 0, то в вариационном ряду преобладают (имеют большую частоту) варианты, которые меньше , т.е. ряд отрицательно ассиметричен (или с левосторонней скошенностью – более длинная ветвь влево). Положительная асимметрия (правосторонняя скошенность – более длинная ветвь вправо) характеризуется значением μ3 > 0 (рис. 2.1). В качестве показателя асимметрии применяется и коэффициент асимметрии Пирсона (As):

    . (3.7)

    Если As= 0, (т.е. ), то распределение симметричное (нормальное).

    ЕслиAs < 0, то имеет место левосторонняя асимметрия.

    ЕслиAs > 0,то имеет место правосторонняя асимметрия.

    Если |As| > 0,25, то асимметрия значительна; если |As| < 0,25 – незначительна.

    Рис. 2.1 Асимметрия распределения

    Нормированный момент четвертого порядка характеризует крутизну (заостренность) графика распределения:

    . (3.8)

    Для нормального распределения μ4 = 3, поэтому для оценки крутизны исследуемого распределения в сравнении с нормальным из μ4 вычитается 3 и таким образом рассчитывается показатель эксцесса:

    . (3.9)

    Если Ex = 0, то распределение симметрично;

    Ex > 0, то распределение островершинное;

    Ex < 0, то распределение плосковершинное (рис. 3.2).
    Рис. 3.2. Эксцесс распределения
    3.3. Теоретические кривые распределения

    タ浯èç 籵璋韶澵顥 蒡â ð裝îà聰褪 糺…粱褊韃 鈞î濵åⅲé 蒟å湜…, ⅰ蒟å湜å è î褊韃 (îó湜å) 淲îé ⅱ褪顆褥îé (粢…ⅲ鵫) û 蒟å湜…. ユ瑩瑕ð 蒟å湜… óå 糂裙î ð粱…褪 ðè 碚üì å 浯硴™蒟湜é è àûõ 竟琿瑾. ツ ©ì 瑯 胙瑶顆褥îå ⅳ髜趺湜å ©ï頏顆褥î胛 籵璋韶澵魲î 萵 ð竟韲瑯ò 粨ä ë珞濵é ð鞣鵫, 韲褊îé ð鞣鵫蒟å湜…. ハ籵… 蒟å湜… î趺ò à鞣瑣ñ… àê 淲à… ⅱ褪顆褥à… (粢…ⅲ) à 蒟å湜…, 鵫粢澵 ⅰ蒟å澵鵫 粽óíⅲ â î渼顥 î粨…õ.

    メ瑕韲 髜鉋ì, 瑙琿韈頏 ⅳû â ©ï頏顆褥îì 蒟å湜è, î跫î ⅰ頌瑣ü 裙î ñ îî™ àà鵫 î蒟è – 鈞î浯 蒟å湜…, 濵粨 î 頌蓖隯 萵澵隯 àåû ⅱ褪顆褥îé ð鞣鵫 è ð魵褞頸ü ð珞齏íⅲ 糺葢竟鵫 肛î鍄 è å 蒟å湜… 萵澵魲î 萵.

    マ 頌裝魵瑙韋 鈞î濵åⅲé 蒟å湜… ⅸ褊ü 籵跫î 糺葢竟ü 粢 肛î銛 î å ð鞣鵫 蒟å湜…, ê àê, 褥è ð鞣 ⅰ頌瑙à ààè (ñ îî™ 珞淲湜…) 粢î, íà 碚åå î ⅳ赳褪 鈞î濵åⅲ 萵澵魲î 蒟å湜… è î趺ò 磊 頌îü鉋籵浯 â 鉈顆燾õ ð瑕頷 褪瑾 è ð魲濵鈞õ. ハå 胛, â ©ì 瑯 î跫î ⅱóè籵 îå淸璋韋 蓁… ð竟…… ð瑕頷 湜é.

    Теоретическое распределение случайной величины – это математическое выражение 渼í琿í鵫 鈞粨îè 鈿璞褊韜 琺濵é 粢è燾  x è 粢…ⅲ 裹 îà萵湜… â ⅳ粢é 竟琿.

    ト î褊 渼è ⅱ褪顆褥î胛 蒟å湜… 淲髜蒻î 鈿瑣ü è s è 髜ⅲ濵籵 粨ä ð鞣鵫 韈 裝褊韜 髜 ©î濵è黑 …粱褊韋 齏è ðⅷ褥. ミ瑰ⅳì üî 濵琿í鮱 蒟å湜å, î鸙êó 韲褊濵 íî 浯鞦鸙裹 î ð韲褊…褪 ðè î褊韋 瑣頌頷 î蒟åé.

    ミ瑰ð裝褄褊韃 непрерывной случайной величины x называют нормальным, если соответствующая ей плотность распределения выражается формулой

    ,

    (3.10)

    или ,

    где x – значение изучаемого признака;

    – средняя арифметическая ряда;

    s2 – дисперсия значений изучаемого признака;

    s – среднее квадратическое отклонение изучаемого признака;

    π = 3,1415926; е = 2,7182;

    – нормированное отклонение.

    Кривая нормального распределения (рис. 3.3) симметрична относительно вертикальной прямой , поэтому среднюю арифметическую ряда называют центром распределения.
    Случайные величины, распределенные по нормальному закону, различаются значениями параметров и s, поэтому важно выяснить, как эти параметры влияют на вид кривой нормального распределения.

    Если не меняется, а изменяется только s, то:

    1. чем меньше s, тем более вытянута кривая (рис. 3.3, а), а так как площадь, ограниченная осью и данной кривой, равна 1, то вытягивание вверх компенсируется сжатием около центра распределения и более быстрым приближением кривой к оси абсцисс;

    2. чем больше s, тем более плоской и растянутой вдоль оси абсцисс становится кривая.

    Если s остается неизменной, а изменяется, то кривые нормального распределения имеют одинаковую ó, 濵 ⅳè™… 蓿 ⅳ 蓿à îî趺湜褌 àñ韲琿í鵫 ⅱ蒻浯 (ñ 3.3, á).
    ホ砒澵ости кривой нормального распределения.

    1. Кривая симметрична и имеет максимум в точке, соответствующей значению .

    2. Кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности. Чем больше отдельные значения x отклоняются от , тем реже они встречаются.

    3. Кривая имеет две точки перегиба на расстоянии ±s от .

    4. Площадь между ординатами, проведенными на расстоянии ±s (заштрихованная область на рис 3.3, б), составляет 0,683. Это означает, что 68,3% всех исследуемых единиц (частот) отклоняется от средней арифметической не более, чем на s, т.е. находится в пределах ±s. В промежутке ±2s находится 95,4%, а в промежутке ±3s соответственно, 99,7% всех единиц исследуемой совокупности.

    5. Коэффициенты асимметрии и эксцесса равны нулю.




    б)

    Рис. 3.3 Кривые нормального распределения

    4. Выборочное наблюдение в статистике

    Наиболее широко распространенным видом несплошного наблюдения является выборочное наблюдение, при котором обследуются не все единицы изучаемой совокупности, а лишь определенным образом отобранная их часть.

    Вся подлежащая изучению совокупность объектов (наблюдений) называется генеральнойсовокупностью. Выборочнойсовокупностьюиливыборкой называется часть генеральной совокупности, отобранная для изучения свойств обеспечивающая репрезентативность.

    Отбор из генеральной совокупности проводится таким образом, чтобы на основе выборки можно было получить достаточно точное представление об основных параметрах совокупности в целом. При этом речь идет как о точечной оценке, в качестве которой принимается соответствующее значение средней, доли и т.д., полученное в результате выборки, так и об интервальной оценке, т.е. о тех пределах, в которых с определенной вероятностью может находиться значение искомого параметра в генеральной совокупности. Главное требование, которому должна отвечать выборочная совокупность, — это требование ее репрезентативности, т.е. представительности.

    В статистике результаты сплошного наблюдения иногда оцениваются как выборочные характеристики. Такая трактовка полученных данных имеет место в тех случаях, когда число обследованных единиц невелико и нет твердой уверенности в том, что изучаемые характеристики не могут принимать иных значений, кроме выявленных в результате наблюдения. При проведении экспериментов число значений может быть бесконечно большим, поэтому, формулируя выводы на основе ограниченного их числа, необходимо рассматривать полученные данные как выборочные характеристики.

    Распространяя результаты выборочного обследования на генеральную совокупность, следует иметь в виду, что между характеристиками генеральной и выборочной совокупности возможно расхождение, обусловленное тем, что обследуется не, вся совокупность, а лишь ее часть.

    Ошибкой статистического наблюдения считается величина отклонения между расчетным и фактическим значениями признаков изучаемых объектов.

    Выборочный метод обеспечивает значительную экономию материальных и финансовых ресурсов при проведении статистического наблюдения, что позволяет расширить программу обследования и повысить его оперативность. Второе преимущество – высокая достоверность получаемых данных, так как при относительно небольшом объеме выборки можно организовать эффективный контроль за качеством собираемой информации. Таким образом, снижается вероятность появления ошибок регистрации и необнаружения их на стадии проверки первичной информации. И наконец, в ряде случаев, когда сплошное наблюдение связано с уничтожением или порчей обследуемых единиц (например, при проверке качества поступающих в продажу продуктов питания), возможно только выборочное обследование.

    Точность оценок, полученных на основе выборочного метода, зависит не от доли обследованных единиц, а от их числа.

    Основные этапы выборочного наблюдения;

    1) определение цели, задач и составление программы наблюдения;

    2) формирование выборки;

    3) сбор данных на основе разработанной программы;

    4) анализ полученных результатов и расчет основных характеристик выборочной совокупности;

    5) расчет ошибки выборки и распространение ее результатов на генеральную совокупность.

    Различают виды выборки:

    1. случайная (собственно-случайная);

    2. механическая (например, каждый 10, 20 и т.д.);

    3. типическая (стратифицированная), когда генеральная совокупность разбита на группы и в каждой группе обследуются по нескольку объектов));

    4. серийная (гнездовая), когда случайным образом отбираются целые серии.

    Наиболее простой способ формирования выборочной совокупности – собственнослучайныйотбор. Теоретические основы выборочного метода, первоначально разработанные применительно к собственно случайному отбору, используют и для определения ошибок выборки при других способах наблюдения.

    Собственно случайный отбор может быть повторным и бесповторным. При повторномотборе каждая единица, отобранная в случайном порядке из генеральной совокупности, после проведения наблюдения возвращается в эту совокупность и может быть вновь подвергнута обследованию. На практике такой способ отбора встречается редко. Гораздо более распространен собственно случайный бесповторныйотбор, при котором обследованные единицы в генеральную совокупность не возвращаются и не могут быть обследованы повторно. При повторном отборе вероятность попадания в выборку для каждой единицы генеральной совокупности остается неизменной. При бесповторном отборе она меняется, но для всех единиц, оставшихся в генеральной совокупности после отбора из нее нескольких единиц, вероятность попадания в выборку одинакова.
    4.1. Закон больших чисел и предельные теоремы

    Под законом больших чисел в широком смысле понимается общий принцип, согласно которому, по формулировке академика Колмогорова, совокупное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая. Или иначе: При большом числе случайных величин их средней результат перестает быть случайным и может быть предсказан с большой степенью определенности.

    Подзакономбольшихчиселвузкомсмыслепонимается ряд математических теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным.
    Неравенство Чебышева: для любой случайной величины, имеющей математическое ожидание M(X) и дисперсию D(X) справедливо:

    , (4.1)

    или

    , (4.2)

    Если формула (6.1) устанавливает верхнюю границу рассматриваемого события, то (4.2) – нижнюю границу вероятности события, состоящего в том, что отклонения значения случайной величины от математического ожидания не превысит (не будет менее) величины, где – достаточно малая величина.

    В приложении к выборочному методу неравенство Чебышева может быть сформулировано так: при неограниченном увеличении числа наблюдений () в генеральной совокупности с ограниченной дисперсией с вероятностью близкой к единице можно ожидать, что отклонение выборочной средней () от генеральной средней будет сколь угодно мало: при . Эту вероятность в теореме А.М. Ляпунова (1901г.) используют для определения ошибки наблюдений.

    , (4.3)

    где - нормированная формула Лапласса.

    – средняя квадратическая или стандартная ошибка выборки.

    . (4.4)

    Пусть надо измерить некоторою величину, истинное значение которой равно a. Пусть результат каждого измерения – случайная величина Xi(i=1,2,…,n). Если при измерениях отсутствует систематические погрешности, то M(Xi)=aпри любом i. Тогда средняя арифметическая результатов и измерений сходится по вероятности к истинному значению a.

    (4.5)

    Дисперсия средней случайной величины Xi равна

    (4.6)

    Среднее квадратическое отклонение ошибок выборки

    , (4.7)

    . (4.8).

    Зная выборочную среднюю и предельную ошибку выборки можно определить границы, в которых размещена генеральная средняя .
    Величина средней квадратической ошибки простой случайной повторной выборки может быть определена по формуле:

    , (4.9)

    т.е. чем больше вариация признака в генеральной совокупности, тем больше ошибка выборки.

    Величину называют предельнойошибкой для определения значения вероятности. Если требуется оценить среднюю генеральной совокупности с вероятностью 0,9545, то надо получить значение выборочной средней из соотношения (функция Лапласа).

    Для выборки объема предельная ошибка может быть определена из соотношения .

    t1,001,962,002,583,00F(t)0,6830,95000,95450,99010,9973

    – это предел возможной ошибки (правило «трех сигм»).
    Формула предельной ошибки выборки используется не только для оценки пределов, в которых находится изучаемый признак в генеральной совокупности, но и для определения необходимого объема выборки при заданной ее ошибке. Третий тип задач, которые могут быть решены с использованием предельной ошибки выборки, – это определение вероятности, с которой можно гарантировать, что ошибка выборки не выйдет за заданные пределы.

    Величина дисперсии генеральной совокупности принципиально не известна и можно говорить лишь о ее оценке по результатам одной выборки.

    –для простой случайной выборки.

    При , поправка становится 3,5% (30/(30-1)), поэтому ею можно пренебречь.

    Выборочное наблюдение
    Наименование показателяВид выборкиповторнаябесповторнаяСлучайная выборка

    Средняя (стандартная) ошибка

    Средняя ошибка доли признака

    Объем выборкиТипическая выборка

    Средняя ошибка

    Объем выборкиСерийная выборка

    Средняя ошибка

    Объем выборки

    Величина ошибки зависит от колеблемости признака в генеральной совокупности и от объема выборки. Т.е. чем больше вариация тем больше ошибка, чем больше выборка, тем меньше ошибка. Величину называют предельной ошибкой выборки. Следовательно, предельная ошибка выборки , т.е. предельная ошибка равна t-кратному числу средних ошибок выборки.

    t – коэффициент доверия

    n – объем выборки;

    N – объем генеральной совокупности;

    s - число отобранных серий;

    S – общее число серий;

    - средняя из групповых дисперсий;

    - межгрупповая дисперсия.

    1. 1   2   3   4   5   6   7


  • написать администратору сайта