|
Статистика учебник. Тарновская ли. Статистика учебное пособие
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Производим такой расчет теоретических частот для двух предшествующих интервалов, в которых фактические частоты равны нулю, и получаем для интервалов 296–301 и 301–306 теоретические частоты 2 и 6. Для наглядности строим график, на который наносим фактическое распределение в виде гистограммы и нормальную кривую (рис. 6.6). Рис. 6.6. Фактическое распределение и нормальная кривая На графике видна близость фактических частот распределения к теоретическим. Однако такое сопоставление соответствия эмпирического распределения нормальному позволяет оценивать эти расхождения только субъективно. Объективная характеристика соответствия может быть получена с помощью приемов. К элементарным приемам определения нормальности распределения относятся 1. Сравнение по абсолютной величине отношений если 3 σ > As As K или к к > Е Е , то нормальность распределения подвергается сомнению. 2. Сравнение средней арифметической с модой и медианой. Для нормального распределения Me. Mo = = x 3. Использование теоретического соотношения для центральных моментов нормального распределения 1) (2 2 2 2 2 M M i M i i + = + 4. Вычисление специальных критериев согласия. Объективная характеристика соответствия эмпирического распределения нормальному может быть получена с помощью особых статистических показателей – критериев согласия. Известны критерии согласия К. Пирсона ( 2 χ ), В. И. Романовского ) ( C , АН. Колмогорова ) ( λ и Б. С. Яст- ремского ) ( L . Критерий согласия Пирсона
( 2 χ ) вычисляется по формуле
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ∑ − = χ , ) ( Т 2 Т э 2 f f f (6.8) где э эмпирические и теоретические частоты соответственно. С помощью величины 2 χ по специальным таблицам определяется вероятность т. Входами в таблицу являются значения 2 χ и число степеней свободы k = n – На основе вероятности выносится суждение о существенности или несущественности расхождения между эмпирическими теоретическим распределениями. При Р > 0,5 считается, что теоретическое и эмпирическое распределения близки, при Р 0,5] совпадение между ними удовлетворительное, в остальных случаях – недостаточное. Критерий Романовского (C) , также используемый для проверки близости эмпирического и теоретического распределений, определяется следующим образом k k C 2 2 − χ = , (где 2 χ – критерий Пирсона; k – число степеней свободы, которое равно числу групп минус три. При С < 3 различие несущественно, что позволяет считать эмпирическое распределение близким к нормальному. Критерий Ястремского (L) может быть найден на основе следующего соотношения ( ) , 4 к к э 2 T Q Npq f f L + − ∑ − = (6.10) где N – объем совокупности pq – дисперсия альтернативного признака к – число вариантов или групп Q – принимает значение 0,6 при числе вариантов или групп от 8 до 20. Если L > 3, то эмпирическое распределение соответствует теоретиче- скому. Критерий Колмогорова ( λ) вычисляется по формуле Д, (6.11) где Д – максимальное значение разности между накопленными эмпирическими и теоретическими частотами ∑ f – сумма эмпирических частот. Необходимым условием использования этого критерия является достаточно большое число наблюдений (не меньше ста) [1, 3, 4, 7–10].
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Тесты Тестовые задания включают 10 теоретических утверждений, для каждого из которых предлагается четыре варианта ответа (правильными могут быть один или два. Выбери правильный вариант ответа. 1. Средний размер реализованной коммерческой организацией спортивной обуви равен 39, мода – 39, медиана – 39. На основании этого можно сделать вывод, что распределение проданной спортивной обуви по размеру асимметричное б) приближенно симметричное с) с левосторонней асимметрией гс правосторонней асимметрией. 2. Статистическая совокупность из 245 единиц разделена на 16 групп. Число степеней свободы для критерия 2 χ : а) 244; б) 242; в) 16; г) 15. 3. Критерий Колмогорова может быть рассчитан на основании а) индивидуальных данных б) частот в) частостей; г) вариант. 4. Теоретическая кривая распределения – это а) средний квадрат отклонений б) значения признака, делящие совокупность на равные части в) кривая, выражающая закономерность распределения, исключающая влияние случайных факторов г) закономерности изменения частот в вариационных рядах. 5. Для ассиметричных распределений коэффициент эксцесса (Е к ) > 0 показывает а) островершинное распределение б) плосковершинное распределение в) нормальное распределение г) левостороннее распределение. 6. Критерий согласия Пирсона вычисляется по формуле а) 2 2 2 1 t t e y − ⋅ π = ;
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. б) ∑ − = χ Т 2 Т э 2 ) ( f f f ; в) σ Me − = x K As ; г) 3. σ 4 4 к − = M Е 7. К элементарным приемам определения нормальности распределения относятся а) равенство Mo=Me x = ; б) 3 σ As As K > ; в) 4 4 ( ) i x x M n − ∑ = ; г) 3. σ 4 4 к − = M Е 8. Свойства кривой нормального распределения а) функция имеет максимум при t = 0; б) случайная величина представляет сумму двух независимых случайных величин, следующих нормальному закону, то она не следует закону нормального распределения в) функция нормального распределения нечетная г) функция придает точки перегиба. 9. Различают следующие разновидности кривых распределения а) умеренно асимметричные б) многовершинные; в) функциональные г) степенные. 10. Оценка асимметрии производится на основе а) коэффициента вариации б) коэффициента асимметрии в) критерия Пирсона; г) коэффициента корреляции.
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ГЛАВА 7. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ 7.1. Способы формирования выборочной совокупности Под выборочным наблюдениемпонимается такое несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные специальным способом. Выборочное наблюдение ставит перед собой задачу по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правили принципов проведения статистического наблюдения и научно организованной работы по отбору единиц. При этом методе обследованию подвергаются не все объекты совокупности. Совокупность единиц, из которой производится отбор, называется генеральной совокупностью, а специальным образом отобранная часть из генеральной совокупности называется выборочной совокупностью, она отражает все свойства генеральной. Основные характеристики параметров генеральной и выборочной совокупности приведены в табл. 7.1. Таблица 7.1 № п/п Характеристики Генеральная совокупность Выборочная совокупность 1 Объем совокупности численность единиц) N n 2 Численность единиц, обладающих обследуемым признаком М m 3 Доля единиц, обладающих обследуемым признаком = M/N W = m/n 4 Средний размер признака Дисперсия количественного признака 2 2 ( ) σ ixxxN∑ − = nxxix2 2 ) ( σ − ∑ = 6 Дисперсия доли Как правило, выборочные характеристики отклоняются от характеристик генеральной совокупности, те. обычно имеют место ошибки репрезентативности, разность между средними и относительными показателями вы Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 сборочной и генеральной совокупностей. Основная задача выборочного метода сводится к минимизации ошибок репрезентативности. Главными условиями выборки являются 1 . Равновозможность каждой единицы генеральной совокупности попасть в выборку. Если из совокупности, состоящей из N единиц, обладающих некоторыми признаками, отбирается одна единица и при этом никакой из единиц, составляющих данную совокупность, не отдается предпочтение по сравнению с другими, то говорят, что каждой единице обеспечена равная возможность быть отобранной принцип равновозможности). О равновозможности отбора можно судить, либо исходя из общих свойств изучаемых явлений, либо по числу появлений событий в достаточно большой серии испытаний. В случае соблюдения принципа равновозможности выбор вполне определенной конкретной единицы имеет один шанс (случай) из числа N таких же шансов. Выбор же единицы, обладающей данным значением признака (например первосортные детали, число которых во всей совокупности М, имеет М равновозможных шансов из N таких же шансов. 2. Достаточная численность выборкиДля обеспечения равновозможности единиц генеральной совокупности попасть в выборку применяются следующие виды, методы и способы отбора. По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности, при групповом отборе – группы единица комбинированный отбор предполагает сочетание группового и индивидуального отбора. Отбор единиц из совокупности, при котором каждая отобранная и обследованная единица возвращается в генеральную совокупность и может быть повторно отобрана, называется повторным методом. Если же после отбора обследованная единица не возвращается в совокупность ив дальнейших испытаниях не участвует, то отбор называют бесповторным методомСпособ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие выборки 1) собственно-случайная выборка 2) механическая выборка 3) типическая выборка 4) серийная выборка 5) комбинированная выборка. Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. 7.2. Ошибки выборки Расхождения между величиной какого-либо показателя, найденного посредством статистического наблюдения, и действительными его размерами называются ошибками наблюдения. В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности. Ошибки регистрации возникают в результате неправильного установления фактов или ошибочной записи в процессе наблюдения или опроса. Они бывают случайными или систематическими. Случайные ошибки регистрации могут быть допущены как опрашиваемыми в их ответах, таки регистраторами. Систематические ошибки могут быть и преднамеренными, и непреднамеренными. Преднамеренные – сознательные, тенденциозные искажения действительного положения дела. Непреднамеренные вызываются различными случайными причинами (небрежность, невнимательность. Ошибки репрезентативности (представительности) возникают в результате неполного обследования ив случае, если обследуемая совокупность недостаточно полно воспроизводит генеральную совокупность. Они могут быть случайными и систематическими. Случайные ошибки репрезентативности это отклонения, возникающие при несплошном наблюдении из-за того, что совокупность отобранных единиц наблюдения (выборка) неполно воспроизводит всю совокупность в целом. Систематические ошибки репрезентативности – это отклонения, возникающие вследствие нарушения принципов случайного отбора единиц. Ошибки репрезентативности органически присущи выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Избежать ошибок репрезентативности нельзя, однако, пользуясь методами теории вероятностей, основанными на использовании предельных теорем закона больших чисел, эти ошибки можно свести к минимальным значениям, границы которых устанавливаются с достаточно большой точностью. Ошибки выборки – разность между характеристиками выборочной и генеральной совокупности. Для среднего значения ошибка будет определяться по формуле где Величина x Δ называется предельной ошибкой выборки. Предельная ошибка выборки – величина случайная. Исследованию закономерностей случайных ошибок выборки посвящены предельные тео-
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ремы закона больших чисел. Наиболее полно эти закономерности раскрыты в теоремах ПЛ. Чебышева и А. М. Ляпунова. Теорему ПЛ. Чебышеваприменительно к рассматриваемому методу можно сформулировать следующим образом при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице те. почти с достоверностью, утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым. В теореме ПЛ. Чебышева доказано, что величина ошибки не должна превышать μ t . В свою очередь, величина μ , выражающая среднее квадратическое отклонение выборочной средней от генеральной средней, зависит от колеблемости признака в генеральной совокупности σ и числа отобранных единиц n. Эта зависимость выражается формулой nσ μ = , (7.2) где μ зависит также от способа производства выборки. Величину μ называют средней ошибкой выборки .В этом выражении генеральная дисперсия, n – объем выборочной совокупности. Рассмотрим, как влияет на величину средней ошибки число отбираемых единиц n. Логически нетрудно убедиться, что при отборе большого числа единиц расхождения между средними будут меньше, те. существует обратная связь между средней ошибкой выборки и числом отобранных единиц. При этом здесь образуется непросто обратная математическая зависимость, а такая зависимость, которая показывает, что квадрат расхождения между средними обратно пропорционален числу отобранных единиц. Увеличение колеблемости признака влечет за собой увеличение среднего квадратического отклонения, а следовательно и ошибки. Если предположить, что все единицы будут иметь одинаковую величину признака, то среднее квадратическое отклонение станет равно нулю и ошибка выборки также исчезнет. Тогда нет необходимости применять выборку. Однако следует иметь ввиду, что величина колеблемости признака в генеральной совокупности неизвестна, поскольку неизвестны размеры единиц в ней. Можно рассчитать лишь колеблемость признака в выборочной совокупности. Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой 1 σ σ 2 2 − ⋅ = nnxx Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. Поскольку величина 1 − n n при достаточно больших n близка к единице, можно приближенно считать, что выборочная дисперсия равна генеральной дисперсии, те. . σ σ 2 выб 2 ген ≈ Следовательно, средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Однако о величине этой ошибки можно судить с определенной вероятностью. На величину вероятности указывает множитель .t Теорема А. М. Ляпунова. А. М. Ляпунов доказал, что распределение выборочных средних (следовательно, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией. Математически теорему Ляпунова можно записать так Ф (7.3) где 3,14 π ; σ Δ 2
= = n t x , (7.4) где 3,14 π = – математическая постоянная x Δ – предельная ошибка выборки, которая дает возможность выяснить, в каких пределах находится величина генеральной средней. Значения этого интеграла для различных значений коэффициента доверия вычислены и приводятся в специальных математических таблицах. В частности, при Ф Ф Ф Ф Ф 0,683; ) Ф( 1 = = = = = = = = = = = = t t t t t t t t t t t t Поскольку t указывает на вероятность расхождения x x −
, те. на вероятность того, на какую величину генеральная средняя будет отличаться от выборочной средней, то это может быть прочитано такс вероятностью 0,683 можно утверждать, что разность между выборочной и генеральной средними не превышает одной величины средней ошибки выборки. Другими словами, в 68,3 % случаев ошибка репрезентативности не выйдет за пределы μ. ± С вероятностью 0,954 можно утверждать, что ошибка репрезентативности не превышает 2μ ± (те. в 95 % случаев. С вероятностью 0,997, те. довольно близкой к единице, можно ожидать, что разность ме-
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. жду выборочной и генеральной средней не превзойдет трехкратной средней ошибки выборки и т. д. Логически связь здесь выглядит довольно ясно чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине. Зная выборочную среднюю величину признака )
( x и предельную ошибку выборки ) (Δ x , можно определить границы (пределы, в которых заключена генеральная средняя или)
|
|
|