Примеры задач. Примеры решения задач. 1. Генеральная совокупность и выборка. Статистический ряд. Статистическая функция распределения. Гистограмма
Скачать 0.96 Mb.
|
1. Генеральная совокупность и выборка. Статистический ряд. Статистическая функция распределения. Гистограмма В математической статистике изучение случайной величины связано с выполнением ряда независимых опытов, в которых она принимает опреде- ленные значения. Полученные значения случайной величины представляют собой статистическую совокупность или статистический ряд, подлежа- щий осмыслению, обработке и научному анализу. Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали. Выборочной совокупностью, или просто выборкой, называют совокуп- ность случайно отобранных объектов. Генеральной совокупностью называют совокупность объектов, из кото- рой производится выборка. Объемом совокупности (генеральной или выбо- рочной) называют число объектов этой совокупности. Например, если из 100 000 деталей отобрано для исследования 100 деталей, то объем генеральной совокупности N = 100 000, а объем выборочной совокупности n=100. Для то- го чтобы выборка правильно представляла пропорции генеральной совокуп- ности она должна быть репрезентативной. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществ- лять случайно: каждый объект выборки отобран случайно из генеральной со- вокупности, иначе, все объекты имеют одинаковую вероятность попасть в выборку. Выборка может быть бесповторной, если отобранные объекты не возвращаются в генеральную совокупность. Выборка называется повторной, если отобранный объект (перед отбором следующего) возвращается в гене- ральную совокупность. Пусть из генеральной совокупности извлечена выборка, причем x 1 на- блюдалось n 1 раз, x n 2 2 раз и т.д. x n k k раз и k i n n 1 - объем выборки. Наблюдаемые значения i x называются вариантами; последователь- ность вариант, записанных, в порядке возрастания называют вариационным рядом. Числа наблюдений x i обозначены n i и называются частотами, а вели- чины n n W i i / - относительными частотами. Статистическим распределе- нием выборки называется перечень вариант x i и соответствующих частот n i (или относительных частот W i ): Х 1 x 2 x … k x n x 1 n 2 n … k n W x 1 W 2 W … k W В случае большого количества вариант и непрерывного распределения признака статистическое распределение выборки задают в виде последова- тельности интервалов и соответствующих им частот. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на оп- ределенное число частичных интервалов (x 0 ,x 1 ), (x 1 ,x 2 ), …,(x k-1 ,x k ) длиной х i и находят для каждого интервала n i – сумму частот вариант, попавших в i-й интервал. Таким образом получают интервальное статистическое распре- деление выборки: Статистическое распределение выборки называют также статистическим рядом. Для графического изображения статистического ряда используют поли- гоны и гистограммы. Для построения полигона на оси Ох откладывают значения вариант, на оси Оу – значения частот n i (или относительных частот W i ). Построенную таким образом ломаную, отрезки, которой соединяют точки ( x n i i , ) или ( , ) x W i i называют полигоном частот или полигоном относительных час- тот соответственно. В случае непрерывного распределения признака на основании интерваль- ного статического распределения (2) использует гистограмму, устанавли- вающую зависимость частот от разрядов интервалов, в которые попадают значения случайной величины. Предполагаем, что длины интервалов равны x x x h i i i 1 (h – шаг распределения). На оси Ox отметим точки x x x k 1 2 , ,..., , с шагом h друг от друга. На каждом частичном интервале строим прямо- угольник высотой n h i / (плотность частоты). Гистограммой частот назы- вают ступенчатую фигуру, состоящую из вышеупомянутых прямоугольни- ков. Поскольку площадь i-го частичного прямоугольника равна hn h n i i / , то площадь гистограммы частот равна сумме всех частот, т.е. объему вы- борки n. Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а а высоты равны отношению W h i / (плотность относи- тельной частоты). Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят прямо- угольники высотой W h i / . Площадь i-го прямоугольника равна hW h W i i / - относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относитель- ных частот, т.е. единице. Поэтому, гистограмма относительных частот явля- Интервал Х (x 0 ,x 1 ) (x 1 ,x 2 ) … (x k-1 ,x k ) n x n 1 n 2 … n k W x W 1 W 2 … W k Х 1 2 3 4 5 6 7 8 9 10 W 1/25 2/25 3/25 1/25 3/25 5/25 3/25 3/25 2/25 2/25 Контроль: 1 2 3 1 3 5 3 3 2 2 1. 25 25 25 25 25 25 25 25 25 25 Последнюю таблицу можно переписать в виде: Х 1 2 3 4 5 6 7 8 9 10 W 0,04 0,08 0,12 0,04 0,12 0,2 0,12 0,12 0,08 0,08 3) Возьмем на плоскости xOw точки (1; 0,04), (2; 0,08), (3; 0,12) и т.д. По- следовательно соединив эти точки прямолинейными отрезками, получим по- лигон распределения случайной величины Х. W 0,24 0,2 0,16 0,12 0,08 0,04 0 0 1 2 3 4 5 6 7 8 9 10 X Пример 2. В результате испытания случайная величина Х приняла сле- дующие значения: 1 = 16, 2 = 17, 3 = 9, 4 = 13, 5 = 21, 6 = 11, 7 = 7, 8 = 7, 9 = 19, 10 = 8, 11 = 17, 12 = 5, 13 = 20, 14 = 18, 15 = 11, 16 = 4, 17 = 6, 18 = 22, 19 = 21, 20 = 15, 21 = 18, 22 = 23, 23 = 19, 24 = 25, 25 = 1. Требуется: составить таблицу статистического распределения, разбив промежуток (0, 25] на пять участков, имеющих одинаковые длины; постро- ить гистограмму частот и относительных частот. Решение. Предварительно составим таблицу: I (0-5] (5-10] (10-15] (15-20] (20-25] n x 3 5 4 8 5 Построим гистограмму частот и гистограмму относительных частот ста- тистического ряда. Построим статистический ряд относительных частот I 0-5 5-10 10-15 15-20 20-25 W x 0,12 0,2 0,16 0,32 0,2 X n x 5 10 15 20 25 1 2 3 4 5 6 7 8 (а) X W x 5 10 15 20 25 0,04 0,08 0,12 0,16 0,20 0,24 0,28 0,32 (б) Гистограмма частот изображена на рисунке (а) а гистограмма относительных частот – на рисунке (б). Пример 3.Имеется распределение восьмидесяти предприятий по числу занятых на них рабочих: i x 150 250 350 450 550 650 750 i m 1 3 7 30 19 15 5 Построить полигон частот. Решение: Признак Х – число рабочих на предприятиях. В данной зада- че признак Х является дискретным. Поскольку различных значений признака сравнительно немного – k = 7, применять интервальный ряд для представле- ния статистического распределения нецелесообразно, (хотя в прикладной статистике в подобных задачах часто используют именно интер- вальный ряд). Ряд распределения – дискретный. Построим поли- гон распределения частот 0 5 10 15 20 25 30 35 0 100 200 300 400 500 600 700 800 x m Пример 4 .Дано возрастное распределение 100 сотрудников (лет). По- строить гистограмму частот. x i–1 –x i 22–24 24–26 26–28 28–30 30–32 32–34 i m 2 12 34 40 10 2 Решение:. Признак Х – Возраст сотрудника (лет), непрерывный, ряд распределения – интервальный. Построим гистограмму частот, предвари- тельно определив 2 6 22 34 0 ) ( k ) x (x h k (k = 6) и плотность час- тоты h m i : x i–1 –x i 22–24 24–26 26–28 28–30 30–32 32–34 h m i 1 6 17 20 5 1 0 5 10 15 20 24 28 22 26 34 32 30 x m /h Пример 5. Построить эмпирическую функцию распределения по стати- стическому распределению X 11 12 13 14 W x 0,4 0,1 0,3 0,2 Решение. Имеем: 14 2 , 0 3 , 0 1 , 0 4 , 0 14 13 3 , 0 1 , 0 4 , 0 13 12 1 , 0 4 , 0 12 11 4 , 0 11 0 ) ( * x x x x x x F 14 1 14 13 8 , 0 13 12 5 , 0 12 11 4 , 0 11 0 ) ( * x x x x x x F Точечные оценки параметров распределения Оценка для математического ожидания Пусть исследуется случайная величина X с математическим ожиданием x m . Обозначим через x 1 , x 2 , ... , x n значения случайной величины, полученные в результате n независимых равноточных опытов, т.е. измерений, которые проводились в одинаковых условиях. В качестве оценки для x m примем среднее арифметическое наблюдаемых значений, которое принято называть выборочной средней: n i x n x 1 1 Эта оценка является несмещенной и состоятельной. Эффективность оценки выполняется лишь для узкого класса распределений, в частности, для нор- мального распределения ) , ( a N (подробнее см. в разделе «Теоретический материал») Оценка для дисперсии случайной величины В качестве оценки для дисперсии рассмотрим следующую величину: ( ) D n x x x i n 1 2 1 Данную оценку принято называть выборочной дисперсией. Выборочная дисперсия является смещенной оценкой. Однако если умножить величину D x на n n 1 , то мы получим для дисперсии D x оценку, обладающую свойством несмещенности. Эту оценку принято называть «исправленной» выборочной дисперсией и определять формулой: S n n D n X x x i n 2 2 1 1 1 1 ( ) Величину 2 S S называют «исправленным» средним квадратическим от- клонением. Пример 6 . Имеется статистический ряд для случайной величины X. I x 0-2 2-4 4-6 6-8 8-10 n i 3 4 10 5 3 Найти выборочную среднюю, выборочную дисперсию, «исправленную» вы- борочную дисперсию, «исправленное» среднее квадратическое отклонение. Решение. Заметим, что n = 25. i x – середины интервалов. Для удобства вычислений составим таблицу i x n n W i x / i x W i ) ( x x i 2 ) ( x x i i i W x x 2 ) ( 1 0,12 0,12 -4,08 16,65 1,988 3 0,16 0,48 -2,08 4,33 0,693 5 0,40 2,00 -0,08 0,01 0,04 7 0,20 1,40 1,92 3,69 0,738 9 0,12 1,08 3,92 15,37 1,844 x =5,08 303 , 5 B D Значения x и B D получены из таблицы. Имеем k i i i k i i i W x n x n x 1 1 1 k i i i k i i i W x x n x x n D 1 2 в 1 2 в в ) ( ) ( 1 B D n n s 1 2 57 , 2 63 , 6 , 63 , 6 303 , 5 4 5 , 303 , 5 , 08 , 5 2 s s D x B |
Пусть теперь изучается случайная величина X, закон распределения ко- торой неизвестен. Требуется определить закон распределения на основании статистических данных.
Определение. Статистической (эмпирической) функцией распределения
(иначе функцией распределения выборки) называют функцию
F x
*
( )
, опреде- ляющую для каждого значения х относительную частоту события
{
}
X
x
:
F x
n
n
x
*
( )
/
(3) где
n
x
- число наблюдений, при которых значение признака X меньше x; n
- объем выборки.
В отличие от эмпирической функции распределения
F x
*
( )
выборки функция распределения
F x
( )
генеральной совокупности называется теоре-
тической функцией распределения. Различие между эмпирической
F x
*
( )
и теоретической
F x
( )
функциями распределения состоит в том, что
F x
( )
опре- деляет вероятность события
{
}
X
x
, а
F x
*
( )
относительную частоту этого же события. Поэтому
F x
*
( )
можно использовать для приближенного представ- ления теоретической функции распределения генеральной совокупности.
Функция
F x
*
( )
обладает свойствами
F x
( )
:
1) Значения эмпирической функции распределения принадлежат отрезку
[0,1];
2)
F x
*
( )
является неубывающей функцией на промежутке
(
,
)
;
3) если
x
1
- наименьшая варианта, то
F x
*
( )
= 0 при
x
x
1
; если
x
k
- наибольшая варианта, то
F x
*
( )
= 1 при
x
x
k
Решение типовых примеров
Пример 1. В результате испытания случайная величина Х приняла сле- дующие значения:
1
= 2,
2
= 5,
3
= 7,
4
= 1,
5
= 10,
6
= 5,
7
= 9,
8
= 6,
9
= 8,
10
= 6,
11
= 2,
12
= 3,
13
= 7,
14
= 6,
15
= 8,
16
= 3,
17
= 8,
18
= 10,
19
= 6,
20
= 7,
21
= 3,
22
= 9,
23
= 4,
24
= 5,
25
= 6.
Требуется: 1) составить таблицу, устанавливающую зависимость между значениями случайной величины и ее частотами;
2) построить статистическое распределение; 3) изобразить полигон рас- пределения.
Решение. 1) Найдем объем выборки: n = 25. Составим таблицу:
Х 1 2
3 4
5 6
7 8
9 10
n
x
1 2
3 1
3 5
3 3
2 2
2) Статистическое распределение имеет вид: