Примеры задач. Примеры решения задач. 1. Генеральная совокупность и выборка. Статистический ряд. Статистическая функция распределения. Гистограмма
Скачать 0.96 Mb.
|
Пример13.Используя критерий Пирсона при уровне значимости 0,05, установить, случайно или значимо расхождение между эмпирическими и теоретическими частотами, которые вычислены, исходя из предположения о нормальном распределении признака Х генеральной совокупности: э i m 14 18 32 70 20 36 10 т i m 10 24 34 80 18 22 12 Решение: Выдвигаем нулевую гипотезу Н 0 и ей конкурирующую Н 1 Н 0 : признак Х имеет нормальный закон распределения. Н 1 : признак Х имеет закон распределения, отличный от нормального. В данном случае рассматривается правосторонняя критическая область. Проверим гипотезу с помощью случайной величины s i i i i m m m 1 т 2 т э 2 ) ( , ко- торая имеет распределение 2 с k = s – 3 = 7 – 3 = 4 степенями свободы. Вы- числим наблюдаемое значение критерия 2 по выборочным данным. Расче- ты представим в таблице: э i m i m 2 э ) ( i i i m m m 14 18 32 70 20 36 10 10 24 34 80 18 22 12 1,6 1,5 0,118 1,25 0,222 8,909 0,333 Итого 200 200 13,932 . 2 набл„ 13,93; 2 крит (0,05; 4) = 9,5 Так как 2 набл„ 2 крит (0,05; 4), то нулевая гипотеза отвергается, спра- ведлива конкурирующая гипотеза, то есть признак Х имеет закон распреде- ления, отличный от нормального, расхождение между эмпирическими и тео- ретическими частотами значимо. Пример 14. При уровне значимости 0,05 проверить гипотезу о нор- мальном распределении генеральной совокупности, если известны эмпири- ческие и теоретические частоты Эмпирические частоты 6 13 38 74 106 85 30 14 Теоретические частоты 3 14 42 82 99 76 37 13 Рассчитаем 2 набл = 7,19, число степеней свободы определим по соотноше- нию k =s –3 = 5 (в нашем случае s = 8). Используя рассчитанные значения 2 набл и k, по таблице критических точек распределения хи-квадрат при уровне значимости 05 , 0 находим 1 11 ) 5 ; 05 , 0 ( 2 крит . Так как 2 2 кр набл , то нет оснований отвергать нулевую гипотезу. Данные наблюде- ний согласуются с гипотезой о нормальном распределении генеральной со- вокупности. Пример 15 .Дано возрастное распределение 100 сотрудников (лет): x i–1 –x i 22–24 24–26 26–28 28–30 30–32 32–34 i m 2 12 34 40 10 2 Установить закон распределения признака Х – возраста сотрудни- ков(лет). Решение:Признак Х – возраст сотрудников (лет) – непрерывный. Рас- пределение задано интервальным рядом. Характеристики такого ряда нахо- дят по тем же формулам, что и для дискретного ряда, если предварительно заменить интервальный ряд дискретным. Для этого каждый интервал x i–1 –x i заменяется его серединой i x . Расчеты представим в таблице: Возраст(Х, лет): x i–1 –x i Число струдников (m i ) i x i x m i i i m x x 2 в ( i x ) 2 m i 22–24 24–26 26–28 28–30 30–32 32–34 2 12 34 40 10 2 23 25 27 29 31 33 46 300 918 1160 310 66 50 108 34 40 90 50 1058 7500 24786 33640 9610 2178 Итого 100 - 2800 372 78772 . 100 2800 1 1 в k i i i m x n x 28 лет– средний возраст сотрудников. 72 , 3 100 372 ) ( 1 1 2 в в k i i i m x x n D 72 3 в в , D σ 1,93 Выдвигаем нулевую и конкурирующую гипотезы. Н 0 : признак Х имеет нормальный закон распределения. Н 1 : признак Х имеет закон распределения, отличный от нормального. Для проверки гипотезы сделана выборка объемом n = 100, и по дан- ным выборки найдены выборочные характеристики: x в = 28 лет, в = 1,93 года (рассчитаны выше). Гипотеза проверяется с помощью случайной вели- чины s i i i i m m m 1 т 2 т э 2 ) ( , которая имеет распределение 2 с k = s – 3 = 6 – 3 = 3 степенями свободы. Предварительно рассчитаем теорети- ческие частоты по формуле: в в в в 1 T x x Ф x x Ф n m i i i , так как ряд интервальный. Расчеты представим в таблице: x i+1 в в 1 x x i в в 1 x x Ф i x i в в x x i в в x x Ф i m i т 24 26 28 30 32 34 –2,07 –1,040 1,04 2,07 3,11 –0,4807 –0,3508 0 0,3508 0,4807 0,49901 22 24 26 28 30 32 –3,11 –2,07 –1,04 0 1,04 2,07 –0,49901 –0,4807 –0,3508 0 0,3508 0,4807 1,83 2 12,99 13 35,08 35 35,08 35 12,99 13 1,83 2 Итого - - - - - 99,8 100. Рассчитаем наблюдаемое значение критерия, расчеты запишем в таб- лице: m i э m i т т 2 т э ) ( i i i m m m 2 12 34 40 10 2 2 13 35 35 13 2 0 0,08 0,03 0,71 0,69 0 Итого 100 100 1,51 . Итак, 2 набл„ = 1,51; 2 крит (0,01; 3) = 11,3. Так как 2 набл„ 2 крит (0,01; 3), то нет оснований отвергать нулевую ги- потезу, по данным наблюдения она справедлива, признак Х имеет нормаль- ный закон распределения. Расхождение между эмпирическими и теоретиче- скими частотами случайное. Итак, признак Х – возраст сотрудников, имеет нормальный закон рас- пределения (по данным выборки). Пример 16. В таблице дано распределение дохода от реализации не- которого товара: Требуется: 1) выдвинуть гипотезу о виде закона распределения; 2) проверить гипотезу с помощью критерия Пирсона при заданном уровне зна- чимости α = 0,05. За значения параметров a и σ принять среднюю выбороч- ную и выборочное среднее квадратичное отклонение, вычисленные по эмпи- рическим данным. 10 14 18 22 26 30 6 11 25 13 4 1 Расчетная таблица: № x i n i x i n i x i - x (x i - x ) 2 (x i - x ) 2 n i 1 10 6 60 -8,067 65,071 390,4 2 14 11 154 -4,067 16,538 181,9 3 18 25 450 -0,067 0,004 0,1 4 22 13 286 3,933 15,471 201,1 5 26 4 104 7,933 62,938 251,8 6 30 1 30 11,933 142,404 142,4 Сумма 60 1084 1167,7 Выборочное среднее x = n n x i i = 1084 / 60 = 18,067 Выборочное среднее квадратическое отклонение s = n n x x i i 2 ) ( = 60 7 , 1167 = 4,412 Выдвигаем гипотезу о нормальном распределении. 2) Расчетная таблица для применения критерия Пирсона: (φ (u i ) нахо- дим по таблице приложения) i x i Час- тоты n i s x x u i i φ (u i ) = 2 2 2 1 i u e Теор. часто- ты i i u s nh n i i n n 2 ) ( i i n n i i i n n n 2 ) ( 1 10 6 -1,829 0,0750 4,1 1,9 3,7 0,9 2 14 11 -0,922 0,2609 14,2 -3,2 10,2 0,7 3 18 25 -0,015 0,3989 21,7 3,3 10,9 0,5 4 22 13 0,892 0,2681 14,6 -1,6 2,5 0,2 5 26 4 1,798 0,0792 4,3 -0,3 0,1 0,0 6 30 1 2,705 0,0103 0,6 0,4 0,2 0,3 Σ 60 59,4 2,7 Наблюдаемое значение 2 набл = i i i n n n 2 ) ( = 2,7 Критическое значение (из таблиц при уровне значимости α = 0,05 и числе степеней свободы k = 6 – 3 = 3) 2 крит = 7,8 Так как 2 набл < 2 крит , гипотезу о нормальном распределении принимаем Корреляционно-регрессионный анализ Две или несколько случайных величин могут быть связаны либо функцио- нальной, либо статистической (стохастической) зависимостью. В экономике строгая функциональная зависимость реализуется редко, так как экономические показатели подвержены действию случайных, часто неконтролируемых факторов. Например,ясно, чторыночная цена квартиры сильно зависит от полезной площади, однако эта зависимость не выражается функционально. Чаще имеет место так называемая статистическая (корре- ляционная) зависимость, когда при изменении одной из величин может из- меняться среднее значение другой. Целью корреляционного анализа является оценка тесноты связи ме- жду признаками. Для этого находится выборочный линейный коэффициент корреляции по формуле , в y x y x xy r где x , y , xy – выборочные средние; y x , – выборочные средние квадратические отклонения. ) ( 1 , ) ( 1 , 1 , 1 , 1 1 2 2 2 1 2 2 2 1 1 1 n i i y n i i x n i i i n i i n i i y y n x x n y x n xy y n y x n x Так как коэффициент корреляции в r рассчитывается по выборочным данным и является оценкой генерального коэффициента корреляции r ген , то необходимо проверить значимость в r . С этой целью выдвигаются нулевая и конкурирующая гипотезы: Н 0 : r ген = 0, Н 1 : r ген 0. Нулевая гипотеза проверяется при заданном уровне значимости с помощью случайной величины T , имеющей распределение Стьюдентас k = n – 2 степенями свободы: 2 в в 1 2 r n r T По выборочным данным рассчитывают Т набл , а по таблице критических точек распределения Стьюдента (приложение 2) находим t крит.дв ( , k) с учетом двусторонней критической области. Сравниваем Т набл и t крит.дв ( , k). Ес- ли Т набл t крит.дв ( , k), то есть наблюдаемое значение критерия попало в об- ласть принятия гипотезы, то нет оснований отвергать нулевую гипотезу, по данным наблюдения r ген = 0, выборочный линейный коэффициент корреля- ции r в незначим, признаки Х и Y некоррелированны. А если Т набл попало в критическую область, то есть Т набл t крит.дв ( , k), то нулевую гипотезу от- вергаем, справедлива конкурирующая, то есть r ген 0, выборочный линейный коэффициент корреляции r в значим, признаки Х и Y коррелированны. С помощью r в анализируем тесноту взаимосвязи между признаками X и Y. Чем ближе r в к единице, тем теснее связь между признаками, чем ближе r в к нулю, тем связьслабее. Понятие о регрессионном анализе Регрессионный анализ устанавливает формы зависимости между случайной величиной Y (зависимой переменной) и значениями одной или не- скольких переменных величин X (независимыми переменными). При рассмотрении взаимосвязей, как правило, рассматривают одну из величин (X) как независимую (объясняющую), а другую (Y) как зависимую (объясняемую). При этом изменение первой из них может служить причиной изменения другой. Например, рост дохода ведет к увеличению потребления; рост цены – к снижению спроса; снижение процентной ставки увеличивает инвестиции и т.д. Цель регрессионного метода – отыскание параметров функциональной зависимости, наиболее точно описывающей поведение среднего значения ко- личественного признака Y при изменении значения другого количественного признака X (или нескольких признаков). Чаще всего в качестве уравнения та- кой зависимости выбирают прямую b ax y x Оптимальные значения коэффициентов a и b должны быть каким-то способом подобраны. В методе наименьших квадратов критерием оптимизации служит условие min ) ( ) , ( 1 2 n i i i b ax y b a S Найденные из этого условия значения коэффициентов a и b обеспечивают минимальные отличия значений функции b ax x y i i x ) ( от наблюдаемых ординат y i : 2 2 2 * 2 2 * ) ( , ) ( x x xy x x y b x x y x xy a Уравнение прямой, в котором значения коэффициентов * a a и * b b вычислены по статистическим данным методом наименьших квадратов, на- зывается выборочным уравнением линейной регрессии Y по X. Угловой ко- эффициент a * называется выборочным коэффициентом регрессии . Сравнивая формулы для выборочных коэффициентов корреляции xy r и регрессии * a , нетрудно убедиться, что xy x y x r y x xy a 2 * Уравнение регрессии можно представить в виде ) ( x x r y y xy x y x Пример 17. По выборке объѐма n = 10 парных значений двух признаков найден выборочный коэффициент корреляции 4 0 xy r . Проверим гипотезу 0 ) , ( : 0 Y X r H при уровне значимости = 0.05. Найдѐм наблюдаемое значение критерия: 23 1 16 0 1 8 4 0 r T По таблице критических точек распределения Стьюдента находим 31 2 ) 8 , 05 0 ( 2 cr t . Поскольку cr r t T 2 , нет оснований отклонить нулевую гипотезу. Выборочный коэффициент корреляции незначим. Между признаками нет линейной корреляции. Пример 18. Дана таблица i 1 2 3 4 5 6 7 8 9 X 0,25 0,37 0,44 0,55 0,60 0,62 0,68 0,70 0,73 Y 2,57 2,31 2,12 1,92 1,75 1,71 1,60 1,51 1,50 i 10 11 12 13 14 15 16 17 X 0,75 0,82 0,84 0,87 0,88 0,90 0,95 1,00 Y 1,41 1,33 1,31 1,25 1,20 1,19 1,15 1,00 Определить коэффициент корреляции r xy и уравнения линий регресии. Решение. Составим расчетную таблицу: i Х Y X 2 Y 2 XY 1 0,25 2,57 0,0625 6,6049 0,6425 2 0,37 2,31 0,1369 5,3361 0,8547 3 0,44 2,12 0,1936 4,4944 0,9328 4 0,55 1,92 0,3025 3,6864 1,0560 5 0,60 1,75 0,3600 3,0625 1,0500 6 0,62 1,71 0,3844 2,9241 1,0602 Окончание таблицы i Х Y X 2 Y 2 XY 7 0,68 1,60 0,4624 2,5600 1,0880 8 0,70 1,51 0,4900 2,2801 1,0570 9 0,73 1,50 0,5329 2,2500 1,0950 10 0,75 1,41 0,5625 1,9881 1,0575 11 0,82 1,33 0,6724 1,7689 1,0906 12 0,84 1,31 0,7056 1,7161 1,1004 13 0,87 1,25 0,7569 1,5625 1,0875 14 0,88 1,20 0,7744 1,4400 1,0560 15 0,90 1,19 0,8100 1,4161 1,0710 16 0,95 1,15 0,9025 1,3225 1,0925 17 1,00 1,00 1,0000 1,0000 1,0000 11,95 26,83 9,1095 45,4127 17,3917 Из таблицы получаем: 17 1 11,95, i i x 17 1 26,83, i i y 17 2 1 9,1095, i i x 17 2 1 45, 4127, i i y 17 1 17,3917. i i i x y Теперь находим 11,95/17 0,7029, x 26,83/17 1,5782; y 2 2 9,1095/17 (0,7029) 0,0418, x 0, 2042; x 2 2 45, 4127 /17 (1,5782) 0,1806, y 0, 4250; y 17,3917 /17 0,7029 1,5782 0,0863; xy C ( 0,0863) /(0, 2042 0, 4250) 0,9943. xy r Уравнения линий регрессии: ( ), y x xy x y y r x x т.е. 0,9943 0, 4250 1,5782 ( 0,7029); 0, 2042 x y x 2,0695 3,0329; x y x ( ), x x xy y x x r y y т.е. 0,9943 0, 2042 0,7029 ( 1,5782); 0, 4250 y x y 0, 4776 1, 4566. y x y |