Методические указания по выполнению. Учебнометодическое пособие по курсовой работе для студентов и курсантов вторых курсов ( высшая математика ) Химки 2006
Скачать 1.27 Mb.
|
размах выборки - это разность между самым большим и самым малым значениями выборки. Пусть из генеральной совокупности извлечена выборка, причем числовое значение x 1 наблюдалось n 1 раз, x 2 – n 2 раза, … , x r – n r раз. Тогда объем выборки ∑ = = r 1 i i n n (1) Наблюдаемые значения x i выборки называют вариантами, а их последовательность, записанная в возрастающем порядке, - вариационным рядом. Числа n i называют частотами соответствующих вариант, w i = n i /n – относительными частотами. Статистическим распределением выборки называют перечень вариант и соответствующих им частот. Таким образом, статистическое распределение выборки задается в виде двух строк: x 1, x 2 , … , x r (2) n 1 , n 2 , … , n r или в виде таблицы, состоящей из двух строк (столбцов): (3) Замечание. В тех случаях, когда число вариант велико, статистическое распределение выборки можно задать в виде последовательности интервалов ∆ 1 , ∆ 2 , … , ∆ m , обычно, равной длины h. В этом случае в качестве варианты x i *, представляющей интервал ∆ i , назначается среднее из вариант, попавших на интервал, и ей назначается частота n i *, равная сумме частот вариант из интервала. Такой способ представления выборки называют группировочным или интервальным. Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(x), определяющую для каждого значения аргумента x относительную частоту наступления события, состоящего в том, что значение X выборочной варианты будет меньше x: x i : x 1 x 2 … x r n i : n 1 n 2 … n r 11 ⎪ ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎪ ⎨ ⎧ < ≤ < ≤ < + ≤ < ≤ = ∑ = + x x при , 1 , x x x при , n / n , x x x при , n / ) n n ( , x x x при , n / n x x при , 0 ) x ( * F r k 1 i 1 k k i 3 2 2 1 2 1 1 1 (4) 1. Графические элементы анализа Графиком эмпирической функции распределения называют график функции F*(x). График строится на двух осях: на оси OX откладываются значения вариант x i , а на оси OY – значения функции F*(x), подсчитываемые по формуле (4). График представляет ступенчатую фигуру, начинающуюся с 0 для x ≤ x 1 , и монотонно поднимающуюся до значения 1 при x r < x. Полигоном частот называют ломаную, отрезки которой соединяют точки (x 1 ;n 1 ), (x 2 ;n 2 ), … , (x r ;n r ). Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x 1 , w 1 ), (x 2 , w 2 ), … , (x r , w r ). Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы ∆ i длиной h и высотой n i /h (плотность частот). Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы ∆ i длиной h и высотой w i /h (плотность относительных частот). 2. Точечные оценки параметров распределения выборки Пусть из генеральной совокупности в результате n испытаний над количественным признаком X извлечена выборка объемом n: варианты x 1, … , x r и их частоты n 1 , … , n r Точечной называют оценку, которая определяется одним числом. Точечные оценки обычно используют в тех случаях, когда число наблюдений велико. Выборочной средней x в называют среднее арифметическое значение вариант выборки. Если значения вариант x 1, x 2 , … , x r имеют соответственно частоты n 1 , n 2 , … , n r , то n / ) x n ( или n x n x n x n x i r 1 i i r r 2 2 1 1 в ∑ = + + + = (5) 12 Выборочной дисперсией D в называют среднее арифметическое квадратов отклонений вариант x i от их среднего значения x в , т.е. )/n ) x - (x n ( D r 1 i 2 в i i в ∑ = = (6) Выборочным средним квадратическим отклонением σ в называют квадратный корень из выборочной дисперсии D в в в D σ = (7) Исправленную (несмещенную оценку) дисперсию s 2 выборки получают по формуле 1) - )/(n ) x - (x n ( или D 1 n n s r 1 i 2 в i i в 2 ∑ = = − = (8) Аналогично вводится исправленное среднее квадратическое отклонение s 2 s s = (9) 3. Интервальные оценки параметров распределения выборки Интервальной называют оценку, которая задается в виде интервала. Интервальные оценки удобно использовать в тех случаях, когда число наблюдений n относительно невелико. Пусть для неизвестного параметра θ количественного признака X генеральной совокупности статистическими методами найдено значение θ*. Зададимся точностью δ, т.е. | θ - θ* | < δ. Надежностью оценки неизвестного параметра θ по вычисленному статистическими методами значению θ* называют вероятность γ, с которой выполняется неравенство| θ - θ* | < δ, при этом δ называется точностью оценки. В статистике обычно задаются надежностью γ и определяют точность δ. Доверительным интервалом для параметра θ называют интервал (θ* - δ, θ* + δ), который покрывает неизвестный параметр θ с вероятностью γ: P[θ* - δ Доверительный интервал с уровнем надежности γ для математического ожидания a признака X, распределенного нормально, при неизвестном среднем квадратическом отклонении определяется как n s t x a n s t - x γ в γ в / + < < / , (10) где x в – выборочное среднее; s – исправленное среднее квадратическое отклонение выборки; n – объем выборки. Точность оценки δ в этом случае 13 n s t δ γ / = . Значение t γ = t(γ,n) можно найти из справочной таблицы ”Таблица значений t γ = t(γ,n)” для распределения Стьюдента. Доверительный интервал с уровнем надежности γ для среднего квадратического отклонения σ признака X, распределенного нормально, определяется как ) q 1 ( s σ ) q 1 ( s + < < − , (11) где s – исправленное среднее квадратическое отклонение выборки; n – объем выборки. Значение q = q(γ,n) можно найти из справочной таблицы ”Таблица значений q = q(γ,n)” для распределения χ 2 В случае, когда q >1 доверительный интервал имеет вид ) q 1 ( s σ 0 + < < (11') 4. Статистическая проверка статистических гипотез Статистической называют гипотезу (предположение) о виде неизвестного распределения или о параметрах известного распределения. Основной или нулевой гипотезой H 0 называют выдвинутую гипотезу о неизвестном распределении, вместе с основной H 0 выдвигается и конкурирующая (альтернативная) гипотеза H 1, противоречащая основной. Основной принцип проверки статистических гипотез состоит в следующем: в зависимости от вида гипотезы и характера неизвестного распределения вводится функция K, называемая критерием, по значениям ее будет приниматься решение о принятии или отклонении основной гипотезы H 0 . Вводится также уровень значимости α как вероятность того, что будет отвергнута верная нулевая гипотеза и принята неверная гипотеза H 1 Областью принятия гипотезы H 0 называют те значения критерия K, при которых основная гипотеза H 0 принимается, критической областью – отвергается. Для каждой выборки и конкретного вида критерия K по специальным таблицам находятся значения k кр , называемые критическими точками; критические точки отделяют область принятия гипотезы от критической области. Правосторонней называют критическую область, где K > k кр , левосторонней K < k кр и двусторонней (и симметричной) | K| > k кр Пусть из генеральной совокупности в результате n испытаний над количественным признаком X извлечена выборка объемом n: равноотстоящие с шагом h варианты x 1, … , x r и их частоты n 1 , … , n r . Для нее подсчитаны по формулам (5-9) выборочное среднее x в и выборочное среднее квадратическое отклонение σ в Для проверки гипотезы о нормальном распределении генеральной совокупности c уровнем значимости α используется критерий χ 2 Пирсона: 14 e π 2 1 ) u ( φ , σ x x u ), u ( φ σ nh ' n где ; ' n ) ' n n ( χ 2 / u в в i i i в i r 1 i i 2 i i 2 2 − = = − = = − = ∑ (12) Критическое значение χ 2 кр = χ 2 (α,k) для этого критерия находится из справочной таблицы “Критические точки распределения χ 2 ”. Здесь k = r - 3. Если вычисленное по результатам наблюдений по формуле (12) значение критерия χ 2 набл больше χ 2 кр , основная гипотеза отвергается, если меньше - нет оснований отвергнуть основную гипотезу. Если варианты x 1, x 2 , … , x r не являются равноотстоящими или число их сравнительно велико, удобно сгруппировать варианты в отдельные интервалы ( не обязательно равноотстоящие ) [x 1 *;x 2 *), [x 2 *;x 3 *), …, [x m-1 *;x m *). Каждому интервалу назначается представительное значение, равное середине интервала x i.ср * = (x i * + x i-1 *)/2 и частота n i *, равная сумме частот, попавших на интервал. В соответствии с критерием Пирсона, частоты n i *, попавшие на интервалы [x i * ; x i-1 *), сравниваются с теоретическими частотами n i ', вычисленными для соответствующих интервалов нормальной случайной величины Z с нулевым математическим ожиданием и единичным средним квадратическим отклонением (Z принадлежит N(0,1)). n ' n ) * n ( ' n ) ' n * n ( χ m 1 i i 2 i m 1 i i 2 i i 2 − ∑ = ∑ − = = = , (13) n i ' = nP i , где n - обьем выборки; P i = Ф(z i+1 ) – Ф(z i ), вероятности попадания X на интервал (x i *,x i+1 *) или Z на (z i ,z i+1 ); z i = (x i ср *–x в *) / σ*; i = 2,3,..,m-1; крайние интервалы открываем z 1 = –∞, z m = ∞, а Ф(z i ) – значение функции Лапласа. Критическое значение χ 2 кр = χ 2 (α,k) для этого критерия находится из справочной таблицы “Критические точки распределения χ 2 ”. Здесь k = m – 3. Если вычисленное по результатам наблюдений по формуле (13) значение критерия χ 2 набл меньше χ 2 кр , нет оснований отвергнуть основную гипотезу, если больше – основная гипотеза не принимается. Для проверки гипотез о дисперсии σ 2 генеральной совокупности с нормальным законом распределения при заданном уровне значимости α используется критерий σ 1)s - (n χ 2 0 2 2 = , (14) где s 2 – исправленная дисперсия выборки; n – объем выборки; σ 0 2 – гипотетическое значение дисперсии. А) Пусть выдвинута нулевая гипотеза H 0 : σ 2 = σ 0 2 о равенстве неизвестной генеральной дисперсии σ 2 предполагаемому значению σ 0 2 при конкурирующей гипотезе H 1 : σ 2 ≠ σ 0 2 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ 2 выб . Затем по 15 таблице «Критические точки распределения χ 2 », по заданному уровню значимости α и числу степеней свободы k = n – 1 находятся левое критическое значение χ 2 лев.кр (1 – α/2;k) и правое критическое значение χ 2 прав.кр (α/2;k). Если при этом χ 2 лев.кр < χ 2 выб < χ 2 прав.кр , нет оснований отвергнуть основную гипотезу, конкурирующая – отвергается. В противном случае принимается конкурирующая гипотеза и отвергается основная. Б) Пусть теперь выдвинута нулевая гипотеза H 0 : σ 2 = σ 0 2 о равенстве неизвестной генеральной дисперсии σ 2 предполагаемому значению σ 0 2 при конкурирующей гипотезе H 1 : σ 2 > σ 0 2 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ 2 выб . Затем по таблице «Критические точки распределения χ 2 », по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение χ 2 кр ( α;k). Если при этом χ 2 выб < χ 2 кр , нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается. В) Пусть теперь выдвинута нулевая гипотеза H 0 : σ 2 = σ 0 2 о равенстве неизвестной генеральной дисперсии σ 2 предполагаемому значению σ 0 2 при конкурирующей гипотезе H 1 : σ 2 < σ 0 2 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ 2 выб . Затем по таблице «Критические точки распределения χ 2 », по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение χ 2 кр ( 1- α;k). Если при этом χ 2 выб > χ 2 кр , нет оснований отвергнуть основную гипотезу, конкурирующая – отвергается. Для проверки гипотез неизвестной средней a генеральной совокупности с нормальным законом распределения с неизвестной дисперсией при заданном уровне значимости α используется критерий Стьюдента ) n / s ( ) x ( T выб 0 a − = , (15) где x выб – выборочное среднее; a 0 гипотетическое значение средней; n – объем выборки; s – исправленное среднее квадратическое отклонение. А) Пусть выдвинута нулевая гипотеза H 0 : a = a 0 о равенстве неизвестной генеральной средней a предполагаемому значению a 0 при конкурирующей гипотезе H 1 : a ≠ a 0 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) T выб . Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится двустороннее критическое значение T двустор.кр (α;k). Если при этом | T выб | < T двустор.кр , нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается. Б) Пусть теперь выдвинута нулевая гипотеза H 0 : a = a 0 о равенстве неизвестной генеральной средней a предполагаемому значению a 0 при конкурирующей гипотезе H 1 : a > a 0 . Для проверки этой гипотезы по 16 результатам выборки вычисляется значение критерия (15) T выб . Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение T правостор.кр (α;k). Если при этом T выб < T правостор.кр , нет оснований отвергнуть основную гипотезу , а конкурирующая – отвергается. В) Пусть теперь выдвинута нулевая гипотеза H 0 : a = a 0 о равенстве неизвестной генеральной средней a предполагаемому значению a 0 при конкурирующей гипотезе H 1 : a < a 0 . Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) T выб . Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение T правостор.кр (α;k) и полагают T левостор.кр = –T правостор.кр Если при этом T выб > T левостор.кр , нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается. 17 Пример выполнения расчетной части работы (вариант расчетов с использованием мастеров и функций Excel) Выполнение всех расчетов и построений разбито по шагам 1 – 16, как это приведено в задании на работу в главе 2. 0. Исходные данные по выборке (100 чисел из табл. 1 задания на работу сведены в табл. А). Таблица А A B C D E F G H I K 6 1 2 3 4 5 6 7 8 9 10 7 175,9 175,4 180,8 195,5 156,3 173,1 160,9 193,8 180,4 189,6 8 156,9 178 172,5 200,8 179,6 152,9 194,8 179,2 171,6 190 9 184 182,6 180,8 157,9 185,5 |