Главная страница

Методические указания по выполнению. Учебнометодическое пособие по курсовой работе для студентов и курсантов вторых курсов ( высшая математика ) Химки 2006


Скачать 1.27 Mb.
НазваниеУчебнометодическое пособие по курсовой работе для студентов и курсантов вторых курсов ( высшая математика ) Химки 2006
Дата16.06.2022
Размер1.27 Mb.
Формат файлаpdf
Имя файлаМетодические указания по выполнению.pdf
ТипУчебно-методическое пособие
#598180
страница2 из 3
1   2   3
размах выборки - это разность между самым большим и самым малым значениями выборки.
Пусть из генеральной совокупности извлечена выборка, причем числовое значение x
1
наблюдалось n
1
раз, x
2
– n
2
раза, … , x r
– n r
раз. Тогда объем выборки

=
=
r
1
i i
n n
(1)
Наблюдаемые значения x i выборки называют вариантами, а их последовательность, записанная в возрастающем порядке,
-
вариационным рядом. Числа n i
называют частотами соответствующих вариант, w
i
= n i
/n – относительными частотами.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот. Таким образом, статистическое распределение выборки задается в виде двух строк: x
1,
x
2
, … , x r
(2) n
1
, n
2
, … , n r
или в виде таблицы, состоящей из двух строк (столбцов):
(3)
Замечание. В тех случаях, когда число вариант велико, статистическое распределение выборки можно задать в виде последовательности интервалов ∆
1
, ∆
2
, … , ∆
m
, обычно, равной длины h. В этом случае в качестве варианты x i
*, представляющей интервал ∆
i
, назначается среднее из вариант, попавших на интервал, и ей назначается частота n i
*, равная сумме частот вариант из интервала. Такой способ представления выборки называют группировочным или интервальным.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(x), определяющую для каждого значения аргумента x относительную частоту наступления события, состоящего в том, что значение X выборочной варианты будет меньше x:
x
i
: x
1
x
2
… x r
n
i
: n
1
n
2
… n r

11











<

<

<
+

<

=

=
+
x x
при
,
1
,
x x
x при
,
n
/
n
,
x x
x при
,
n
/
)
n n
(
,
x x
x при
,
n
/
n x
x при
,
0
)
x
(
*
F
r k
1
i
1
k k
i
3 2
2 1
2 1
1 1
(4)
1. Графические элементы анализа
Графиком эмпирической функции распределения называют график функции F*(x). График строится на двух осях: на оси OX откладываются значения вариант x i
, а на оси OY – значения функции F*(x), подсчитываемые по формуле (4). График представляет ступенчатую фигуру, начинающуюся с 0 для x ≤ x
1
, и монотонно поднимающуюся до значения 1 при x r
< x.
Полигоном частот называют ломаную, отрезки которой соединяют точки (x
1
;n
1
), (x
2
;n
2
), … , (x r
;n r
).
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x
1
, w
1
), (x
2
, w
2
), … , (x r
, w
r
).
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы

i длиной h и высотой n i
/h (плотность частот).
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы ∆
i длиной h и высотой w
i
/h (плотность относительных частот).
2. Точечные оценки параметров распределения выборки
Пусть из генеральной совокупности в результате n испытаний над количественным признаком X извлечена выборка объемом n: варианты x
1,
… , x r и их частоты n
1
, … , n r
Точечной называют оценку, которая определяется одним числом.
Точечные оценки обычно используют в тех случаях, когда число наблюдений велико.
Выборочной средней x в
называют среднее арифметическое значение вариант выборки. Если значения вариант x
1,
x
2
, … , x r имеют соответственно частоты n
1
, n
2
, … , n r
, то n
/
)
x n
(
или n
x n
x n
x n
x i
r
1
i i
r r
2 2
1 1
в

=
+
+
+
=
(5)

12
Выборочной дисперсией D
в
называют среднее арифметическое квадратов отклонений вариант x i
от их среднего значения x в
, т.е.
)/n
)
x
-
(x n
(
D
r
1
i
2
в i
i в

=
=
(6)
Выборочным средним квадратическим отклонением σ
в
называют квадратный корень из выборочной дисперсии D
в в
в
D
σ
=
(7)
Исправленную (несмещенную оценку) дисперсию s
2
выборки получают по формуле
1)
-
)/(n
)
x
-
(x n
(
или
D
1
n n
s r
1
i
2
в i
i в
2

=
=

=
(8)
Аналогично вводится исправленное среднее квадратическое
отклонение s
2
s s
=
(9)
3. Интервальные оценки параметров распределения выборки
Интервальной называют оценку, которая задается в виде интервала.
Интервальные оценки удобно использовать в тех случаях, когда число наблюдений n относительно невелико.
Пусть для неизвестного параметра θ количественного признака X генеральной совокупности статистическими методами найдено значение
θ*. Зададимся точностью δ, т.е. | θ - θ* | < δ.
Надежностью оценки неизвестного параметра θ по вычисленному статистическими методами значению θ* называют вероятность γ, с которой выполняется неравенство| θ - θ* | < δ, при этом δ называется
точностью оценки. В статистике обычно задаются надежностью γ и определяют точность δ.
Доверительным интервалом для параметра θ называют интервал
(θ* - δ, θ* + δ), который покрывает неизвестный параметр θ с вероятностью
γ:
P[θ* - δ Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ неизвестно. Требуется оценить неизвестное математическое ожидание a по результатам выборки с заданной надежностью γ.
Доверительный интервал с уровнем надежности γ для
математического ожидания a признака X, распределенного нормально, при неизвестном среднем квадратическом отклонении определяется как n
s t
x a
n s
t
- x
γ
в
γ
в
/
+
<
<
/
,
(10) где x в
– выборочное среднее; s – исправленное среднее квадратическое отклонение выборки; n – объем выборки. Точность оценки δ в этом случае

13 n
s t
δ
γ
/
=
. Значение t
γ
= t(γ,n) можно найти из справочной таблицы
”Таблица значений t
γ
= t(γ,n)” для распределения Стьюдента.
Доверительный интервал с уровнем надежности γ для среднего
квадратического отклонения σ признака X, распределенного нормально, определяется как
)
q
1
(
s
σ
)
q
1
(
s
+
<
<

,
(11) где s – исправленное среднее квадратическое отклонение выборки; n – объем выборки. Значение q = q(γ,n) можно найти из справочной таблицы
”Таблица значений q = q(γ,n)” для распределения χ
2
В случае, когда q >1 доверительный интервал имеет вид
)
q
1
(
s
σ
0
+
<
<
(11')
4. Статистическая проверка статистических гипотез
Статистической называют гипотезу (предположение) о виде неизвестного распределения или о параметрах известного распределения.
Основной или нулевой гипотезой H
0
называют выдвинутую гипотезу о неизвестном распределении, вместе с основной H
0 выдвигается и
конкурирующая (альтернативная) гипотеза H
1, противоречащая основной.
Основной принцип проверки статистических гипотез состоит в следующем: в зависимости от вида гипотезы и характера неизвестного распределения вводится функция K, называемая критерием, по значениям ее будет приниматься решение о принятии или отклонении основной гипотезы H
0
. Вводится также уровень значимости α как вероятность того, что будет отвергнута верная нулевая гипотеза и принята неверная гипотеза H
1
Областью принятия гипотезы H
0 называют те значения критерия
K, при которых основная гипотеза H
0
принимается, критической
областью – отвергается. Для каждой выборки и конкретного вида критерия K по специальным таблицам находятся значения k кр
, называемые
критическими точками; критические точки отделяют область принятия гипотезы от критической области.
Правосторонней называют критическую область, где K > k кр
, левосторонней K < k кр и двусторонней
(и симметричной) | K| > k кр
Пусть из генеральной совокупности в результате n испытаний над количественным признаком X извлечена выборка объемом n: равноотстоящие с шагом h варианты x
1,
… , x r и их частоты n
1
, … , n r
. Для нее подсчитаны по формулам (5-9) выборочное среднее x в
и выборочное среднее квадратическое отклонение σ
в
Для проверки гипотезы о нормальном распределении генеральной совокупности c уровнем значимости α используется критерий χ
2
Пирсона:

14 e
π
2 1
)
u
(
φ
,
σ
x x
u
),
u
(
φ
σ
nh
'
n где
;
'
n
)
'
n n
(
χ
2
/
u в
в i
i i
в i
r
1
i i
2
i i
2 2

=
=

=
=

=

(12)
Критическое значение χ
2
кр
= χ
2
(α,k) для этого критерия находится из справочной таблицы “Критические точки распределения χ
2
”. Здесь k = r - 3.
Если вычисленное по результатам наблюдений по формуле (12) значение критерия χ
2
набл больше χ
2
кр
, основная гипотеза отвергается, если меньше - нет оснований отвергнуть основную гипотезу.
Если варианты x
1,
x
2
, … , x r не являются равноотстоящими или число их сравнительно велико, удобно сгруппировать варианты в отдельные интервалы ( не обязательно равноотстоящие ) [x
1
*;x
2
*), [x
2
*;x
3
*), …,
[x m-1
*;x m
*). Каждому интервалу назначается представительное значение, равное середине интервала x i.ср
* = (x i
* + x i-1
*)/2 и частота n i
*, равная сумме частот, попавших на интервал. В соответствии с критерием
Пирсона, частоты n i
*, попавшие на интервалы [x i
* ; x i-1
*), сравниваются с теоретическими частотами n i
', вычисленными для соответствующих интервалов нормальной случайной величины Z с нулевым математическим ожиданием и единичным средним квадратическим отклонением
(Z принадлежит N(0,1)). n
'
n
)
*
n
(
'
n
)
'
n
*
n
(
χ
m
1
i i
2
i m
1
i i
2
i i
2


=


=
=
=
,
(13) n
i
' = nP
i
, где n - обьем выборки;
P
i
= Ф(z i+1
) – Ф(z i
), вероятности попадания X на интервал (x i
*,x i+1
*) или
Z на (z i
,z i+1
); z
i
= (x i ср
*–x в
*) / σ*; i = 2,3,..,m-1; крайние интервалы открываем z
1
= –∞, z
m
= ∞, а Ф(z i
) – значение функции Лапласа.
Критическое значение χ
2
кр
= χ
2
(α,k) для этого критерия находится из справочной таблицы “Критические точки распределения χ
2
”. Здесь k = m – 3. Если вычисленное по результатам наблюдений по формуле (13) значение критерия χ
2
набл меньше χ
2
кр
, нет оснований отвергнуть основную гипотезу, если больше – основная гипотеза не принимается.
Для проверки гипотез о дисперсии σ
2
генеральной совокупности с нормальным законом распределения при заданном уровне значимости α используется критерий
σ
1)s
-
(n
χ
2 0
2 2
=
,
(14) где s
2
– исправленная дисперсия выборки; n – объем выборки; σ
0 2
– гипотетическое значение дисперсии.
А) Пусть выдвинута нулевая гипотеза H
0
: σ
2
= σ
0 2 о равенстве неизвестной генеральной дисперсии σ
2
предполагаемому значению σ
0 2
при конкурирующей гипотезе H
1
: σ
2
≠ σ
0 2
. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ
2
выб
. Затем по

15 таблице «Критические точки распределения χ
2
», по заданному уровню значимости α и числу степеней свободы k = n – 1 находятся левое критическое значение χ
2
лев.кр
(1 – α/2;k) и правое критическое значение
χ
2
прав.кр
(α/2;k). Если при этом χ
2
лев.кр
< χ
2
выб
< χ
2
прав.кр
,
нет оснований отвергнуть основную гипотезу, конкурирующая – отвергается. В противном случае принимается конкурирующая гипотеза и отвергается основная.
Б) Пусть теперь выдвинута нулевая гипотеза H
0
: σ
2
= σ
0 2 о равенстве неизвестной генеральной дисперсии σ
2
предполагаемому значению σ
0 2
при конкурирующей гипотезе H
1
: σ
2
> σ
0 2
. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ
2
выб
. Затем по таблице «Критические точки распределения χ
2
», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение χ
2
кр
( α;k). Если при этом χ
2
выб
< χ
2
кр
, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.
В) Пусть теперь выдвинута нулевая гипотеза H
0
: σ
2
= σ
0 2 о равенстве неизвестной генеральной дисперсии σ
2
предполагаемому значению σ
0 2
при конкурирующей гипотезе H
1
: σ
2
< σ
0 2
. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (14) χ
2
выб
. Затем по таблице «Критические точки распределения χ
2
», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение χ
2
кр
( 1- α;k). Если при этом χ
2
выб
> χ
2
кр
, нет оснований отвергнуть основную гипотезу, конкурирующая – отвергается.
Для проверки гипотез неизвестной средней a генеральной
совокупности с нормальным законом распределения с неизвестной дисперсией при заданном уровне значимости α используется критерий
Стьюдента
)
n
/
s
(
)
x
(
T
выб
0
a

=
,
(15) где x выб
– выборочное среднее; a
0
гипотетическое значение средней; n – объем выборки; s – исправленное среднее квадратическое отклонение.
А) Пусть выдвинута нулевая гипотеза H
0
: a
= a
0
о равенстве неизвестной генеральной средней a предполагаемому значению a
0
при конкурирующей гипотезе H
1
: a
a
0
. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) T
выб
. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится двустороннее критическое значение T
двустор.кр
(α;k). Если при этом
| T
выб
| <
T
двустор.кр
, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.
Б) Пусть теперь выдвинута нулевая гипотеза H
0
: a
= a
0
о равенстве неизвестной генеральной средней a предполагаемому значению a
0
при конкурирующей гипотезе H
1
: a
> a
0
. Для проверки этой гипотезы по

16 результатам выборки вычисляется значение критерия (15) T
выб
. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение T
правостор.кр
(α;k). Если при этом T
выб
< T
правостор.кр
, нет оснований отвергнуть основную гипотезу
, а конкурирующая – отвергается.
В) Пусть теперь выдвинута нулевая гипотеза H
0
: a
= a
0
о равенстве неизвестной генеральной средней a предполагаемому значению a
0
при конкурирующей гипотезе H
1
: a
< a
0
. Для проверки этой гипотезы по результатам выборки вычисляется значение критерия (15) T
выб
. Затем по таблице «Критические точки распределения Стьюдента», по заданному уровню значимости α и числу степеней свободы k = n – 1 находится критическое значение T
правостор.кр
(α;k) и полагают T
левостор.кр
= –T
правостор.кр
Если при этом T
выб
> T
левостор.кр
, нет оснований отвергнуть основную гипотезу, а конкурирующая – отвергается.

17
Пример выполнения расчетной части работы
(вариант расчетов с использованием мастеров и функций Excel)
Выполнение всех расчетов и построений разбито по шагам 1 – 16, как это приведено в задании на работу в главе 2.
0. Исходные данные по выборке (100 чисел из табл. 1 задания на работу сведены в табл. А).
Таблица А
A
B
C
D
E
F
G
H
I
K
6 1
2 3
4 5
6 7
8 9
10
7
175,9
175,4
180,8
195,5
156,3
173,1
160,9
193,8
180,4
189,6
8
156,9
178
172,5
200,8
179,6
152,9
194,8
179,2
171,6
190
9
184
182,6
180,8
157,9
185,5
1   2   3


написать администратору сайта