твмс. ТВМС. Теор. и практ. реш. тип. задач к.р.(23.09.20). Контрольная работа выполняется и оформляется при соблюдении следующих правил

Название	Контрольная работа выполняется и оформляется при соблюдении следующих правил
Дата	21.12.2022
Размер	2.47 Mb.
Формат файла
Имя файла	ТВМС. Теор. и практ. реш. тип. задач к.р.(23.09.20).doc
Тип	Контрольная работа #857186
страница	6 из 9

1 2 3 4 5 6 7 8 9

2. Постановка задачи

Предположим, что по данным выборки

исследуется некоторый количественный признак X генеральной совокупности. Пусть признак X подчинен нормальному закону распределения вероятностей с параметрами M(x) = a — математическое ожидание и σ(Х) = σ — среднее квадратическое отклонение.

Задача заключается в том, чтобы с заданной надежностью (доверительной вероятностью) γ получить интервальную оценку неизвестного значения параметра а: а) при известном σ, б) при неизвестном σ.

Получить интервальную оценку — это означает, что, в условиях сформулированной задачи, необходимо составить такие статистики

при помощи которых, подставляя вместо

любое значение опытных данных

мы получили бы численные значения

границ интервала, накрывающего параметр а с заданной надежностью γ.

Решение задачи основано на применении следующей теоремы.

Теорема Фишера. Пусть 1)

— случайная выборка объемом п из генеральной совокупности нормально распределенной случайной величины X с параметрами а и σ,

2)выборочное среднее

(9)

3) выборочная дисперсия

(10)

Тогда 1) статистика

(11)

имеет нормированное нормальное распределение N (x; 0; 1);

2) статистика

(12)

имеет распределение с числом k = n – 1 степеней свободы;

3) статистика

(13)
где

— выборочное среднее квадратическое отклонение, имеет распределение Стьюдента с k = n – 1 числом степеней свободы,

4) случайные величины

независимы.

3. Построение интервальной оценки для параметра а при известном

Интервал

(14)

называется доверительным интервалом для параметра а, его границы

(15)

являются случайными и образуют интервальную оценку для параметра a с помощью двух чисел:

(нижняя граница),

(верхняя граница) с доверительной вероятностью γ. Здесь  — точность оценки.

Поскольку на основании теоремы Фишера

распределяется по нормальному закону с параметрами

то вероятность отклонения

от параметра a на величину меньше, чем , определяется из выражения:

(16)

где

— функция Лапласа,

(17)

Из (17) получаем

(18)

тогда

(19)

Следовательно, доверительный интервал

(20)

с надежностью γ и точностью

предоставляет интервальную оценку для неизвестного математического ожидания a нормально распределенного количественного признака X при известном среднем квадратическом отклонении  признака X.

Вместо

в (20) подставим его значение

значение t находим по таблице значений функции

Лапласа (прил. 3)

(21)

тогда получаем значение искомой интервальной оценки для неизвестного значения параметра a признака X в виде

(22)

4. Построение интервальной оценки для параметра а при неизвестном 

На основании теоремы Фишера статистика

(23)

где

— выборочное среднее, (24),

— выборочное среднее квадратическое отклонение, (25),

подчиняется закону распределения Стьюдента с k = n – 1 числом степеней свободы.

Пусть

— плотность вероятностей распределения Стьюдента. Тогда

(26)

где

— функция распределения Стьюдента с k = n – 1 числом степеней свободы, γ — уровень доверительной вероятности, γ = 1 – ,  — уровень значимости.

Из (26) получаем

(27)

или

(28)

где

— квантиль распределения Стьюдента с числом k = n – 1 степеней свободы и порядком квантили

Подставляя в (28) вместо выборочных характеристик

и S их численные значения

и s, определенные по данным выборки

— среднее значение выборки, (29)

— значение среднего квадратического отклонения выборки, (30)

окончательно получаем интервальную оценку неизвестного a в виде двух чисел или, что то же самое, значения границ доверительного интервала, накрывающего с уровнем доверительной вероятности γ = 1 –  неизвестное значение параметра а количественного признака X при неизвестном σ:

(31)
Пример. В результате 10 независимых измерений некоторой случайной величины X, выполненных с одинаковой точностью, получены опытные данные

x₁	x₂	x₃	x₄	x₅	x₆	x₇	x₈	x₉	x₁₀
1	2	2	2	3	1	1	3	4	4

Предполагая, что случайная величина X подчинена нормальному закону распределения вероятностей, оценить математическое ожидание случайной величины X при помощи доверительного интервала с уровнем доверительной вероятности γ = 0,95.

Решение. 1. Опытные данные

являются реализацией случайной выборки

полученной из случайной величины X (генеральной совокупности). По опытным данным (по выборке) определяем выборочные значения

и s выборочных характеристик соответственно, среднего

и среднего квадратического отклонения S случайной выборки

по формулам

2. В соответствии с теоремой Фишера статистика (случайная величина) (13) распределена по закону Стьюдента с

числом степеней свободы. Предварительно из таблицы квантилей распределения Стьюдента по значениям порядка квантили

и числа степеней свободы k= 9 находим квантиль

(прил. 6).

3. Определяем границы доверительного интервала, являющиеся нижним a_н и верхним a_в значениями интервальной оценки неизвестного истинного значения математического ожидания а случайной величины Х (исследуемого количественного признака Х) по формуле (31):

4. Ответ: доверительный интервал (1,47; 3,13) с уровнем доверительной вероятности  = 0,95 накрывает неизвестное истинное значение математического ожидания а случайной величины Х и представляет его интервальную оценку.

Задача 6. Статистическая проверка гипотез

[1, С, 10.4], [2, 25.5], [5, гл. 13, § 16–21], [6, разд. 2, гл. 7], [7, разд. 2, гл. 8]

1. Основные понятия и общая постановка задачи

При исследовании закона распределения вероятностей случайной величины Х выдвигаются статистические гипотезы.

Под статистической гипотезой понимаем любое предположение о генеральной совокупности Х, которое можно поверить по результатам независимых наблюдений (опытным данным)

в случайной выборке

из генеральной совокупности Х.

Одновременно из соображений физического характера или на основании имеющегося статистического материала формулируются две гипотезы: проверяемая, которая называется основной и обозначается H_o, и альтернативная (конкурирующая) H₁.

Пример 1. Генеральная совокупность (случайная величина) Х распределена по нормальному закону, но неизвестен его параметр а — математическое ожидание. Проведен опыт по независимым наблюдениям над значениями случайной величины Х и в результате из генеральной совокупности Х получена выборка

Проверить гипотезу H_o о том, что параметр а = 5 при альтернативной гипотезе Н₁: а  5.

Статистическая гипотеза H_o о параметрах закона распределения генеральной совокупности Х называется параметрической.

Пример 2. Распределение генеральной совокупности Х неизвестно. Проведен опыт по независимым наблюдениям над значениями случайной величины Х, в результате которого из генеральной совокупности Х получена выборка

Требуется проверить гипотезу H_o о том, что генеральная совокупность Х распределена по нормальному закону при альтернативной гипотезе Н₁: генеральная совокупность Х распределена по какому-либо другому закону.

Статистическая гипотеза H_o о виде закона распределения генеральной совокупности Х называется непараметрической.

При проверке статистической гипотезы осуществляется выбор между основной и альтернативной гипотезами с помощью составляемой выборочной характеристики (статистики), называемой статистическим критерием К =

Используемые статистические критерии имеют известные распределения и, как правило, общепринятые обозначения, например, статистический критерий Z = Z имеет нормальное распределение, F = F — распределениe Фишера, T = T — распределениe Стьюдента,

— распределение хи-квадрат.

По результатам проверки гипотеза H_o может быть признана либо ложной, либо истинной. Но в том и в другом случаях ввиду целого ряда причин, повлиять на которые заранее не представляется возможным (например, из-за случайного характера выборки, ограниченности ее объема, непредставительности), может быть допущена случайная ошибка и принято неправильное решение:

а) гипотеза H_o признается ложной, хотя в действительности она является истинной.

Ошибка называется ошибкой 1-го рода, когда истинная гипотеза H_o признается ложной и отвергается, но принимается ложная гипотеза H₁.

Вероятность ошибки 1-го рода обозначается α и называется уровнем значимости статистического критерия;

б) гипотеза H_o признается истинной, хотя в действительности она является ложной.

Ошибка называется ошибкой 2-го рода, когда ложная гипотеза H_o признается истинной и принимается, а отвергается истинная гипотеза H₁.

Вероятность ошибки 2-го рода обозначается β, вероятность M = 1 – β противоположного события « не совершить ошибку 2-го рода» (отклонение проверяемой ложной гипотезы H_o при условии, что верна альтернативная гипотеза H₁) называется мощностью статистического критерия. Мощность является важнейшей характеристикой статистического критерия: чем больше мощность, тем меньше вероятность совершить ошибку 2-го рода.

Вероятность α и β выражает степень риска совершить ошибки, соответственно, 1-го и 2-го рода.

Очевидно, что случайные события, противоположные ошибкам 1-го и 2-го рода, состоят в принятии правильного решения в следующих случаях:

а) гипотеза H_o признана истинной, когда в действительности она также истинна, — событие А;

б) гипотеза H_o признана ложной, когда в действительности она также ложная, — событие В.

В соответствии с теоремой о вероятности суммы противоположных событий вероятности событий А и В равны: P(A) = 1 – , P(B) = 1 – .

Между α и  имеет место обратная взаимосвязь: чем меньше , тем больше  и наоборот. Очевидно также, что чем меньше  и , тем лучше. Однако, учитывая их взаимосвязь, приходится искать некоторый компромисс между значениями  и .

Учитывая случайный характер ошибок 1-го и 2-го рода и противоположных им событий А и В, применение статистического критерия К = f с целью проверки гипотезы H_o предполагает построение двух непересекающихся областей значений критерия: доверительной области G, попадание в которую с доверительной вероятностью γ = 1 –  дает основание принять гипотезу H_o, и критической области

попадание в которую с уровнем значимости (вероятностью) α дает основание отклонить гипотезуH_o. Критическая область строится в соответствии с заданным уровнем значимости  попадания в нее выборочного значения k =

статистического критерия K =

.

Обычно уровень  выбирается достаточно малым, из набора стандартных значений  = 0,005; 0,01; 0,05; 0,1 с тем, чтобы случайное событие и попадание выборочного значения k = f(x₁,…,x_n) в критическую область

считалось практически невозможным, лишь с некоторой степенью риска α.

Однако, при заданном уровне значимости  можно по-разному строить критическую область с помощью составляемого статистического критерия K =

. Чтобы критическая область была наилучшей, необходимо, чтобы вероятность попадания в нее выборочного значения k =

была наилучшей при условии истинности альтернативной гипотезы

в соответствии с леммой Неймана — Пирсона.

1 2 3 4 5 6 7 8 9