теория вероятности. 1. Опыт с равновероятностными исходами. Вероятность и частота. Некоторые комбинаторные формулы

Название	1. Опыт с равновероятностными исходами. Вероятность и частота. Некоторые комбинаторные формулы
Дата	23.04.2022
Размер	1.11 Mb.
Формат файла
Имя файла	теория вероятности.doc
Тип	Документы #492247
страница	4 из 5

1 2 3 4 5

Статистические оценки параметров распределения (выборочная средняя, групповая и общая средняя, выборочная дисперсия). Формула для вычисления дисперсии.

*-статистическая оценка 

x_i -значение выборки

1) Оценка параметра наз.состоятельной, если при увеличении объёма выборки n она сходится по вероятности к значению теоретической оценки . Состоятельность -минимальное требование к оценкам.

2) Оценка * наз.несмещённой, если её мат.ожидание равно параметру  для любого объёма выборки

3) Смещённой наз. оценку, мат.ожидание к-ой не равно оцениваемому параметру.

4) Несмещённая оценка * наз.эффективной, если её дисперсия минимальна по отношению к дисперсии любой другой оценки этого параметра

Выборочная средняя:

Выборочной средней

наз.среднее арифметическое значений признака выборочной совокупности.

1) х₁,х₂,…,х_n -все различны

n-объём выборки

2) х₁,х₂,…,х_k -появляются с опред.частотой.

x₁ – появляется n₁ раз

x₂ – n₂

x_k – n_k

Групповая и общая средняя:

Групповой средней наз.среднее арифметическое значений признака, принадлежащих группе.

Общей средней наз.среднее арифм.значений признака,принадлежащих всей совокупности(выборки) -

Выборочная дисперсия (D_в):

Выборочной дисперсией наз.среднее арифмет.квадратов отклонения наблюдаемых значений признака от их среднего значения.

1)

Среднеквадратическое отклонение. Формула дисперсии.

Выборочная дисперсия=ср.арифметическому квадрату значений выборки между квадратом общей средней.

18. Основные распределения в статистике. Распределение хи-квадрат. Распределение Стьюдента. Распределение Фишера.

Распределение ²

Пусть независимые случ.величины ξ_i где

распределены по нормальному закону распределения, причем M[ξ_i]=0, а средн.квадратич. отклонение=1, тогда величина ξ_i распределена по закону ² с n степенями свободы.

ξ_i распределено по норм.закону-это значит,что:

-гамма функция

m-положительна Г(m+1)=Г(m)

m-целое Г(m)=(m-1)!

Распределение ² опред.одним параметром - числом степеней свободы n

f_(x) - называется графиком Пирснона

Они ассиметричны и начинаются с n>2, имею один максимум в значении x=n-2

Характериситческая ф-ция

Распределение Стьюдента:

Пусть V не зависит от Z и V распределена по закону ², и есть n степеней свободы, тогда вводим величину

, тогда величина T имеет распределение Стьюдента t с n-степенями свободы.

Плотность распределения:

Графики f_T(x) наз.кривыми Стьюдента, симметрична при всех n = 1,2,... относительно оси ординат.

С возрастанием числа степеней свободы распр-е Стьюдента быстро приближается к нормальному.
Распределение Фишера:

-независимые случ.величины, распределены по нормальному закону ² с n и m степенями свободы,

тогда

распределение Фишера с n и m степенями свободы.

Плотность этого распределения:

где

Распределение Фишера определяется 2-мя параметрами – числами степеней свободы.
19. Статистические оценки. Точечные оценки. Метод максимального правдоподобия. Метод наименьших квадратов. Интервальные оценки.

Стат.оценкой неизвестного параметра теоретического распределения нзв ф-цию от наблюдаемых случайных величин.

Несмещенной нзв стат.оценку, мат.ожид.к-рой равно оцениваемому параметру  при любом объеме выборки, т.е. M[^*]=.

Смещенной нзв оценку, мат.ожид.к-рой не равно оцениваемому параметру.

Эффективной нзв оценку, к-рая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.

С остоятельной нзв оценку, к-рая при n∞ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n∞ стремится к 0, то такая оценка оказывается и состоятельной.
Точечные оценки

Точечной нзв оценку, к-рая опред-ся одним числом, например: генеральная средняя, выборочная средняя, групповая и общая средние, генеральная дисперсия, выборочная дисперсия и др.

x_i – значения выборки

При выборке малого объема точечная оценка может знач.отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Несмещенной оценкой генеральной средней (мат ожидания) служит выборочная средняя

,где x_i–варианта выборки, n_i-частота

варианты x_i_{, -}объем выборки.

Замечание1.Если первоначальные варианты x_i-большие числа,то для упрощения расчета из каждой варианты одно и то же число С,т.е. перейти к условным вариантам u_i=x_i-C, тогда

.

Смещенной оценкой генеральной дисперсии служит выборочная дисперсия

,эта оценка является смещенной, т к

Замечание2.Если первоначальные варианты x_i-большие числа, то целесообразно вычесть из всех вариант одно и то же число C,равное выборочной средней или близкое к ней,т.е. перейти к условным вариантам u_i=x_i-C (дисперсия при этом не изменится).

Тогда

Замечание 3. Если первоначальные варианты являются десятичными дробями с k десятичными знаками после запятой, то, чтобы избежать действий с дробями,умножают первоначальные варианты на постоянное число C=10^k,т.е. переходят к условным вариантам u_i=Cx_i. При этом дисперсия увеличится в C² раз. Поэтому, найдя дисперсию условных вариант, надо разделить ее на C²:

Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия

В условных вариантах она имеет вид

Причем если u_i=x_i-C,то s²x=

; если u_i=Cx_i, то s²x=

,то s²x=

/C².

Примечание 4. При большом числе данных используют метод произведений или метод сумм.
Метод максимального правдоподобия.

Метод м.п. точечной оценки неизвестных параметров заданного распределения сводится к отысканию максимума ф-ции одного или нескольких оцениваемых параметров.

А) Дискретные случ величины. Пусть Х-дискретная случ величина,кот в результате n опытов приняла возможные значения х₁,х₂..х_n.Допустим,что вид закона распределения случ велич Х задан,но неизвестен параметр ,которым определяется этот закон;требуется найти его точечную оценку *=*( х₁,х₂..х_n).

Обозначим вероятность того,что в результате испытания величина Х примет значение х_i через p(x_n; ).

Функцией правдоподобия дискретной случайной величины Х назыв ф-цию аргумента :

L(х₁,х₂..х_n; )=p(x₁; )* p(x₂; )… p(x_n; ) .

Оценкой наибольшего правдоподобия параметра  назыв такое его значение *,при кот ф-ция правдоподобия достигает максимума.Функции L и lnL достигают максимума при одном и том же значении ,поэтому вместо отыскания максимума ф-ции L ищут,что удобнее,максимум ф-ции lnL.

Логарифмической ф-цией правдоподобия назыв ф-цию lnL.Точку максимума ф-ции lnL аргумента  можно искать,например,так:

1.найти производную

2.приравнять производную 0 и найти критич точку *-корень получ ур-ия (ур-ия правдоподобия)

3.найти вторую производную

,если вторая производная при =* отрицательна,то *-точка максимума. Найденную точку максимума * принимают в качестве оценки наибольшего правдоподобия параметра .

Б) Непрерывные случайные величины. Пусть Х-непрерывн случ велич,которая в результате n испытаний приняла значения х₁,х₂..х_n. Допустим,что вид плотности распределения-ф-ции f(x) – задан,но неизвестен параметр θ,которым определяется эта ф-ция. Ф-ией правдоподобия непрерывной случ величины Х назыв ф-цию аргумента :

L(х₁,х₂..х_n; )=f(x₁; )* f(x₂; )… f(x_n; ).

Оценку наибольшего правдоподобия неизвестного параметра распределения непрерывной случ величины ищут также,как в случае дискретной случ величины.

Если плотность распределения f(x) непрерывной случ величины определяется двумя неизвестными параметрами ₁и ₂,то ф-ция правдоподобия есть ф-ция двух независ аргументов ₁и ₂:

L= f(x₁; ₁, ₂)* f(x₂; ₁, ₂)… f(x_n; ₁, ₂). Далее находят логарифмическую ф-цию правдоподобия и для отыскания ее максимума составл и решают систему

Метод наименьших квадратов

а₀, а₁,…,a_n

(m+1) уравнений

y=ax+b

(x₁, y₁), (x₂, y₂)…

Интервальные оценки

Интервальной нзв оценку, к-рая определяется двумя числами – концами интервала. Инт.оценки позволяют установить точность и надежность оценок.

Надежностью (доверительной вероятностью) оценки  по ^* нзв вер-ть γ, с к-рой осуществл.нерав-во | - ^*|<δ. Заменив нерав-во | - ^*|<δ равносильным ему двойным нерав-вом -δ< - ^*<δ или ^*-δ<<δ+^* имеем

Доверительным нзв интервал (^*-δ, ^*+δ), к-рый покрывает неизвестный параметр с заданной надежностью γ.

1.Интервальной оценкой (с надежностью γ) математического ожидания а нормально распределенного количественного признака X по выборочной средней

при известном среднем квадратическом отклонении σ генеральной совокупности служит доверительный интервал

Где

- точность оценки, n-объем выборки, t-значение аргумента ф-ции Лапласа Ф(t),при котором Ф(t)=γ/2; при неизвестном σ (и объеме выборки n<30)

где s-«исправленное» выборочное среднее квадратическое отклонение, t_γ находят по таблице по заданным n и γ.

2. Интервальной оценкой (с надежностью γ) среднего квадратического отклонения σ нормально распределенного количественного признака X по «исправленному» выборочному среднему квадратическому отклонению s служит довер. инт-л

(при q<1)

(при q>1)

Где q находят по таблице по заданным n и γ

3. Интервальной оценкой (с надежностью γ) неизвестной вер-ти p биноминального распред-я по относ. частоте ω служит довер.инт-л (с приближ. концами p₁ и p₂)

где

Где n-общее число испытаний; m-число появлений событий; ω-относ.частота, равная отношению m/n;t-значение аргумента ф-ции Лапласа, при к-ром Ф(t)=γ/2(γ-заданная надежность).

Замечание. При больших значениях n (порядка сотен) можно принять в кач-ве приближ.границ довер.инт-ла

1 2 3 4 5