теория вероятности. 1. Опыт с равновероятностными исходами. Вероятность и частота. Некоторые комбинаторные формулы
![]()
|
Статистические оценки параметров распределения (выборочная средняя, групповая и общая средняя, выборочная дисперсия). Формула для вычисления дисперсии. *-статистическая оценка ![]() xi -значение выборки 1) Оценка параметра наз.состоятельной, если при увеличении объёма выборки n она сходится по вероятности к значению теоретической оценки . Состоятельность -минимальное требование к оценкам. ![]() 2) Оценка * наз.несмещённой, если её мат.ожидание равно параметру для любого объёма выборки ![]() 3) Смещённой наз. оценку, мат.ожидание к-ой не равно оцениваемому параметру. 4) Несмещённая оценка * наз.эффективной, если её дисперсия минимальна по отношению к дисперсии любой другой оценки этого параметра ![]() Выборочная средняя: Выборочной средней ![]() 1) х1,х2,…,хn -все различны n-объём выборки ![]() 2) х1,х2,…,хk -появляются с опред.частотой. x1 – появляется n1 раз x2 – n2 xk – nk ![]() Групповая и общая средняя: Групповой средней наз.среднее арифметическое значений признака, принадлежащих группе. Общей средней наз.среднее арифм.значений признака,принадлежащих всей совокупности(выборки) - ![]() Выборочная дисперсия (Dв): Выборочной дисперсией наз.среднее арифмет.квадратов отклонения наблюдаемых значений признака от их среднего значения. 1) ![]() 2) ![]() Среднеквадратическое отклонение. Формула дисперсии. ![]() Выборочная дисперсия=ср.арифметическому квадрату значений выборки между квадратом общей средней. ![]() ![]() 18. Основные распределения в статистике. Распределение хи-квадрат. Распределение Стьюдента. Распределение Фишера. Распределение ² Пусть независимые случ.величины ξi где ![]() ![]() ξi распределено по норм.закону-это значит,что: ![]() ![]() ![]() ![]() -гамма функция m-положительна Г(m+1)=Г(m) m-целое Г(m)=(m-1)! Распределение ² опред.одним параметром - числом степеней свободы n f(x) - называется графиком Пирснона Они ассиметричны и начинаются с n>2, имею один максимум в значении x=n-2 ![]() Характериситческая ф-ция ![]() ![]() ![]() ![]() Распределение Стьюдента: Пусть V не зависит от Z и V распределена по закону ², и есть n степеней свободы, тогда вводим величину ![]() ![]() Плотность распределения: ![]() Графики fT(x) наз.кривыми Стьюдента, симметрична при всех n = 1,2,... относительно оси ординат. ![]() ![]() С возрастанием числа степеней свободы распр-е Стьюдента быстро приближается к нормальному. Распределение Фишера: ![]() тогда ![]() распределение Фишера с n и m степенями свободы. Плотность этого распределения: ![]() где ![]() Распределение Фишера определяется 2-мя параметрами – числами степеней свободы. 19. Статистические оценки. Точечные оценки. Метод максимального правдоподобия. Метод наименьших квадратов. Интервальные оценки. Стат.оценкой неизвестного параметра теоретического распределения нзв ф-цию от наблюдаемых случайных величин. Несмещенной нзв стат.оценку, мат.ожид.к-рой равно оцениваемому параметру при любом объеме выборки, т.е. M[*]=. Смещенной нзв оценку, мат.ожид.к-рой не равно оцениваемому параметру. Эффективной нзв оценку, к-рая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию. С ![]() Точечные оценки Точечной нзв оценку, к-рая опред-ся одним числом, например: генеральная средняя, выборочная средняя, групповая и общая средние, генеральная дисперсия, выборочная дисперсия и др. ![]() xi – значения выборки При выборке малого объема точечная оценка может знач.отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками. Несмещенной оценкой генеральной средней (мат ожидания) служит выборочная средняя ![]() варианты xi, ![]() Замечание1.Если первоначальные варианты xi-большие числа,то для упрощения расчета из каждой варианты одно и то же число С,т.е. перейти к условным вариантам ui=xi-C, тогда ![]() Смещенной оценкой генеральной дисперсии служит выборочная дисперсия ![]() ![]() Замечание2.Если первоначальные варианты xi-большие числа, то целесообразно вычесть из всех вариант одно и то же число C,равное выборочной средней или близкое к ней,т.е. перейти к условным вариантам ui=xi-C (дисперсия при этом не изменится). Тогда ![]() Замечание 3. Если первоначальные варианты являются десятичными дробями с k десятичными знаками после запятой, то, чтобы избежать действий с дробями,умножают первоначальные варианты на постоянное число C=10k,т.е. переходят к условным вариантам ui=Cxi . При этом дисперсия увеличится в C2 раз. Поэтому, найдя дисперсию условных вариант, надо разделить ее на C2: ![]() Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия ![]() В условных вариантах она имеет вид ![]() Причем если ui=xi-C,то s2x= ![]() ![]() ![]() Примечание 4. При большом числе данных используют метод произведений или метод сумм. Метод максимального правдоподобия. Метод м.п. точечной оценки неизвестных параметров заданного распределения сводится к отысканию максимума ф-ции одного или нескольких оцениваемых параметров. А) Дискретные случ величины. Пусть Х-дискретная случ величина,кот в результате n опытов приняла возможные значения х1,х2..хn.Допустим,что вид закона распределения случ велич Х задан,но неизвестен параметр ,которым определяется этот закон;требуется найти его точечную оценку *=*( х1,х2..хn). Обозначим вероятность того,что в результате испытания величина Х примет значение хi через p(xn; ). Функцией правдоподобия дискретной случайной величины Х назыв ф-цию аргумента : L(х1,х2..хn; )=p(x1; )* p(x2; )… p(xn; ) . Оценкой наибольшего правдоподобия параметра назыв такое его значение *,при кот ф-ция правдоподобия достигает максимума.Функции L и lnL достигают максимума при одном и том же значении ,поэтому вместо отыскания максимума ф-ции L ищут,что удобнее,максимум ф-ции lnL. Логарифмической ф-цией правдоподобия назыв ф-цию lnL.Точку максимума ф-ции lnL аргумента можно искать,например,так: 1.найти производную ![]() 2.приравнять производную 0 и найти критич точку *-корень получ ур-ия (ур-ия правдоподобия) 3.найти вторую производную ![]() Б) Непрерывные случайные величины. Пусть Х-непрерывн случ велич,которая в результате n испытаний приняла значения х1,х2..хn. Допустим,что вид плотности распределения-ф-ции f(x) – задан,но неизвестен параметр θ,которым определяется эта ф-ция. Ф-ией правдоподобия непрерывной случ величины Х назыв ф-цию аргумента : L(х1,х2..хn; )=f(x1; )* f(x2; )… f(xn; ). Оценку наибольшего правдоподобия неизвестного параметра распределения непрерывной случ величины ищут также,как в случае дискретной случ величины. Если плотность распределения f(x) непрерывной случ величины определяется двумя неизвестными параметрами 1и 2,то ф-ция правдоподобия есть ф-ция двух независ аргументов 1и 2: L= f(x1; 1, 2)* f(x2; 1, 2)… f(xn; 1, 2). Далее находят логарифмическую ф-цию правдоподобия и для отыскания ее максимума составл и решают систему ![]() Метод наименьших квадратов а0, а1,…,an ![]() (m+1) уравнений y=ax+b (x1, y1), (x2, y2)… ![]() Интервальные оценки Интервальной нзв оценку, к-рая определяется двумя числами – концами интервала. Инт.оценки позволяют установить точность и надежность оценок. Надежностью (доверительной вероятностью) оценки по * нзв вер-ть γ, с к-рой осуществл.нерав-во | - *|<δ. Заменив нерав-во | - *|<δ равносильным ему двойным нерав-вом -δ< - *<δ или *-δ<<δ+* имеем ![]() Доверительным нзв интервал (*-δ, *+δ), к-рый покрывает неизвестный параметр с заданной надежностью γ. 1.Интервальной оценкой (с надежностью γ) математического ожидания а нормально распределенного количественного признака X по выборочной средней ![]() ![]() Где ![]() ![]() где s-«исправленное» выборочное среднее квадратическое отклонение, tγ находят по таблице по заданным n и γ. 2. Интервальной оценкой (с надежностью γ) среднего квадратического отклонения σ нормально распределенного количественного признака X по «исправленному» выборочному среднему квадратическому отклонению s служит довер. инт-л ![]() ![]() Где q находят по таблице по заданным n и γ 3. Интервальной оценкой (с надежностью γ) неизвестной вер-ти p биноминального распред-я по относ. частоте ω служит довер.инт-л (с приближ. концами p1 и p2) ![]() где ![]() ![]() Где n-общее число испытаний; m-число появлений событий; ω-относ.частота, равная отношению m/n;t-значение аргумента ф-ции Лапласа, при к-ром Ф(t)=γ/2(γ-заданная надежность). Замечание. При больших значениях n (порядка сотен) можно принять в кач-ве приближ.границ довер.инт-ла ![]() |