Главная страница
Навигация по странице:

  • 3. Точечные статистические оценки неизвестных параметров генеральной совокупности и их св-ва: несмещенность, состоятельность, эффективность

  • Свойства оценок

  • Метод наибольшего (максимального) правдоподобия, алгоритм нахождения точечной оценки с его помощью

  • анализ данных ответы на экзмен. анализ данных ответы на экзамен. 1. Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда. Эмпирическая фция распределения. Полигон и гистограмма


    Скачать 74.77 Kb.
    Название1. Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда. Эмпирическая фция распределения. Полигон и гистограмма
    Анкоранализ данных ответы на экзмен
    Дата17.11.2019
    Размер74.77 Kb.
    Формат файлаdocx
    Имя файлаанализ данных ответы на экзамен.docx
    ТипДокументы
    #95587
    страница2 из 7
    1   2   3   4   5   6   7

    2.Генеральная совокупность. Выборки и способы их получения. Репрезентативная выборка.

    Вся подлежащая изучению совокупность объектов (наблюдений) называется генеральной совокупностью. В матем-кой статистике понятие генеральной совокупности трактуется как совокупность всех мыслимых наблюдений, к-ые могли бы быть произведены при данном реальном комплексе условий, и в этом смысле его не следует смешивать с реальными совокупностями, подлежащими статистическому изучению. Так, обследовав даже все пр-тия подотрасли по определенным технико-эк-ким показателям, мы можем рассматривать обследованную совокупность лишь как представителя гипотетически возможной более широкой совокупности пр-тий, к-е могли бы функционировать в рамках того же реального комплекса условий.

    Понятие генеральной совокупности в определенном смысле аналогично понятию случайной величины (закону распределения вер-тей, вероятностному пространству), т.к. полностью обусловлено определенным комплексом условий.

    Та часть объектов, к-ая отобрана для непосредственного изучения из генеральной совокупности, называется выборочной совокупностью, или выборкой. Числа объектов (наблюдений) в генеральной или выборочной совокупности называются их объёмами. Генеральная совокупность может иметь как конечный, так и бесконечный объем.

    Выборку можно рассматривать как некий эмпирический аналог генеральной совокупности. Сущность выборочного метода состоит в том, чтобы по некоторой части генеральной совокупности (по выборке) выносить суждение о ее свойствах в целом.

    Преимущества выборочного метода наблюдения по сравнению со сплошным:

    1) позволяет существенно экономить затраты ресурсов (материальных, трудовых, временных);

    2) является единственно возможным в случае бесконечной генеральной совокупности или в случае, когда исследование связано с уничтожением наблюдаемых объектов (напр., исследование долговечности электрических лампочек, предельных режимов работы приборов и т.п.);

    3) при тех же затратах ресурсов дает возможность проведения углубленного исследования за счет расширения программы исследования;

    4) позволяет снизить ошибки регистрации, т.е. расхождения между истинным и зарегистрированным значениями признака.

    Основной недостаток выборочною метода - ошибки исследования, называемые ошибками репрезентативности (представительства).

    Однако неизбежные ошибки, возникающие при выборочном методе исследования в связи с изучением только части объектов, могут быть заранее оценены и посредством правильной организации выборки сведены к практически незначимым величинам. Между тем использование сплошного наблюдения даже там, где это принципиально возможно, не говоря уже о росте трудоемкости, стоимости и увеличении необходимого времени, часто приводит к тому, что каждое отдельное наблюдение поневоле проводится с меньшей точностью. А это уже сопряжено с неустранимыми ошибками и в конечном счете может привести к снижению точности сплошного наблюдения по сравнению с выборочным.

    Чтобы по данным выборки иметь возможность судить о генеральной совокупности, она д.б. отобрана случайно. Случайность отбора элементов в выборку достигается соблюдением принципа равной возможности всем элементам генеральной совокупности быть отобранными в выборку. На практике это достигается тем, что извлечение элементов в выборку проводится путем жеребьевки (лотереи) или с помощью случайных чисел, имеющихся в специальных таблицах или вырабатываемых ЭВМ с помощью датчика случайных чисел.

    Выборка называется репрезентативной (представительной), если она достаточно хорошо воспроизводит генеральную совокупность.

    Различают следующие виды выборок:

    1) собственно-случайная выборка, образованная случайным выбором элементов без расчленения на части или группы;

    2) механическая выборка, в к-ую элементы из генеральной совокупности отбираются через определенный интервал. Например, если объем выборки должен составлять 10% (10%-ная выборка), то отбирается каждый l0-й ее элемент и т.д.;

    3) типическая (стратифицированная) выборка, в к-ую случайным образом отбираются элементы из типических групп, на к-ые по нек-му признаку разбивается генеральная совокупность;

    4) серийная (гнездовая) выборка, в к-ую случайным образом отбираются не элементы, а целые группы совокупности (серии), а сами серии подвергаются сплошному наблюдению.

    Используют два способа образования выборки:

    1) повторный отбор (по схеме возвращенного шара), когда каждый элемент, случайно отобранный и обследованный, возвращается в общую совокупность и м.б. повторно отобран;

    2) бесповторный отбор (по схеме невозвращенного шара), когда отобранный элемент не возвращается в общую совокупность.

    Мат-кая теория выборочного метода основывается на анализе собственно-случайной выборки.

    Обозначим:
    xi - значения признака (случайной величины Х);

    N и n - объемы генеральной и выборочной совокупностей;

    Ni и ni - число элементов генеральной и выборочной совокупностей со значением признака xi;

    М и m - число элементов генеральной и выборочной совокупностей, обладающих данным признаком.

    Средние арифметические распределения признака в генеральной и выборочной совокупностях называются соответственно генеральной и выборочной средними, а дисперсии этих распределений - генеральной и выборочной дисперсиями. Отношение числа элементов генеральной и выборочной совокупностей, обладающих нек-ым признаком А, к их объемам, называются соответственно генеральной и выборочной долями. Все формулы сведем в таблицу.

    В случае бесконечной генеральной совокупности (N = ∞) под генеральными средней и дисперсией понимается соответственно математическое ожидание и дисперсия σ2 распределения признака Х (генеральной совокупности), а под генеральной долей р - вероятность данного события.

    Важнейшей задачей выборочного метода является оценка параметров генеральной совокупности по данным выборки.

    Теоретическую основу применимости выборочного метода составляет закон больших чисел, согласно к-му при неограниченном увеличении объема выборки практически достоверно, что случайные выборочные характеристики как угодно близко приближаются (сходятся по вероятности) к определенным параметрам генеральной совокупности.

    3. Точечные статистические оценки неизвестных параметров генеральной совокупности и их св-ва: несмещенность, состоятельность, эффективность

    Сформулируем задачу оценки параметров в общем виде. Пусть распределение признака Х - генеральной совокупности - задается функцией вер-тей φ(xi,θ)=P(X=xi) (для дискретной СВ Х) или плотностью вер-ти φ(x,θ) (для непрерывной СВ Х), к. содержит неизвестный параметр θ. Напр, это параметр λ в распределении Пуассона или параметры а и σ2 для нормального закона распределения и т.д.

    Для вычисления параметра θ исследовать все элементы генеральной совокупности не представляется возможным. Поэтому о параметре θ пытаются судить по выборке, состоящей из значений (вариантов) x1,x2,…,xn. Эти значения можно рассматривать как частные значения (реализации) n независимых случайных величин X1,X2,…,Xn каждая из к. имеет тот же закон распределения, что и сама СВ Х.
    Оценкой параметра θ называют всякую функцию результатов наблюдений над СВ Х (иначе - статистику), с помощью к-ой судят о значении параметра θ:

    .

    Поскольку X1,X2,…,Xn - случайные величины, то и оценка (в отличие от оцениваемого параметра θ - величины неслучайной, детерминированной) является случайной величиной, зависящей от закона распределения СВ Х и числа n.

    О качестве оценки следует судить не по индивидуальным ее значениям, а лишь по распределению ее значений в большой сети испытаний, т.е. по выборочному распределению оценки.

    Если значения оценки концентрируются около истинного значения параметра θ, т.е. основная часть массы выборочного распределения оценки сосредоточена в малой окрестности оцениваемого параметра θ, то с большой вер-тью можно считать, что оценка отличается от параметра θ лишь на малую величину. Поэтому, чтобы значение было близко к θ, надо, очевидно, потребовать, чтобы рассеяние случайной величины относительно θ, выражаемое, например, мат. ожиданием квадрата отклонения оценки от оцениваемого параметра, было по возможности меньшим. Таково основное условие, к. должна удовлетворять «наилучшая» оценка.

    Свойства оценок.
    Оценка параметра θ называется несмещенной, если ее мат-кое ожидание равно оцениваемому параметру, т.е. в противном случае оценка называется смещенной.

    Если это равенство не выполняется, то оценка , полученная по разным выборкам, будет в среднем либо завышать значение θ (если , либо занижать его (если ). Требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.

    Если при конечном объеме выборки n , т.е. смещение оценки, но, то такая оценка называется асимптотически несмещенной.

    Оценка параметра θ называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вер-ти к оцениваемому параметру:

    , или

    В случае использования состоятельных оценок оправдывается увеличение объема выборки, т.к. при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки. Если оценка состоятельна, то практически достоверно, что при достаточно большом n .
    Если оценка параметра θ является несмещенной, а ее дисперсия при n → ∞, то оценка является и состоятельной. Это непосредственно вытекает из неравенства Чебышева:

    .

    Несмещенная оценка параметра называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра θ, вычисленных по выборкам одного и того же объема n.
    Т.к. для не смещенной оценки есть ее дисперсия , то эф-ть является решающим свойством, определяющим качество оценки.
    Эффективность оценки определяют отношением:.

    где и - соот-но дисперсии эффективной и данной оценок. Чем ближе е к 1, тем эффективнее оценка. Если е→1 при n→∞, то такая оценка называется асимптотически эффективной.

    4. Метод наибольшего (максимального) правдоподобия, алгоритм нахождения точечной оценки с его помощью
    Метод наибольшего правдоподобия точечной оценки неизвестных параметров заданного распределения сводится к отысканию Максимума ф-ции одного или нескольких оцениваемых параметров.
    А. Дискретные случайные величины. Пусть Х – дискретная случ. Величина, к. в результате n испытаний приняла значения х12,…,xn. Допустим, что вид закона распределения величины Х задан, но неизвестен параметр Θ, к. определяется этот закон. Требуется найти его точечную оценку.
    Обозначим вероятность того, что в результате испытания величина Х примет значение xi (i=1, 2,…,n), через p (xi,Θ).
    Функцией правдоподобия дискретной случайной величины Х называют функцию аргумента Θ:
    L(x1, x2,…, xn;Θ)=p(x1;Θ) * p(x2;Θ)…р(хn;Θ), где х12,…,хn – фиксированные числа.
    В качестве точечной оценки параметра Θ принимают такое его значение Θ*= Θ* (x1, x2,…, xn;Θ), при к. ф-ция правдоподобия достигает максимума. Оценку Θ* называют оценкой наибольшего правдоподобия.
    Ф-ции L и lnL достигают max при одном и том же значении Θ, поэтому вместо отыскания max ф-ции L ищут max ф-ции lnL.
    Логарифмической ф-цией правдоподобия называют ф-цию lnL. Как известно, т. Max ф-ции lnL аргумента Θ можно искать, например, так:
    1. Найти производную ,
    2. Приравнять производную нулю и найти критическую т. Θ* - корень полученного уравнения
    3. Найти II производную ; если II производная при Θ= Θ* отрицательна, то Θ* - т. Max
    Найденную т. Max Θ* принимают в качестве оценки наибольшего правдоподобия параметра Θ.
    Метод наибольшего правдоподобия имеет ряд достоинства: оценки наибольшего правдоподобия, вообще говоря, состоятельны (но они могут быть смещенными), распределены асимптотически нормально (при больших значениях n приближенно нормальны) и имеют наименьшую дисперсию по сравнению с др. асимптотически нормальными оценками; если для оцениваемого параметра Θ существует эффективная оценка Θ*, то уравнение правдоподобия имеет единственное решение Θ*; этот метод наиболее полно использует данные выборки об оцениваемом параметре, поэтому он особенно полезен в случае малых выборок.
    Недостаток метода состоит в том, что он часто требует сложных вычислений.
    Б. Непрерывные случайные величины. Пусть Х – непрерывная случайная величина, к. в результате n испытаний приняла значения x1, x2,…, xn. Допустим, что вид плотности распределения – ф-ции f(x) – задан, но неизвестен параметр Θ, к. распределяется эта ф-ция.
    Ф-цией правдоподобия непрерывной случ. величины Х называют ф-цию аргумента Θ:
    L(x1, x2,…, xn;Θ)=f(x1;Θ) * f(x2;Θ)…f(хn;Θ)
    Оценку наибольшего правдоподобия неизвестного параметра распределения непрерывной случ. Величины ищут так же, как в случае дискретной случайной величины.
    Если плотность распределения f(x) непрерывной случайной величины определяется двумя неизвестными параметрами Θ1 и Θ2, то ф-ция правдоподобия есть ф-ция 2 независимых аргументов Θ1 и Θ2 :
    L=f(x11, Θ2) * f(x21, Θ2)…f(xn1, Θ2)
    Далее находят логарифмическую ф-цию правдоподобия и для отыскания ее максимума составляют и решают систему

    1   2   3   4   5   6   7


    написать администратору сайта