охт. 1. Теория вероятностей
Скачать 0.6 Mb.
|
1 2 6. Математическая статистика – это математическая наука посвященная разработке методов описания и анализа статистических экспериментальных данных, полученных в результате наблюдений массовых случайных. Из многочисленных задач, решаемых математической статистикой, выделим следующие. 1. Определение статистических характеристик выборки (методы описательной статистики). 2. Определение параметров генеральной совокупности по данным выборки: точечные оценки и доверительные интервалы для параметров распределения. 3. Исследование статистической связи между двумя признаками выборочной совокупности (элементы корреляционного анализа). 4. Определение значимости различия между двумя выборочными совокупностями (введение в теорию статистических гипотез). 7. Генеральная совокупность – это совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины. Генеральная совокупность может быть конечной или бесконечной в зависимости от того, конечна или бесконечна совокупность составляющих ее объектов. Выборкой (выборочной совокупностью) называется совокупность случайно отобранных объектов из генеральной совокупности. Выборка должна быть репрезентативной (представительной), то есть ее объекты должны достаточно хорошо отражать свойства генеральной совокупности. Выборка может быть повторной, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность, и бесповторной, при которой отобранный объект не возвращается в генеральную совокупность. 8. Состав экспериментальной выборки должен представлять (моделировать) генеральную совокупность, поскольку выводы, полученные в эксперименте, предполагается в дальнейшем перенести на всю генеральную совокупность. Поэтому выборка должна обладать особым качеством — репрезентативностью, позволяющим распространить полученные на ней выводы на всю генеральную совокупность. Репрезентативнаявыборка, или, как еще говорят, представительная выборка, — это такая выборка, в которой все основные признаки генеральной совокупности представлены приблизительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности. Иными словами, репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать. Случайная выборка — это выборка, для которой соблюдены два условия: во-первых, все элементы генеральной совокупности имеют определенную вероятность попасть в выборку; во-вторых, вероятность выбора каждого элемента может быть рассчитана. Такие выборки являются самыми надежными, поскольку не допускают предвзятости в отборе участников исследования. Случайные методы отбора применяют, как правило, при небольшой численности генеральной совокупности при условии, что имеется полный список (или перечень) ее единиц. Такой список называют основой выборки. 10. В некоторых случаях найденные числовые характеристики выборки не могут быть использованы в качестве аргумента для обоснования какого-либо вывода. В таком случае говорят о несущественности полученных результатов. Проверить, является ли результат значимым, помогают статистические гипотезы. Статистической гипотезой называется утверждение о соответствии той или иной выборки некоторому классическому распределению или о совпадении основных числовых характеристик распределений. H0 – средние величины результативного признака во всех условиях действия фактора (или градациях фактора) одинаковы. H1 – средние величины результативного признака в разных условиях действия фактора различны. Кроме того гипотез делят на простые и сложные. Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, содержащую несколько простых гипотез. Например гипотеза Н: содержит бесчисленное множество простых гипотез Нi: ,где -любое число большее 5. 9. Числовые характеристики выборки – параметры выборки, выражающие наиболее существенные особенности статистического распределения выборки. Выборочной средней называют среднее арифметическое значение признака выборочной совокупности. Модой Мо называют варианту, которая имеет наибольшую частоту. Для интервального статистического распределения сначала определяют модальный интервал [xm; xm+1), для которого , где hi – длина частичного интервала [xi; xi+1), ni – число вариант этого интервала. Медианой Ме дискретного статистического распределения называют варианту, которая делит вариационный ряд на две части, равных по числу вариант. Если число вариант нечётное, то , если чётное, то Медианой Meинтервального статистического распределенияназывается число, для которого выполняется равенствоДисперсия выборки (выборочная дисперссия) Dв – среднее арифмитическое квадратов отклонений наблюдаемых значений признака от их среднего значения Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из Dв. 11. Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Подчеркнем, что последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение, «продолжать строительство жилого дома», то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей. Можно привести примеры, когда ошибка первого рода влечет более тяжелые последствия, чем ошибка второго рода. Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки нулевой гипотезы. Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин, и таким образом получают частное (наблюдаемое) значение критерия. Наблюдаемым значением Кнабл назначают значение критерия, вычисленное по выборкам 12. После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества, одно из которых содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается. Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают. Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если области принятия гипотезы – гипотезу принимают. Так как критерий K – одномерная случайная величина, то все ее возможные значения принадлежат некоторому интервалу и, соответственно, должны существовать точки, разделяющие критическую область и область принятия гипотезы. Такие точки называются критическими точками. Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области. Правосторонней называют критическую область, определяемую неравенством , где– положительное число. Левосторонней называют критическую область, определяемую неравенством , где– отрицательное число. 13. Поскольку критерий К — одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют. Критическими точками (границами) Kкр называют точки, отделяющие критическую область от области принятия гипотезы. 14. На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений и т. д. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т. е. наименьшую дисперсию. Пусть генеральные совокупности X и Y распределены нормально. По независимым выборкам с объемами, соответственно равными n1 и n2, извлеченным из этих совокупностей, найдены исправленные выборочные дисперсии sx2 и sy2. Требуется по исправленным дисперсиям при заданном уровне значимости α проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: H0:D(X)=D(Y) Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий , т. е. Μ[sx2]=D(X) и Μ[sy2]=D(Y) нулевую гипотезу можно записать так: H0:Μ[sx2]=Μ[sy2]. Таким образом, требуется проверить, что математические ожидания исправленных выборочных дисперсий равны между собой. Такая задача ставится потому, что обычно исправленные дисперсии оказываются различными. Возникает вопррс: значимо (существенно) или незначимо различаются исправленные дисперсии? Если окажется, что нулевая гипотеза справедлива, т. е. генеральные дисперсии одинаковы, то различие исправленных дисперсий незначимо и объясняется случайными причинами, в частности случайным отбором объектов выборки. Например, если различие исправленных выборочных дисперсий результатов измерений, выполненных двумя приборами, оказалось незначимым, то приборы имеют одинаковую точность. Если нулевая гипотеза отвергнута, т. е. генеральные дисперсии неодинаковы, то различие исправленных дисперсий значимо и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны. Например, если различие исправленных выборочных дисперсий результатов измерений, произведенных двумя приборами, оказалось значимым, то точность приборов различна. 15. Схема сравнения M(X) и M(Y) 1) Выдвинуть нулевую гипотезу: H0 : M(X) = M(Y) . В качестве конкурирующей гипотезы рассмотреть H1 : M(X) ≠ M(Y) ; 2) Задать число α – уровень значимости нулевой гипотезы; 3) Найти значение Tкрит; 4) Найти число 5) Сравнить числа Tкрит и Tнабл : · если > Tкрит , то отвергнуть гипотезу H0 , · если < Tкрит , то нет основания отвергать гипотезу H0 . 16. Метод дисперсионного анализа, или ANOVA (Analysis of Variance – дисперсионный анализ), служит для исследования статистической значимости различия между средними при трех и более выборках (уровнях фактора). Для сравнения средних в двух выборках используется t-критерий. Процедура сравнения средних называется дисперсионным анализом, так как при исследовании статистической значимости различия между средними нескольких групп наблюдений проводится анализ выборочных дисперсий. Фундаментальная концепция дисперсионного анализа была предложена Фишером. Сущность метода состоит в разделении общей дисперсии на две части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними. 17. Назначение метода Метод однофакторного дисперсионного анализа применяется в тех случаях, когда исследуются изменения результативного признака под влиянием изменяющихся условий или градаций какого-либо фактора. В данном варианте метода влиянию каждой из градаций фактора подвергаются разные выборки испытуемых. Градаций фактора должно быть не менее трех. (Градаций может быть и две, но в этом случае мы не сможем установить нелинейных зависимостей и более разумным представляется использование более простых). Гипотезы H0: Различия между градациями фактора (разными условиями) являются не более выраженными, чем случайные различия внутри каждой группы. H1: Различия между градациями фактора (разными условиями) являются более выраженными, чем случайные различия внутри каждой группы. Ограничения метода однофакторного дисперсионного анализа для несвязанных выборок 1. Однофакторный дисперсионный анализ требует не менее трех градаций фактора и не менее двух испытуемых в каждой градации. 2. Результативный признак должен быть нормально распределен в исследуемой выборке. Двухфакторный вариант дисперсионного анализа применяется тогда, когда изучается влияние двух факторов на исследуемый признак. Например, как влияют возраст и пол на осознание собственный страхов у детей. При этом можно выявить влияние отдельных факторов на исследуемый признак, а также влияние взаимодействия этих факторов. В результате вычисления данного варианта критерия получаются три эмпирических значения и, следовательно, три вывода. Ограничения: 1) у каждого фактора должно быть не менее двух градаций; 2) в каждой ячейке комплекса не менее двух наблюдений; 3) в ячейках комплекса должно быть одинаковое количество значений; 4) комплекс должен представлять собой симметричную систему, т.е. каждой градации фактора А должно соответствовать одинаковое количество градаций фактора В; 5) исследуемый признак должен быть нормально распределен; 6) факторы должны быть независимыми. 18. Корреляционный анализ(от лат. «соотношение», «связь») применяется для проверки гипотезы о статистической зависимости значений двух или нескольких переменных в том случае, если исследователь может их регистрировать (измерять), но не контролировать (изменять). Когда повышение уровня одной переменной сопровождается повышением уровня другой, то речь идет о положительной корреляции. Если же рост одной переменной происходит при снижении уровня другой, то говорят об отрицательной корреляции. При отсутствии связи переменных мы имеем дело с нулевой корреляцией. Однако следует иметь в виду, что применение корреляционного метода связано и с весьма существенными принципиальными ограничениями. Так, известно, что переменные вполне могут коррелировать и при отсутствии причинно-следственной связи между собой. Это иногда возможно в силу действия случайных причин, при неоднородности выборки, из-за неадекватности исследовательского инструментария поставленным задачам. Необходимо запомнить: наличие корреляций не является показателем выраженности и направленности причинно-следственных отношений. Однако, сразу следует оговорить, что интерпретация наличия корреляции всегда предполагает определение критических значений соответствующего коэффициента. Рассмотрим этот момент более подробно. С одной стороны, чем больше выборка, тем количественно меньший коэффициент будет считаться достоверным свидетельством корреляционных отношений. А с другой стороны, если мы готовы смириться со значительной вероятностью ошибки, то можем посчитать за достаточную небольшую величину коэффициента корреляции. 19. Регрессионный анализ представляет собой установление аналитической зависимости между признаками. Он включает следующие этапы: 1) выбор формы связи (вида аналитического уравнения регрессии); 2) оценка параметров уравнения; 3) оценка качества аналитического уравнения регрессии. Все реально существующие зависимости можно описать, используя 5 типов моделей: линейная - степенная - показательная - параболическая - гиперболическая - Парная регрессия характеризует связь между двумя признаками: результативным и факторным.Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессией. 20. Число 64,1428 показывает, каким будет значение Y, если все переменные xi в рассматриваемой нами модели обнулятся. Иными словами, можно утверждать, что на значение анализируемого параметра оказывают влияние и другие факторы, не описанные в конкретной модели. Следующий коэффициент -0,16285, расположенный в ячейке B18, показывает весомость влияния переменной Х на Y. Это значит, что среднемесячная зарплата сотрудников в пределах рассматриваемой модели влияет на число уволившихся с весом -0,16285, т. е. степень ее влияния совсем небольшая. Знак «-» указывает на то, что коэффициент имеет отрицательное значение. Это очевидно, так как всем известно, что чем больше зарплата на предприятии, тем меньше людей выражают желание расторгнуть трудовой договор или увольняется. 21. Сравнивая попарно элементы массивов Коэффициенты и Стандартная ошибка, видим, что коэффициент регрессии а1= -0,513940943 по абсолютной величине меньше, чем его стандартная ошибка = 0,625850921. Таким образом, фактор X1 следует исключить из уравнения регрессии. Стандартные ошибки остальных коэффициентов аi меньше своих стандартных ошибок. Но не все они являются значимыми, о чем можно судить по значениям показателя Р-значение, которые должны быть меньше заданного уровня значимости α = 0,05. Таким незначимым является свободный член уравнения регрессии (коэффициент в строке Y-пересечение), его значимость 0,24906735 больше 0,05 и фактор X2 (Выявлено правонарушений) 0,1036179. Подводя итог предварительному анализу уравнения регрессии, можно сделать вывод, что его целесообразно пересчитать без фактора X1, и X2, и свободного члена, которые не является статистически значимыми. В диалоговом окне Регрессия необходимо задать новые параметры, и следует активизировать флажок Константа-ноль (для исключения свободного члена). Пересчитывая значения уравнения регрессии без свободного члена, а также фактора Х1 и Х2 22. Адекватность- степень соответствия модели тому реальному явлению или объекту, для описания которого она строится. Любая модель дает приближенное описание процесса функционирования объекта или системы. Поэтому необходима специальная процедура доказательства достоверности (адекватности) построенной модели. Такая оценка производиться методами математической статистики. Именно сложность доказательства адекватности предлагаемой модели принято считать важнейшим недостатком метода моделирования. Критерий Фишера является очень удобным в проверке адекватности математических моделей. Удобство использования критерия Фишера состоит в том, что проверку гипотезы можно свести к сравнению с табличным значением. Если рассчитанное значение F-критерия не превышает табличного, то, с соответствующей доверительной вероятностью, модель можно считать адекватной. При превышении табличного значения эту приятную гипотезу приходится отвергать. Этот способ расчета дисперсии адекватности, подходит, если опыты в матрице планирования не дублируются, а информация о дисперсии воспроизводимости извлекается из параллельных опытов в нулевой точке или из предварительных экспериментов. Итак, целью анализа является получение некоторой оценки, с помощью которой можно было бы утверждать, что при некотором уровне α полученное уравнение регрессии - статистически надежно. Для этого используется коэффициент детерминации R2. Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму: Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α. Далее определяют фактическое значение F-критерия. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу. В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Полученный результат можно истолковать следующим образом. Коэффициент при х (коэффициент наклона) показывает, что если х увеличивается на одну единицу, то y возрастает на 0,38 единицы. Как х, так и y измеряются в килограммах молока на душу населения в год; таким образом, коэффициент наклона показывает, что если производство увеличится на 1 кг/душу за год, то среднедушевое потребление молока возрастет на 0,38 кг. Что можно сказать о постоянной в уравнении? Формально говоря, она показывает прогнозируемый уровень y, когда х=0.Иногда это имеет ясный смысл, иногда нет. Если х=0 находится достаточно далеко от выборочных значений хi, то буквальная интерпретация может привести к неверным результатам. При интерпретации уравнения регрессии чрезвычайно важно помнить о трех вещах. Во-первых, полученные с помощью метода наименьших квадратов значения являются лишь оценками параметров модели (8). Поэтому вся интерпретация в действительности представляет собой лишь оценку. Во-вторых, уравнение регрессии отражает только общую тенденцию для выборки. При этом каждое отдельное наблюдение подвержено воздействию случайностей. В-третьих, верность интерпретации зависит от правильности спецификации уравнения. Знак «+» свидетельствует о том, что с увеличением значения данного входного фактора будет расти и величина выходного параметра системы; при знаке «–» увеличение значения данного фактора приведет к уменьшению выходного параметра (параметра оптимизации). 24. Дисперсионный анализ – это статистический метод изучения различий между выборочными средними для трех и более совокупностей. Дисперсионный анализ используется для обработки экспериментальных данных, результатов опроса, данных наблюдений. Парный двухвыборочный t-тест для средних значений позволяет оценить разность между математическими ожиданиями двух генеральных совокупностей, связанных между собой, когда показатели первой группы зависят от показателей другой. Использование этого теста часто применяются для того, чтобы обнаружить результат какого-либо воздействия или, наоборот, доказать отсутствие этого воздействия. Корреляционный анализ — это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Регрессионный анализ — это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами. Для оценки силы связи в теории корреляции применяется шкала английского статистика Чеддока: слабая — от 0,1 до 0,3; умеренная — от 0,3 до 0,5; заметная — от 0,5 до 0,7; высокая — от 0,7 до 0,9; весьма высокая (сильная) — от 0,9 до 1,0. 1 2 |