статистическая обработка данных. основы статистической обработки опытных даных. Учебнометодическое пособие Нижний Новгород 2011 Трегубова Е. В. Основы статистической обработки опытных данных. Учебнометодическое пособие
Скачать 1.63 Mb.
|
Часть 2. Элементы математической статистики. § 1. Выборка и ее распределение. Математическая статистика занимается изучением закономерностей, которым подчиняются массовые явления, на основе результатов наблюдений. Первая задача математической статистики – это разработка методологии сбора и группировки статистического материала, полученного в результате наблюдений за случайными процессами. Вторая задача состоит в разработке методов анализа полученных статистических данных. Этот анализ включает оценку вероятностей события, функции распределения вероятностей или плотности вероятности, оценку параметров известного распределения, а также связей между случайными величинами. В математической статистике вводятся понятия генеральной и выборочной совокупностей. Вся подлежащая изучению совокупность однородных объектов называется генеральной совокупностью. Часть случайно отобранных объектов называется выборочной совокупностью или просто выборкой. Число объектов в генеральной совокупности или в выборке обычно называют их объемами. Повторной называют выборку, при которой объект перед отбором следующего возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. В некоторых случаях результаты выборки зависят не только от ее объема, но и от способа отбора объектов. Если выборка правильно отражает соотношения в генеральной совокупности, то ее называют репрезентативной (представительной). Пусть из генеральной совокупности извлекается выборка. При этом значение наблюдается раз, наблюдается раз и т.д., наблюдается раз. Общий объем выборки можно определить как Наблюдаемое значение называется вариантой, а их последовательность, записанная в возрастающем порядке, - вариационным рядом. Число наблюдений называется частотой, а значение его отношения к объему выборки – относительной частотой: Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Предположим, что получено статистическое распределение выборки. Обозначим через число наблюдений, при которых значения вариант оказываются меньше, чем . Эмпирической функцией распределения случайной величины (функцией распределения выборки) называют функцию относительной частоты числа наблюдений т.е. относительной частоты события . Эта функция служит для приближенного представления о теоретической функции распределения случайной величины. Полигоном частот называют ломанную, отрезки которой соединяют точки . По оси абсцисс откладывают точки , а по оси ординат – соответствующие значения (частоты). Точки соединяют отрезками прямых. Если вместо частот брать относительные частоты , то можно построить полигон относительных частот, соединив точки отрезками прямых. В тех случаях, когда рассматривается непрерывная случайная величина, которая может принимать любые, сколь угодно мало отличающиеся друг от друга значения, строится не полигон, а гистограмма. Для этого интервал, в котором заключены все значения случайной величины, разбивается на несколько частичных интервалов длиной каждый. На этих интервалах подсчитывается сумма частот вариант, попавших в -й интервал, и составляется отношение . Гистограммой называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат отрезки длиной , а высоты равны . Величина называется плотностью частоты. Для того чтобы привести гистограмму, т.е. выборочную плотность частоты, в соответствие с функцией плотности вероятности генеральной совокупности, по оси ординат откладывают величины и получают гистограмму относительных частот. Тогда площадь под гистограммой Рис.12 Рис. 13 § 2. Статистические оценки. 1. Несмещенные, эффективные и состоятельные оценки. Одной из центральных задач математической статистики является задача оценки теоретического распределения случайной величины на основе выборочных данных. При этом предполагается, что закон распределения генеральной совокупности известен, но неизвестны его параметры, такие, например, как математическое ожидание и дисперсия. Требуется найти приближенное значение этих параметров, т.е. получить их статистические оценки. Обозначим через оценку некоторого теоретического параметра закона распределения случайной величины . Рассматривая выборочные значения , , …, как реализации случайных величин , , …, , получивших конкретные значения в результате опытов, можно представить оценку как функцию этих случайных величин. Это значит, что оценка тоже является случайной величиной. Если для оценки некоторого параметра взять несколько выборок, то в общем случае получим столько же различных случайных оценок , , …, . Математическое ожидание случайной величины , имеющей отмеченные реализации, может как совпадать, так и не совпадать с оцениваемым параметром . Несмещенной называется статистическая оценка , математическое ожидание которой равно оцениваемому параметру , т.е. . Смещенной называется статистическая оценка , математическое ожидание которой не равно оцениваемому параметру . Так же как и для любой случайной величины, оценка может иметь большой или небольшой разброс (дисперсию) относительно математического ожидания. Эффективной называется статистическая оценка, которая при одних и тех же объемах выборки имеет наименьшую дисперсию. В некоторых случаях становится интересным поведение оценки при неограниченном увеличении объемов выборки. Состоятельной называется статистическая оценка, которая при увеличении объемов выборки стремится по вероятности к оцениваемому параметру, т.е. . В частности, если дисперсия оценки при стремится к нулю, то такая оценка является состоятельной. 2. Выборочная средняя и выборочная дисперсия Пусть проведена выборка объема . Выборочной средней называют среднее арифметическое значений выборки. Если все значения выборки , , …, различны, то . Если же варианты , , …, имеют соответственно частоты , , …, , то , где + +…+ = . В некоторых случаях выборочные значения случайной величины целесообразно разбивать на отдельные группы. В каждой группе можно найти ее среднюю. Групповой средней называют среднее арифметическое значений выборки, принадлежащих группе. По этим групповым средним можно найти среднее для всей выборки. Общей средней называют среднее арифметическое значение групповых средних. Для характеристики рассеивания выборочных значений относительно выборочного среднего вводится понятие выборочной дисперсии. Выборочной дисперсией называют среднее арифметическое квадратов отклонений наблюдаемых значений от выборочного среднего. Если все значения выборки , , …, различны, то . Если же варианты , , …, имеют соответственно частоты , , …, , то . Выборочным средним квадратическим отклонением называется арифметическое значение квадратного корня из выборочной дисперсии: . Выборочная средняя является несмещенной оценкой, а выборочная дисперсия – смещенной оценкой. Если выборочную дисперсию умножить на дробь , называемую поправкой Бесселя, то получим несмещенную оценку, называемую «исправленной» выборочной дисперсией: . Соответственно, «исправленным» средним квадратическим отклонением называется арифметическое значение квадратного корня из «исправленной» выборочной дисперсии. 3. Другие характеристики вариационного ряда. Кроме указанных выше, применяют и другие характеристики вариационного ряда. Укажем главные из них. Модой называют варианту, которая имеет наибольшую частоту. Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечетно, т.е. , то ; при четном медиана . Размахом варьирования называют разность между наибольшей и наименьшей вариантами: . Средним абсолютным отклонением называют среднее арифметическое абсолютных отклонений: . Коэффициентом вариации называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней: %. Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов. Тот из рядов имеет большее рассеяние по отношению к выборочной средней, у которого коэффициент вариации больше. Коэффициент вариации – безразмерная величина, поэтому он пригоден для сравнения рассеяний вариационных рядов, варианты которых имеют различную размерность, например, если варианты одного ряда выражены в сантиметрах, а другого – в граммах. Если вариационный ряд составлен по данным выборки, то все описанные характеристики называются выборочными, если по данным генеральной совокупности, то - генеральными. 4. Эмпирические моменты. Для вычисления сводных характеристик выборок используют эмпирические моменты, аналогичные соответствующим теоретическим моментам. Обычным эмпирическим моментом порядка s называется среднее значение s-ых степеней разностей , где – наблюдаемая варианта, С-произвольная постоянная (ложный ноль – либо мода, либо любая варианта, расположенная примерно в середине вариационного ряда): . При С=0 имеем начальные эмпирические моменты порядка s; в частности, в случае s=1 . Центральным эмпирические моменты порядка s называется обычный момент при : . В частности, центральный момент второго порядка , т.е. совпадает с выборочной дисперсией. 5. Асимметрия и эксцесс эмпирического распределения. Нормальное распределение является одним из самых распространенных в применениях математической статистики. Для оценки отклонения эмпирического распределения от нормального используют следующие характеристики: асимметрию эмпирического распределения и эксцесс эмпирического распределения. Смысл этих характеристик аналогичен смыслу асимметрии и эксцесса теоретического распределения. Асимметрия эмпирического распределения определяется следующим равенством . Эксцесс эмпирического распределения определяется следующим равенством . В формулы входят центральные эмпирические моменты и , а также выборочное среднее квадратическое отклонение σв. 6. Число степеней свободы. Статистические оценки параметров теоретического распределения являются случайными величинами, так как получаются они на основе случайной выборки. Для многих задач математической статистики (построение доверительных интервалов, проверка статистических гипотез и т.д.) оказывается необходимым рассмотрение законов распределения статистических оценок или их комбинаций. При этом широко используются такие законы распределения случайных величин, как хи-квадрат, Фишера, Стьюдента и некоторые другие. В выражения указанных законов входят величины, называемые степенями свободы. Любая композиция независимых случайных величин , , …, , в частности сумма, имеет степеней свободы, так как каждая составляющая может менять свое значение независимо от других значений. Различные независимые измерения одной и той же величины можно рассматривать как различные случайные величины с числом степеней свободы, равным числу измерений. Так, например, последовательность измерений , , …, или их сумма имеет степеней свободы. Точно так же и сумма квадратов этих величин имеет степеней свободы. Однако если для рассмотренной системы случайных величин задана некоторая связь, то количество степеней свободы уменьшается. В частности, если найти среднее значение полученных в результате выборки значений , , …, и зафиксировать это значение для соответствующих случайных величин , , …, , т.е. признать верным выражение для всех значений этих величин, то одну из величин всегда можно выразить через остальные. Это значит, что она оказалась связанной и система случайных величин потеряла одну степень свободы. Таким образом, рассматривая случайную величину выборочной средней как сумму независимых случайных измерений, ее число степеней свободы следует принять равным числу этих измерений. Если же рассматривать выборочную дисперсию как случайную величину , то она будет иметь уже на одну степень свободы меньше, так как здесь фиксировано и связывает случайные величины , , …, . Если после фиксации выборочной средней и выборочной дисперсии ( , ) рассматривать случайную величину, зависящую от независимых случайных величин и от и , то ее число степеней свободы будет меньше еще на единицу. 7. Точечная и интервальная оценки. Доверительный интервал. Точечной называют оценку, которая определяется одним числом. Рассмотренные выше оценки ( , ) точечные. При выборках малого объема точечная оценка может существенно отличаться от оцениваемого параметра. В этом случае целесообразно использовать интервальные оценки. Интервальной называют оценку, которая определяется двумя числами – концами интервала. Пусть найденная по данным выборки величина служит оценкой неизвестного параметра . Оценка определяет тем точнее, чем меньше , т.е. чем меньше в неравенстве , . Так как - случайная величина, то и разность - случайная величина. Поэтому неравенство при заданном может выполняться только с некоторой вероятностью. Доверительной вероятностью (надежностью) оценки параметра называется вероятность γ, с которой оценивается неравенство . Обычно задается надежность γ и определяется . Чаще всего вероятность γ задается значениями 0,95 и выше. Доверительным интервалом называется интервал ( - , + ), который покрывает неизвестный параметр с заданной надежностью. 8. Доверительный интервал для оценки математического ожидания нормального распределения при известном и в случае неизвестного . Пусть случайная величина имеет нормальное распределение и известно ее среднее квадратическое отклонение . Требуется найти доверительный интервал, покрывающий математическое ожидание с надежностью γ, с учетом полученного значения выборочного среднего . Как уже отмечалось, выборочная средняя является случайной величиной, поэтому ее можно обозначить . С учетом этого , где определяем по таблице функции Лапласа из выражения . При этом называется точностью оценки. Теорема Ляпунова утверждает, что если случайная величина имеет конечное математическое ожидание и среднее квадратическое отклонение , то распределение средней арифметической, вычисленной по наблюдавшимся значениям случайной величины в независимых испытаниях, при приближается к нормальному закону с математическим ожиданием и средним квадратическим отклонением . Поэтому при формулу можно применять и в случае, если сама случайная величина не имеет нормального распределения. Пусть случайная величина имеет нормальное распределение, причем ее среднее квадратическое отклонение неизвестно. Требуется найти доверительный интервал, покрывающий математическое ожидание с надежностью γ, с учетом полученного значения выборочного среднего . В этом случае доверительный интервал имеет вид , где - «исправленное» среднее квадратическое отклонение, а находим из Приложения 7 для распределения Стьюдента по известным и γ. При неограниченном возрастании объема выборки распределение Стьюдента стремится к нормальному. Поэтому практически при n>30 можно вместо распределения Стьюдента пользоваться нормальным распределением. Однако важно подчеркнуть, что для малых выборок ( ), в особенности для малых значений , замена распределения нормальным приводит к грубым ошибкам, а именно к неоправданному сужению доверительного интервала. То обстоятельство, что распределение Стьюдента при малой выборке дает не вполне определенные результаты (широкий доверительный интервал), вовсе не свидетельствует о слабости метода Стьюдента, а объясняется тем, что малая выборка содержит малую информацию об интересующем нас признаке. 9. Доверительный интервал для оценки среднего квадратического отклонения нормального распределения. Пусть случайная величина имеет нормальное распределение. Доверительный интервал, покрывающий среднее квадратическое отклонение этого признака с доверительной вероятностью γ, находится из условия , если , , если , где находится по данным и γ из таблицы значений . § 3. Проверка статистических гипотез. В некоторых случаях требуется знать закон распределения генеральной совокупности, который неизвестен, однако есть основания предполагать, что он имеет определенный вид (например, экспоненциальный). Тогда выдвигается гипотеза: генеральная совокупность распределена по экспоненциальному закону. В других случаях закон распределения известен, но неизвестны его параметры. Если есть основания предполагать, что неизвестный параметр равен определенному значению , то выдвигается гипотеза = . Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Наряду с данной гипотезой рассматривают и противоречащую ей гипотезу. В случае, когда выдвинутая гипотеза отвергается, обычно принимается противоречащая ей гипотеза. Нулевой (основной) называют выдвинутую гипотезу . Конкурирующей (альтернативной) называют гипотезу , которая противоречит основной. Например, если нулевая гипотеза : математическое ожидание нормально распределенной величины равно 10, т.е. , тогда гипотеза может иметь вид . Проверку правильности или неправильности выдвинутой гипотезы проводят статистическими методами. В результате такой проверки может быть принято правильное или неправильное решение. Поэтому различают ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. В целях проверки нулевой гипотезы в рассмотрение вводят специально подобранную случайную величину, распределение которой известно. Ее обозначают Uили Z, если она распределена нормально, F или – по закону Фишера, T- по закону Стьюдента, - по закону хи-квадрат. Для общности ее можно обозначить K. Случайную величину K, которая служит для проверки нулевой гипотезы, называют статистическим критерием. Например, если проверять гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия K принимают отношение исправленных выборочных дисперсий. Эта величина случайная, потому что в различных опытах дисперсии принимают различные, наперед неизвестные значения, и распределена по закону Фишера. Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин, а затем и сам критерий и таким образом получают частное (наблюдаемое) значение критерия. Наблюдаемым значением называют значение критерия, вычисленное по выборкам. После выбора определенного критерия множество всех его возможных значений разбивается на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается. Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают. Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают. Поскольку критерий K – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют. Критическими точками (границами) называют точки, отделяющие критическую область от области принятия гипотезы. Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области. Правосторонней называют критическую область, определяемую неравенством , где – положительное число. Левосторонней называют критическую область, определяемую неравенством , где – отрицательное число. Односторонней называют правостороннюю или левостороннюю критическую область. Двусторонней называют критическую область, определяемую неравенствами , где . Для отыскания правосторонней критической области достаточно найти критическую точку. Для её нахождения задаются достаточно малой вероятностью – уровнем значимости . Затем ищут критическую точку , исходя из требований, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий K примет значение, большее (в случае правосторонней области), была равна принятому уровню значимости: . Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию. Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что , то нулевую гипотезу отвергают; если же , то нет оснований, чтобы отвергнуть нулевую гипотезу. Замечание. Наблюдаемое значение критерия может оказаться большим не потому, что нулевая гипотеза ложная, а по другим причинам (малый объем выборки, недостатки методики эксперимента и др.). В этом случае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню значимости . Вопрос о том, каким выбрать , определяется значимостью последствий ошибки первого рода. Чем серьезнее эти последствия, тем меньше должен быть уровень значимости . Однако слишком малым число тоже брать нельзя, т.к. при малых становится большой вероятность принять неверную нулевую гипотезу, что является ошибкой второго рода и это тоже нежелательно. Если нулевая гипотеза принята, то ошибочно думать, что она доказана. Более правильно говорить «данные наблюдений согласуются с нулевой гипотезой и, следовательно, не дают оснований ее отвергать». На практике для большей уверенности принятия гипотезы ее проверяют другими способами или повторяют эксперимент, увеличивая объем выборки. § 4. Проверка гипотезы о распределении генеральной совокупности. Критерий Пирсона. Критерий Колмогорова. Прогнозы о значениях, которые может иметь случайная величина точны и обоснованы, если известен ее закон распределения. Приближенное представление о плотности распределения случайной величины дает гистограмма, построенная по опытным данным. Сравнивая ее с графиком плотности известных распределений, можно выбрать подходящий закон распределения. В некоторых случаях, зная физическую природу факторов, влияющих на значения случайной величины, можно сделать теоретическое обоснование вида закона распределения. Так, например, известно, что если отказы изделия устранимы (изделие можно отремонтировать), то продолжительность работы изделия (наработка) до капитального ремонта при коэффициенте вариации % имеет распределение, близкое к нормальному, а при 30%-60%- к распределению Вейбулла. Наработка изделия на отказ, вызванный мгновенным повреждением (например, прокол шины) при 00%, неплохо описывается показательным распределением и т.д. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону А. Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Имеется несколько критериев согласия: хи-квадрат Пирсона, Смирнова, Колмогорова и др. Ограничимся описанием применения критерия Пирсона и критерия Колмогорова. Предположим, что закон распределения выбран, т.е. принята нулевая гипотеза : данные выборки являются значениями случайной величины с плотностью (или с функцией распределения ). Рассмотрим методику проверки гипотезы по критерию хи-квадрат Пирсона. 1. Подсчитаем опытное значение . Для этого: а) По данным выборки строим интервальный вариационный ряд (при выборе интервалов соблюдаем условия: интервалы должны заполнять всю область значений , не пересекаться и содержать не менее чем по пять результатов). Первая строка вариационного ряда представляет собой, выписанные в возрастающем порядке, интервалы значений признака, а вторая – частоты (число появлений) значений из рассматриваемого интервала.
Таблица 3 б) Используя нулевую гипотезу, находим вероятности попадания значения в интервалы при одном опыте: или Подсчитываем теоретические частоты попаданий значений в интервалы при повторных и независимых опытах. г) Вычисляем опытные значения критерия Оказывается, является значением случайной величины, распределение которой при больших (при ) мало отличается от распределения случайной величины с степенями свободы, где - число интервалов, а - число параметров предполагаемого распределения. Так, для показательного распределения , для нормального распределения . Распределение описывает распределение суммы квадратов независимых случайных величин, каждая из которых имеет нормальное распределение с параметрами 0 и 1. Распределение затабулировано. В таблице распределения для значений уровня значимости и числа степеней свободы указаны числа , для которых . 2. Выбираем уровень значимости и строим критическую область. Значимыми значениями критерия хи-квадрат являются большие положительные значения . Поэтому критическая область имеет вид . Границу критической области находим из таблицы распределения по уровню значимости и числу степеней свободы . 3. Делаем вывод по правилу: а) Гипотеза принимается, если не попало в критическую область; б) Гипотеза отклоняется, если попало в критическую область. В последнем случае следует подобрать другой подходящий закон распределения и снова провести проверку его согласия с опытными данными. Критерий хи-квадрат применяется к довольно разнообразным случаям проверки статистических гипотез. Однако, его приложение, например, к поверке соответствия между гипотетическим и фактически наблюдаемым распределениями существенно зависит от сделанного довольно произвольно подразделения результатов наблюдений на группы; в силу этого результаты проверки гипотезы несколько условны. Сама группировка, т.е. объединение наблюдаемого материала в группы, связана с некоторой потерей имевшейся в первоначальных данных информации. Эти обстоятельства заставляют проявлять известную осторожность, и показания критерия хи-квадрат рекомендуется дополнять показаниями других критериев. Рассмотрим методику проверки гипотезы по критерию Колмогорова. На практике кроме критерия Пирсона часто используется критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривается максимальное значение абсолютной величины разности между эмпирической функцией распределения и соответствующей теоретической функцией распределения : , называемое статистикой критерия Колмогорова. Доказано, что какова бы ни была функция распределения непрерывной случайной величины Х, при неограниченном увеличении числа наблюдений вероятность неравенства стремиться к пределу . Задавая уровень значимости α, из соотношения Можно найти соответствующее критическое значение . В таблице приводятся критические значения критерия Колмогорова для некоторых α. Схема применения критерия следующая: Строятся эмпирическая функция распределения и предполагаемая теоретическая функция распределения Определяется мера расхождения между теоретическим и эмпирическим распределением и вычисляется величина . Если вычисленное значение λ окажется больше критического , определенного на уровне значимости α, то нулевая гипотеза о том, что случайная величина Х имеет заданный закон распределения, отвергается. Если , то считают, что гипотеза не противоречит опытным данным. Критерий Колмогорова достаточно часто применяется на практике благодаря своей простоте. Однако в принципе его применение возможно лишь тогда, когда теоретическая функция распределения задана полностью. Но такой случай на практике встречается весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия Пирсона это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Такого рода правок в критерии Колмогорова не предусмотрено. Поэтому, если при неизвестных значениях параметров применить Критерий Колмогорова, взяв за значения параметров их оценки, то получим завышенное значение вероятности , а значит, большее критическое значение . В результате есть риск в ряде случаев принять нулевую гипотезу о законе распределения случайной величины как правдоподобную, в то время как на самом деле она противоречит опытным данным. В заключении отметим, что при проверке ряда гипотез, например, гипотез о законе распределения на заданном уровне значимости, контролируется лишь ошибка первого рода (возможность отвергнуть правильную гипотезу), но нельзя сделать вывод о степени риска, связанного с принятием неверной гипотезы, т.е. с возможностью совершения ошибки второго рода. В Части 3 данного пособия приведены примеры использования критериев Пирсона и Колмогорова. |