ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА. СанктПетербургский государственный электротехнический университет Н. П. Серебрянникова б. Е. Соботковский в. В. Морозов
Скачать 1.09 Mb.
|
2.2. Случайная величина. Выборка и генеральная совокупность.Пусть некоторая величина X в ряде испытаний может принимать различные численные значения. Если значение величины Х в каждом данном испытании не может быть указано заранее (непредсказуемо), то величина называется случайной величиной. Если случайная величина может принимать бесконечное множество значений, причем эти значения могут быть сколь угодно близки друг к другу, то такая величина называется непрерывной случайной величиной. Если же случайная величина может принимать лишь дискретные значения, то она называется дискретной случайной величиной. Факт принятия величиной наперед заданного значения для дискретной случайной величины или попадания в заданный интервал для непрерывной случайной величины в конкретном испытании является случайным событием, происходящим с определенной вероятностью. Охарактеризовать случайную величину можно при помощи закона распределения. Под законом распределения случайной величины понимается соответствие, устанавливающее связь между возможными значениями случайной величины и вероятностями принятия этих значений. Это соответствие может быть задано в виде таблицы, графика или математической формулы. В основе любых измерений лежат прямые измерения, в ходе которых находят некоторое числовое значение физической величины. Каждая такая измерительная операция называется наблюдением, а получаемое при этом значение физической величины – результатом наблюдения. Получаемый опытным путем результат наблюдения подвержен случайным отклонениям от истинного значения физической величины. Такой заранее непредсказуемый в каждом данном наблюдении результат является случайной величиной. Многократное повторное проведение опыта позволяет установить статистические закономерности, которым удовлетворяет данная случайная величина. При каждом наблюдении мы получаем некоторое возможное значение физической величины. Всё множество возможных значений измеряемой величины, которые она может принимать в эксперименте, называется генеральной совокупностью. Это множество может быть как конечным, так и бесконечным. Большинство физических величин имеет непрерывный набор возможных значений, множество которых является бесконечным. Говорят, что такие величины имеют генеральную совокупность бесконечного объёма. Генеральная совокупность несет полную информацию об измеряемой величине и позволяет (в отсутствие невыявленных систематических погрешностей), несмотря на случайный характер результатов отдельных наблюдений, найти истинное значение x0 физической величины. В случае физической величины с непрерывным набором значений для нахождения её истинного значения необходимо провести бесконечное число наблюдений, что невозможно. Поэтому на практике ограничиваются конечным числом наблюдений (от единиц до нескольких десятков). Полученный при этом ряд значений физической величины: x1, x2, ... xN называют выборкой из генеральной совокупности или просто выборкой. Число N результатов наблюдений в выборке называют объёмом выборки. Результаты наблюдений, входящие в выборку, можно упорядочить, т.е. расположить их в порядке возрастания или убывания: x1 ≤ x2 ... ≤ xN. Полученную выборку называют упорядоченной или ранжированной. Величина R = xmах – xmin, называется размахом выборки. Ввиду ограниченного числа наблюдений в выборке, как отмечалось в 1.2, по ней нельзя найти ни истинного значения измеряемой величины, ни истинной погрешности измерения, и задача сводится к нахождению по выборке наилучших выборочных оценок (наилучших приближенных значений) истинного значения и истинной погрешности измерения. 2.3. Гистограмма. Эмпирическое распределение результатов наблюденийЧтобы получить представление о законе распределения измеряемой величины, производят группировку данных. Для этого весь интервал значений величины от xmin до xmax (рис. 2.1) разбивают на несколько равных интервалов, называемых интервалами группировки данных, шириной Δ и центрами xk, так что k-й интервал (k=1, 2…K) имеет границы (xk – Δ /2, xk + Δ /2). Далее, распределяют значения x1 по интервалам. Число точек Nk, оказавшихся внутри k-го интервала, даёт число попаданий измеряемой величины в этот интервал. Общее число точек, оказавшихся внутри всех интервалов разбиения, должно быть равно полному числу Nрезультатов наблюдений в исходной выборке. Над каждым интервалом Δk строится прямоугольник высотой fk = Nk/(NΔ), где N – общее число наблюдений. Совокупность таких прямоугольников называется гистограммой (рис. 2.1). При построении гистограмм интервалы разбиения не следует брать очень большими или очень маленькими. Так, в первом случае прямоугольники на гистограмме будут иметь примерно одинаковую высоту, а во втором – могут появиться интервалы, в которые не попадет ни одного значения случайной величины. В последнем случае внутри гистограммы будут просветы. Такие гистограммы не дают представления о законе распределения случайной величины. Чтобы этого не происходило, придерживаются следующих правил. Число интервалов группировки данных К рассчитывают по формуле К = 1 + 3.2 lg N, где N – объем выборки. Если число К получается дробным, то eго округляют до ближайшего меньшего целого. Ширину интервалов берут равной Δ = (xmax –xmin)/K Высоты и площади прямоугольников на гистограмме имеют следующий смысл. Учитывая, что согласно 2.2 относительные частоты Pk = Nk/N приближенно равны вероятности попадания результата каждого отдельного наблюдения в данный интервал, высота каждого прямоугольника на гистограмме fk = Nk/NΔ= Рk/Δ есть вероятность, приходящаяся на единицу длины интервала разбиения или плотность вероятности попадания случайной величины в интервал Δk с центром в точке xk. Площадь каждого прямоугольника fkΔ= Nk/N= Рk есть вероятность попадания результата в интервал Δk.. Сумма площадей прямоугольников, основания которых находятся внутри некоторого интервала [x1,x2], равна вероятности для каждого отдельного наугад взятого результата попасть в этот интервал. Нетрудно убедиться, что сумма площадей всех прямоугольников равна единице: . (2.3.1) Это означает, что попадание значений измеряемой величины в какой-либо из интервалов разбиения в промежутке (xmax, xmin) есть достоверное событие. Из рис. 2.1 видно, что результаты наблюдений распределены около некоторого значения, абсцисса которого соответствует центру самого высокого прямоугольника на гистограмме, по обе стороны которого расположены прямоугольники убывающей высоты и площадей. Учитывая, что высоты прямоугольников fk имеют смысл плотности вероятности попадания измеряемой величины в интервал Δk, можно сказать, что гистограмма дает представление о законе распределения измеряемой величины. Используя значения координат центров интервалов разбиения xk и числа попадания Nk значений измеряемой величины в интервалы, можно найти среднее значение измеряемой величины и величину , характеризующую разброс результатов наблюдений около среднего значения, которые рассчитывают по формулам (2.3.2) где при большом объеме выборки . Величину называют эмпирической дисперсией, а – среднеквадратическим отклонением результатов наблюдений от среднего (СКО x). Параметр Sx характеризует ширину распределения значений случайной величины около среднего значения. Если число измерений взять очень большим (), то есть от выборки перейти к генеральной совокупности, а ширины интервалов разбиения очень маленькими, то ломаная огибающая гистограммы перейдет в плавную кривую. Эту кривую, называемую функцией плотности распределения вероятности измеряемой величины, мы будем обозначать f(x). В этом случае суммы (2.3.1), (2.3.2) заменятся интегралами, а вероятности Pk – вероятностями попадания случайной величины в интервал (). Если случайная величина распределена в интервале (a, b) (заметим, что границы интервала могут быть и бесконечными: ), то эти интегралы будут иметь вид (2.3.3) (2.3.4) (2.3.5) где есть плотность вероятности распределения случайной величины или просто плотность вероятности, , – генеральные среднее и дисперсия, величина называется стандартным отклонением. Закон распределения случайной величины может быть найден не только эмпирически, но и из теоретических соображений. Функция плотности вероятности в этом случае определяется с точностью до некоторого постоянного множителя, значения которого находят при использовании интеграла (2.3.3), который в этом случае называют условием нормировки функции плотности вероятности. Это условие требует, чтобы площадь под графиком функции вероятности всегда была равна единице. |