Главная страница
Навигация по странице:

  • 2.3. Гистограмма. Эмпирическое распределение результатов наблюдений

  • 2.4. Результат измерения. Доверительный интервал

  • 2.5. Нормальное или гауссовское распределение

  • Погрешность. ЛЭТИ. СанктПетербургский государственный электротехнический университет


    Скачать 0.7 Mb.
    НазваниеСанктПетербургский государственный электротехнический университет
    Дата18.10.2021
    Размер0.7 Mb.
    Формат файлаpdf
    Имя файлаПогрешность. ЛЭТИ.pdf
    ТипДокументы
    #250132
    страница2 из 8
    1   2   3   4   5   6   7   8
    2.2. Случайная величина. Генеральная совокупность и выборка
    Пусть некоторая величина
    X в
    ряде испытаний может принимать раз
    - личные числовые значения
    Если значение величины
    Х
    в каждом данном ис
    - пытании не может быть указано заранее
    (
    непредсказуемо
    ), то величина
    Х
    на
    - зывается
    случайной
    величиной
    Если случайная величина может принимать бесконечное множество значений
    , причем эти значения могут быть сколь угодно близки друг к
    другу
    , то такая величина называется
    непрерывной
    случайной
    величиной
    Если же случайная величина может принимать лишь дискретные значения
    , то она на
    - зывается
    дискретной
    случайной
    величиной
    Факт принятия величиной заранее заданного значения для дискретной случайной величины или попадания в
    заданный интервал для непрерывной случайной величины в
    конкретном испытании является случайным событи
    - ем
    , происходящим с
    определенной вероятностью
    Охарактеризовать случайную величину можно при помощи закона рас
    - пределения
    Под
    законом
    распределения
    случайной величины понимается со
    - ответствие
    , устанавливающее связь между возможными значениями случай
    - ной величины и
    вероятностями принятия этих значений
    Это соответствие может быть задано в
    виде таблицы
    , графика или математической формулы
    В
    основе любых измерений лежат прямые измерения
    , в
    ходе которых находят некоторое числовое значение физической величины
    Каждая отдель
    - ная измерительная операция
    (
    отсчет
    , замер
    ) называется
    наблюдением
    , а
    по
    - лучаемое при этом значение физической величины

    результатом
    наблюде
    -
    ния
    В
    связи с
    тем
    , что результат отдельного наблюдения включает в
    себя не
    - известные погрешности
    , для решения поставленной выше задачи нахождения оценки значения физической величины в
    процессе измерения проводят
    се
    -
    рию
    наблюдений
    Получаемые в
    серии результаты наблюдений подвержены как систематическим
    , так и
    случайным отклонениям от истинного значения физической величины
    Такие заранее непредсказуемые в
    каждом данном на
    - блюдении результаты представляют собой случайную величину
    Многократ
    -

    12
    ное повторное проведение опыта позволяет установить статистические зако
    - номерности
    , которым удовлетворяет данная случайная величина
    , и
    найти ре
    - зультат измерения
    При каждом наблюдении мы получаем некоторое возможное значение физической величины
    Всё
    множество значений
    , которые измеряемая вели
    - чина может принимать в
    эксперименте
    , называется
    генеральной
    совокупно
    -
    стью
    Это множество может быть как конечным
    , так и
    бесконечным
    Боль
    - шинство физических величин имеют непрерывный набор возможных значе
    - ний
    , множество которых является бесконечным
    Говорят
    , что такие величи
    - ны имеют генеральную совокупность бесконечного объёма
    Генеральная совокупность несет полную информацию об измеряемой величине и
    позволяет
    (
    в отсутствие систематических погрешностей
    ), несмот
    - ря на случайный характер результатов отдельных наблюдений
    , найти истин
    - ное значение
    x
    0
    физической величины
    В
    случае физической величины с
    не
    - прерывным набором значений для нахождения истинного значения необхо
    - димо провести бесконечное число наблюдений
    , что невозможно
    Поэтому на практике ограничиваются конечным числом наблюдений
    (
    от единиц до не
    - скольких десятков
    ).
    Полученный при этом ряд значений физической величи
    - ны
    : x
    1
    , x
    2
    , ..., x
    N
    называют
    выборкой
    из
    генеральной
    совокупности
    или просто
    выборкой
    Число
    N результатов наблюдений в
    выборке называют
    объёмом
    выборки
    .
    Результаты наблюдений
    , входящие в
    выборку
    , можно упорядочить
    , т
    е расположить их в
    порядке возрастания или убывания
    : x
    1

    x
    2


    x
    N
    Полученную выборку называют упорядоченной или
    ранжированной
    Вели
    - чина
    R = x
    mах
    x
    min называется
    размахом
    выборки
    2.3. Гистограмма. Эмпирическое распределение
    результатов наблюдений
    Чтобы получить представление о
    законе распределения измеряемой ве
    - личины
    , экспериментальные данные группируют
    Для этого весь интервал значений величины от
    x
    min до
    x
    max
    (
    рис
    . 2.1) разбивают на несколько равных отрезков
    , называемых интервалами группировки данных
    , шириной

    и цен
    - трами
    x
    k
    , так что
    k- й
    интервал
    (k = 1, 2, …, K) имеет границы
    (x
    k


    / 2,
    x
    k
    +

    / 2).
    Далее распределяют значения
    x
    i
    по интервалам
    Число точек
    N
    k
    ,

    13
    оказавшихся внутри
    k- го интервала
    , даёт число попаданий измеряемой личины в
    этот интервал
    Общее число точек
    , оказавшихся внутри всех ин
    - тервалов разбиения
    , должно быть рав
    - но полному числу
    N
    результатов на
    - блюдений в
    исходной выборке
    Над каждым интервалом

    k
    строится прямоугольник высотой
    f
    k
    = N
    k
    / (N

    )
    Совокупность таких прямо
    - угольников называется
    гистограммой
    (
    рис
    . 2.1).
    При построении гистограмм интервалы разбиения не следует брать очень большими или очень маленькими
    Так
    , в
    первом случае прямоугольни
    - ки на гистограмме будут иметь примерно одинаковую высоту
    , а
    во втором
    – могут появиться интервалы
    , в
    которые не попадет ни одного значения слу
    - чайной величины
    Чтобы этого не происходило
    , придерживаются следующих правил
    Число интервалов группировки данных
    К
    рассчитывают по формуле
    К
    = 1 + 3.2 lg N, где
    N – объем выборки
    Если число
    К
    получается дробным
    , то e
    го округляют до ближайшего меньшего целого
    Ширину интервалов бе
    - рут равной

    = (x
    max
    x
    min
    )/K.
    Высоты и
    площади прямоугольников на гистограмме имеют следую
    - щий смысл
    Учитывая
    , что согласно
    2.2 относительные частоты
    P
    k
    = N
    k
    /N приближенно равны вероятности попадания результата каждого отдельного наблюдения в
    данный интервал
    , высота каждого прямоугольника на гисто
    - грамме
    f
    k
    = N
    k
    /N

    =
    Р
    k
    /

    есть вероятность
    , приходящаяся на единицу длины интервала разбиения или
    плотность
    вероятности
    попадания случайной ве
    - личины в
    интервал

    k
    с центром в
    точке
    x
    k
    Площадь каждого прямоугольника
    f
    k

    = N
    k
    /N =
    Р
    k
    есть вероятность попадания результата в
    интервал

    k
    Сумма площадей прямоугольников
    , ос
    - нования которых находятся внутри некоторого интервала
    [x
    1
    , x
    2
    ], равна веро
    - ятности для каждого отдельного наугад взятого результата попасть в
    этот ин
    - тервал
    Нетрудно убедиться
    , что сумма площадей всех прямоугольников равна единице
    :
    Рис. 2.1. Гистограмма
    k
    N
    N

    k
    P
    k
    f
    k
    x
    max
    x
    min
    x
    x

    0

    14 1
    1 1
    1
    K
    K
    k
    k
    k
    k
    k
    k
    N
    N
    P
    N
    N
    N
    N
    =
    =
    =
    =
    =
    =



    (2.1)
    Это означает
    , что попадание произвольного результата наблюдения в
    какой
    - либо из интервалов разбиения в
    промежутке
    (x
    max
    , x
    min
    ) есть достоверное со
    - бытие
    Из рис
    . 2.1 видно
    , что результаты наблюдений распределены около не
    - которого значения
    , абсцисса которого соответствует центру самого высокого прямоугольника на гистограмме
    По обе стороны данного прямоугольника расположены прямоугольники убывающих высот и
    площадей
    Учитывая
    , что высоты прямоугольников
    f
    k
    имеют смысл плотности вероятности попа
    - дания измеряемой величины в
    интервал

    k
    , можно сказать
    , что гистограмма дает представление о
    законе распределения измеряемой величины
    Зная координаты центров интервалов разбиения
    x
    k
    и количества попа
    - даний
    N
    k
    значений измеряемой величины в
    интервалы
    , можно найти среднее значение измеряемой величины
    x и
    величину
    2
    x
    S
    , характеризующую разброс результатов наблюдений около среднего значения
    :
    1
    ,
    k k
    k k
    x
    N x
    P x
    N
    =
    =


    (2.2)
    2 2
    2
    (
    )
    (
    ) ,
    1
    k
    k
    x
    k
    k
    N
    x
    x
    S
    P x
    x
    N

    =





    (2.3) где при большом объеме выборки
    1
    N
    N
    − ≈
    Величину
    2
    x
    S
    называют
    эмпири-
    ческой дисперсией
    , а
    2
    x
    x
    S
    S
    =

    среднеквадратическим отклонением
    ре
    - зультатов наблюдений от среднего
    (
    СКО
    x
    ).
    Параметр
    S
    x
    характеризует ши
    - рину распределения значений случайной величины около среднего значения
    Если число наблюдений взять очень большим
    (
    N
    → ∞
    ), т
    е от выбор
    - ки перейти к
    генеральной совокупности
    , а
    ширины интервалов разбиения очень маленькими
    , то ломаная огибающая гистограммы перейдет в
    плавную кривую
    , называемую
    функцией плотности распределения вероятности из-
    меряемой величины
    , которую будем обозначать
    f
    (
    x
    ).
    В
    этом случае суммы
    (2.1)–(2.3) заменятся интегралами
    , а
    вероятности
    P
    k
    – вероятностями
    ( )
    dP x
    попадания случайной величины в
    интервал
    ( ,
    x x
    dx
    +
    ).
    Если случайная вели
    - чина распределена в
    интервале
    (
    a
    ,
    b
    ) (
    заметим
    , что границы интервала могут

    15
    быть и
    бесконечными
    :
    ,
    a
    b
    = −∞
    = ∞
    ), то выражения
    (2.1)–(2.3) будут иметь вид
    ( )
    ( )
    1,
    b
    b
    a
    a
    dP x
    f x dx
    =
    =


    (2.4)
    ( )
    ( )
    ,
    b
    b
    a
    a
    x
    xdP x
    xf x dx
    =
    =


    (2.5)
    2 2
    2
    (
    )
    ( )
    (
    )
    ( )
    b
    b
    a
    a
    x
    x dP x
    x
    x
    f x dx
    σ =

    =



    ,
    (2.6) где
    ( )
    ( ) /
    f x
    dP x
    dx
    =
    есть плотность вероятности распределения случайной величины или просто плотность вероятности
    ; x ,
    2
    σ
    – генеральные среднее и
    дисперсия
    , величина
    2
    σ = σ
    называется
    стандартным
    отклонением
    Равенство
    (2.4) называют
    условием
    нормировки
    функции плотности ве
    - роятности
    Это условие требует
    , чтобы площадь под графиком функции ве
    - роятности всегда была равна единице
    2.4. Результат измерения. Доверительный интервал
    Задачей эксперимента является нахождение истинного значения
    x
    0 фи
    - зической величины
    , которое может быть найдено
    , если имеется генеральная совокупность всех значений искомой величины
    Х
    Однако
    , в
    связи с
    тем
    , что количество наблюдений в
    выборке конечно
    , в
    опыте находят некоторое при
    - ближенное к
    x
    0
    значение
    x , называемое
    оценкой
    истинного
    значения
    , и
    ука
    - зывают интервал
    , в
    который истинное значение
    x
    0
    попадает с
    заданной веро
    - ятностью
    P.
    Этот интервал называют
    доверительным
    интервалом
    , а
    вероят
    - ность
    Р

    доверительной
    вероятностью
    В
    качестве оценки истинного значения согласно
    (2.2) выбирают среднее арифметическое результатов наблюдений в
    выборке
    1 2
    1 1
    N
    N
    i
    i
    x
    x
    x
    x
    x
    N
    N
    =
    +
    + +
    =
    =

    , (2.7) которое называют
    выборочным
    средним
    Среднее
    x также является
    Рис. 2.2. Нахождение доверительного интервала
    1 2
    P

    1 2
    P


    16
    случайной величиной
    , и
    если повторить опыт по его нахождению несколько раз
    , то получим выборку средних
    X:
    1
    x
    ,
    2
    x
    , ...,
    k
    x
    , которые также будут от
    - личаться друг от друга случайным образом
    , однако разброс средних значений будет заметно меньше разброса результатов отдельных наблюдений в
    каждой выборке
    Для нахождения доверительного интервала необходимо знать распре
    - деление средних значений
    ( )
    f x
    около
    x
    0
    Зная вид
    ( )
    f x , можно построить интервал
    , в
    который истинное значение
    x
    0
    попадает с
    вероятностью
    Р
    Для этого на оси абсцисс
    (
    рис
    . 2.2) находят точки
    x
    1
    и
    x
    2
    такие
    , чтобы площади под графиком
    ( )
    f x слева от
    x
    1
    и справа от
    x
    2
    равнялись бы одной и
    той же величине
    (
    )
    1 2
    P

    Тогда площадь под графиком
    ( )
    f x в
    интервале
    (x
    1
    , x
    2
    ) будет равна значению вероятности
    P, и
    для произвольного полученного в
    опыте среднего значения можно написать
    : x
    1
    <
    x
    < x
    2
    c вероятностью
    Р
    :
    0 2
    2 1
    0 1
    1 2
    (
    )
    ( )
    ( )
    x
    x
    x
    x
    x
    x
    P x
    x
    x
    f x dx
    f x dx
    +∆
    −∆
    < <
    =
    =


    (2.8)
    Границы интервала можно также записать в виде
    1 0
    1
    x
    x
    x
    =
    − ∆
    ,
    2 0
    2
    x
    x
    x
    =
    + ∆
    Если распределение ( )
    f x симметрично, то
    1 2
    x
    x
    x
    ∆ = ∆ = ∆
    . Величину
    x

    в этом случае называют случайной доверительной погрешностью результата измерения.
    2.5. Нормальное или гауссовское распределение
    Одним из часто встречающихся на практике распределений является
    нормальный или гауссовский закон. Ему подчиняются физические величины, случайность которых обусловлена действием множества независимых (или слабо зависимых) малых аддитивных факторов, результат воздействия каж- дого из которых мал по сравнению с их суммарным воздействием. Плотность распределения вероятности нормального закона имеет вид
    ( )
    2 2
    0
    (
    )
    2 1
    ( )
    2
    x
    x x
    x
    f x
    e
    − −
    σ
    =
    σ
    π
    ,
    (2.9) где x – случайное значение величины X. Параметр x
    0
    определяет центр рас- пределения, а
    σ
    x
    – форму и ширину кривой плотности распределения

    17
    (рис. 2.3). Множитель
    0 1
    (
    )
    2
    x
    f x
    =
    σ
    π
    перед экспонентой
    , определяющий соту гауссовской кривой
    , выбран таким образом
    , чтобы было выполнено усло
    - вие нормировки
    (2.4).
    Поскольку
    Гауссово распределе
    - ние симметрично относительно
    x
    0
    , со
    - гласно
    (2.8) вероятность того
    , что слу
    - чайное значение
    x
    величины
    X, распре
    - деленной по нормальному закону
    , попадет в
    заданный интервал
    (x
    1
    , x
    2
    ), будет определяться выражением
    ( )
    2 2
    0 0
    0
    (
    )
    2 0
    0 1
    (
    )
    2
    x
    x
    x
    x x
    x
    x
    x
    P x
    x
    x
    x
    x
    e
    dx
    +∆ − −
    σ
    −∆
    − ∆ < <
    + ∆ =
    σ
    π

    (2.10)
    Вводя обозначение
    (
    )
    0
    x
    u
    x
    x
    = −
    σ
    , называемую
    стандартизованной
    переменной
    , (2.10) можно записать в
    виде
    2 2
    1
    (
    )
    2
    P
    P
    t
    u
    P
    P
    t
    P
    t
    u
    t
    e
    du


    − < <
    =
    π

    ,
    (2.11) где
    t
    P
    – коэффициенты
    , определяющие ширину интервала в
    единицах пара
    - метра нормального распределения
    σ
    x
    :
    P x
    x
    t
    ∆ = σ
    Вероятности
    P попадания
    u в
    интервал
    (–t
    P
    , t
    P
    ) можно найти
    , вычислив интеграл
    (2.11) численно для раз
    - личных значений ширины интервала
    t
    P
    И
    обратно
    , каждой заранее заданной вероятности
    P будет соответствовать свое конкретное значение коэффициен
    - та
    t
    P
    , зависящее от выбора доверительной вероятности
    P.
    Если значения ко
    - эффициентов
    t
    P
    найдены
    , то от переменной
    u можно вернуться к
    переменной
    x.
    Тогда из неравенства
    (
    )
    0
    P
    x
    P
    t
    u
    x
    x
    t
    − < = −
    σ <
    получим
    0 0
    P x
    P x
    x
    t
    x
    x
    t
    − σ < <
    + σ
    с вероятностью
    P.
    Можно показать
    (
    см
    . 2.6), что если значения
    x
    величины
    X распределе
    - ны по нормальному закону
    , то и
    рассчитываемые по ним средние значения
    x также распределены по нормальному закону с
    центром в
    точке
    x
    0
    и шириной распределения
    x
    x
    N
    σ = σ
    , где
    N – объем выборок
    , по которым рассчиты
    -
    Рис. 2.3. Нормальное распределение x0
    f x
    ( )
    σ
    1
    σ
    2
    σ
    1
    >
    σ
    3
    σ
    2
    >
    x
    x
    f(x)
    x
    0

    18
    ваются
    x .
    Распределение средних будет описываться формулой
    (2.9), в
    кото
    - рой
    x заменено на
    x , а
    x
    σ
    на
    x
    σ
    Если средние значения
    x распределены по нормальному закону
    , то за
    - дача нахождения доверительного интервала сводится к
    нахождению довери
    - тельного интервала
    (–t
    P
    , t
    P
    ) для стандартизованной переменной
    0
    (
    ) /
    x
    u
    x
    x
    = −
    σ
    и переходу к
    доверительному интервалу переменной
    x .
    В
    ре
    - зультате получим
    , что границы интервала
    , в
    который случайное значение
    x попадает с
    вероятностью
    P, определяются неравенством
    0 0
    P x
    P x
    x
    t
    x
    x
    t
    − σ < <
    + σ
    Откуда для границ доверительного интервала
    x
    0
    получаем
    0
    P
    P
    x
    x
    x
    t
    x
    x
    t
    − σ <
    < + σ
    , где
    t
    P
    – коэффициенты
    , соответствующие заданной вероятности
    Р
    Это неравенство принято записывать в
    виде симво
    - лического равенства
    0
    x
    x
    x
    x
    =
    = ± ∆
    с вероятностью
    P,
    (2.12) где
    P x
    P
    x
    x
    t
    t
    N
    ∆ = σ = σ
    – случайная доверительная погрешность результа
    - та измерения
    1   2   3   4   5   6   7   8


    написать администратору сайта