Главная страница
Навигация по странице:

  • 2. Критерий автокорреляции

  • 3. Критерий Фостера-Стюарта

  • 4. Критерий Кокса-Стюарта

  • 5. Критерий Вальда-Вольфовитца

  • 8. Ранговый критерий обнаружения сдвига дисперсии

  • 9. Сравнительный анализ мощности критериев

  • Application of tests for trend detection and checking for randomness

  • фостер1. Вопросы применения некоторых критериев проверки случайности и отсутствия тренда


    Скачать 0.78 Mb.
    НазваниеВопросы применения некоторых критериев проверки случайности и отсутствия тренда
    Дата03.10.2022
    Размер0.78 Mb.
    Формат файлаpdf
    Имя файлафостер1.pdf
    ТипДокументы
    #711357

    1
    Метрология. 2010. № 12. – С. 3-25.
    УДК 519.24
    Вопросы применения некоторых критериев проверки
    случайности и отсутствия тренда
    Лемешко Б.Ю., Комиссарова А.С., Щеглов А.Е.
    Новосибирский государственный технический университет, Новосибирск,
    Россия,
    e-mail: Lemeshko@fpm.ami.nstu.ru
    Исследованы распределения статистик ряда критериев, используемых при проверке гипотез об отсутствии тренда в математических ожиданиях и в дисперсиях наблюдаемых величин. Отмечены недостатки некоторых критериев. Проведен сравнительный анализ мощности критериев.
    Ключевые слова: критерий наличия тренда, критерий автокорреляции, критерии Фостера-Стюарта, критерии Кокса-Стюарта, критерий Вальда-
    Вольфовитца, критерий Бартелса, критерий Хсу, ранговые критерии обнаружения сдвига, мощность критерия.
    1. Введение
    Для анализа выборок случайных величин (временных рядов) на предмет отсутствия тренда в характеристиках измеряемой величины в приложениях используется целый ряд параметрических и непарамет- рических критериев проверки гипотез. Совокупность этих критериев реализована в программных системах статистического анализа, опи- сана в работах авторов, предложивших соответствующий критерий, в различных учебных пособиях, иногда изложение совокупности кри- териев сконцентрировано в одном источнике [1]. Однако касается ли это конкретного расчета или использования соответствующего про- граммного обеспечения, общим остается одно: ответственность за корректное применение конкретного критерия возлагается на пользо- вателя. И вот здесь, столкнувшись с необходимость проведения стати- стического анализа и оказавшись перед выбором того или иного кри- терия, специалист оказывается в тупике, а какой критерий предпочти- тельней?
    Предпосылкой, обуславливающей применение параметрических

    2 критериев, как правило, является предположение о принадлежности анализируемых данных нормальному закону. А что произойдет с рас- пределением статистики этого критерия в случае нарушения предпо- ложения о нормальности? Насколько будут оставаться корректными выводы, осуществляемые на основании классических результатов?
    При ограниченных объемах выборок распределения статистик параметрических и непараметрических критериев могут существенно отличаться от асимптотических распределений этих статистик, ис- пользуемых в процедуре проверки гипотезы. В случае применения непараметрических критериев эта проблема может усугубляться. На- пример, вследствие ярко выраженной дискретности значений стати- стики критерия использование асимптотического распределения вме- сто истинного распределения этой статистики оказывается не право- мерным даже при больших объемах выборок.
    Использование непараметрических критериев не требует вы- полнения предположения о принадлежности выборок анализируемых величин некоторому параметрическому закону (например, нормаль- ному). Однако сведения о мощности непараметрических критериев, сведения о том, насколько они уступают параметрическим критериям, представляются достаточно туманными.
    Исследователя может интересовать наличие или отсутствие тренда в математическом ожидании (в среднем) и в дисперсиях.
    При проверке отсутствия тренда (случайности) в математи-
    ческом ожидании задача формулируется следующим образом. Пред- полагается, что наблюдается временной ряд
    1
    , ...,
    n
    x
    x значений вза- имно независимых случайных величин с математическими ожида- ниями
    1
    ,...,
    n
    и одинаковыми (но неизвестными) дисперсиями.
    Проверяется гипотеза
    0
    :
    i
    H
    ,
    1, 2,...,
    i
    n
    , о том, что все выборочные значения принадлежат к одной генеральной совокупно-

    3 сти со средним , против конкурирующей гипотезы о наличии тренда
    1 1
    :
    0
    i
    i
    H
    ,
    1, 2,...,
    1
    i
    n
    Для проверки такого рода гипотез предназначен критерий Аббе.
    В [2, 3] была отмечена устойчивость распределения статистики критерия Аббе к отклонениям от нормального закона. В [4, 5] распределения статистики критерия Аббе были исследованы при справедливости
    0
    H
    и принадлежности ошибок измерений различным симметричным законам, была подтверждена устойчивость распреде- ления статистики Аббе к нарушению предположения о нормальности
    1
    ,...,
    n
    x
    x и исследована мощность критерия по отношению к различ- ным конкурирующим гипотезам.
    Критерий Аббе далеко не единственный критерий, ориентиро- ванный на проверку случайности и отсутствие тренда. Этим же целям служит критерий автокорреляции и целый ряд непараметрических критериев.
    Проверяемая гипотеза об отсутствии тренда в дисперсии формулируется аналогичным образом (проверяется
    0
    :
    i
    H
    ,
    1, 2,...,
    i
    n
    , против
    1 1
    :
    0
    i
    i
    H
    ,
    1, 2,...,
    1
    i
    n
    ).
    При проверке отсутствия сдвига в дисперсии (в характеристи- ках рассеяния) предполагается, что наблюдаемая последовательность измерений
    1
    , ...,
    n
    x
    x
    имеет одно и то же среднее . Проверяется гипо- теза
    0
    H
    :
    2 2
    2 1
    0
    n
    (
    2 0
    неизвестно) против конкурирующей гипотезы
    1
    :
    H
    2 2
    2 2
    1 2
    0
    ;
    k
    2 2
    2 2
    1 2
    0
    k
    k
    n
    (
    0
    ), утверждающей, что значение дисперсии меняется в некоторой неизвестной точке, то есть
    k
    неизвестно (
    1 1
    k
    n
    ).
    В настоящей работе продолжены исследования совокупности

    4 критериев, ориентированных на проверку гипотез отсутствия тренда в средних и дисперсиях [6]. Исследования опирались на развиваемые компьютерные технологии исследования статистических закономер- ностей, в основе которых лежит методика статистического модели- рования и развиваемое программное обеспечение [7]. Объем выборок моделируемых распределений статистик, на которых строились выводы по работе, как правило, составлял величину от
    4 10 до
    6 10 в зависимости от требуемой точности.
    2. Критерий автокорреляции
    Если выборка значений случайна, то значение каждого ее элемента не должно зависеть от величины предшествующего и последующего членов.
    Для проверки этой независимости используется статистика [8]
    2 1
    1 1
    1 1
    1,
    2 2
    1 1
    n
    n
    i
    i
    i
    n
    i
    i
    n
    n
    n
    i
    i
    i
    i
    n
    x x
    x
    nx x
    r
    n
    x
    x
    ,
    (1) являющаяся коэффициентом корреляции первого порядка между элементами первичной выборки (
    1
    ,...,
    n
    x
    x
    ) и элементами выборки, полученной из нее сдвигом на одну единицу (
    2 3
    1
    ,
    ,...,
    ,
    n
    x x
    x x
    ).
    Величина
    1,n
    r
    распределена асимптотически нормально с математическим ожиданием и дисперсией
    1,
    1
    [
    ]
    1
    n
    E r
    n
    ,
    1,
    2
    (
    3)
    [
    ]
    (
    1)(
    1)
    n
    n n
    D r
    n
    n
    Поэтому в критерии используют нормализованную статистику

    5 1,
    1,
    *
    1,
    1,
    [
    ]
    [
    ]
    n
    n
    n
    n
    r
    E r
    r
    D r
    ,
    (2) которая подчиняется стандартному нормальному закону (0,1)
    N
    Асимптотическими результатами можно пользоваться и при достаточно малых объемах выборок. Исследование распределений статистики (2) методами статистического моделирования показало, что при
    10
    n
    распределение статистики достаточно хорошо согласу- ется со стандартным нормальным законом. В качестве примера в таб- лице 1 приведены результаты проверки согласия полученных в ре- зультате моделирования эмпирических распределений статистики (2) со стандартным нормальным законом для объемов выборок
    10,15, 20, 25
    n
    Таблица 1. Проверка согласия эмпирического распределения статистики (2) со стандартным нормальным законом
    n
    Критерий согласия
    *
    S
    *
    {
    }
    P S
    S
    10 2
    Пирсона
    98.325 9.3853e-18
    Колмогорова
    2.3636 2.8081e-05 2
    Крамера-Мизеса-Смирнова
    1.2307 0.0007 2
    Андерсона-Дарлинга
    8.2358 8.8646e-05 15 2
    Пирсона
    60.920 3.0736e-10
    Колмогорова
    1.6246 0.0102 2
    Крамера-Мизеса-Смирнова
    0.7182 0.0115 2
    Андерсона-Дарлинга
    4.8892 0.0032 20 2
    Пирсона
    20.862 0.0075
    Колмогорова
    1.1880 0.1189 2
    Крамера-Мизеса-Смирнова
    0.3196 0.1192 2
    Андерсона-Дарлинга
    2.0998 0.0810 25 2
    Пирсона
    24.353 0.0020
    Колмогорова
    1.1502 0.1418 2
    Крамера-Мизеса-Смирнова
    0.2994 0.1357 2
    Андерсона-Дарлинга
    1.7711 0.1232
    Проверка осуществлялась для выборок статистик объемом
    4 10
    N
    по критериям
    2
    Пирсона, Колмогорова,
    2
    Крамера-

    6
    Мизеса-Смирнова,
    2
    Андерсона-Дарлинга. В случае критерия
    2
    Пирсона использовалось асимптотически оптимальное группирование с разбиением на 9 интервалов [9, 10]. По достигнутым уровням значимости, представляющим собой вероятность
    *
    {
    }
    P S
    S
    , где
    S
    – статистика соответствующего критерия согласия, а
    *
    S – значение статистики критерия, вычисленное по анализируемой выборке, можно судить о сходимости распределений статистики (2) к стандартному нормальному закону.
    Критерий автокорреляции относится к параметрическим крите- риям, в этой связи были проведены исследования распределений ста- тистики критерия для случая принадлежности случайной величины различным законам, в том числе семейству с плотностью
    2 0
    2 1
    2 1
    exp
    2 1 /
    x
    f x
    (3) с параметрами формы
    2 0,2; 0,5; 1; 1,5; 2; 4; 8. В этом случае вид закона менялся от близкого к распределению Коши, до близкого к равномерному закону. При
    2 2
    выражение (3) дает плотность нор- мального закона распределения. Полученные в результате моделиро- вания распределения статистики критерия автокорреляции в случае принадлежности случайной величины законам распределения семей- ства (3) при различных параметрах формы представлены на рис. 1.
    Как следует из представленной на рисунке картины, в случае принадлежности выборок
    1
    , ...,
    n
    x
    x
    достаточно широкому кругу зако- нов распределение статистики критерия автокорреляции существенно не отличается от распределения, имеющего место в случае принад- лежности
    1
    , ...,
    n
    x
    x
    нормальному закону. Если закон, которому принадлежат случайные величины, симметричен и с не слишком тя-

    7 желыми хвостами, то распределение статистики не отличается зна- чимо от “классического”.
    При сильной асимметричности закона распределения случайных величин (например, в случае показательного закона) распределение статистики становится отличным от “классического”. В то же время, асимметричность закона влияет на распределение статистики менее значимо, чем “тяжесть” хвостов. В случае принадлежности выборок
    1
    ,...,
    n
    x
    x
    асимметричным законам экстремальных значений (мини- мального или максимального) распределения статистики практически не отличаются от “классического”.
    Рис. 1. Функции распределения статистики критерия автокорреляции в зависимости от параметра формы семейства (3) при
    25
    n
    Отметим, что влияние закона распределения случайных величин на распределение статистики критерия автокорреляции такое же, как для критериев, связанных с проверкой гипотез о парной корреляции
    [11].

    8
    3. Критерий Фостера-Стюарта
    Этот непараметрический критерий используется для проверки отсутствия тренда как в средних, так и в дисперсиях (в харак- теристиках рассеяния). Соответствующие статистики критерия имеют вид [12]:
    2
    n
    i
    i
    S
    S
    ,
    (4)
    2
    n
    i
    i
    d
    d
    ,
    (5) где
    i
    i
    i
    d
    u
    l
    ,
    i
    i
    i
    S
    u
    l
    ;
    1
    i
    u
    , если
    1 2
    1
    ,
    , ...,
    i
    i
    i
    x
    x
    x
    x
    , иначе
    0
    i
    u
    ;
    1
    i
    l
    , если
    1 2
    1
    ,
    , ...,
    i
    i
    i
    x
    x
    x
    x
    , иначе
    0
    i
    l
    Критерий со статистикой
    S
    используется для проверки наличия тренда в дисперсиях, а со статистикой
    d
    – для обнаружения тренда в средних. Очевидно, что
    0 1
    S
    n
    и
    (
    1)
    1
    n
    d
    n
    При отсутствии тренда величины
    t
    и
    t
    :
    ˆ
    d
    d
    t
    ,
    (6)
    ˆ
    S
    S
    t
    ,
    (7) где
    2 1
    2
    n
    i
    i
    ,
    ˆ
    2ln
    0,8456
    d
    n
    ,
    2 2
    1
    ˆ
    4 2ln
    3, 4253
    n
    S
    i
    n
    i
    , приближенно описываются распределением Стьюдента с
    n степенями свободы.
    Проверяемая гипотеза об отсутствии соответствующего тренда отклоняется при больших по модулю значениях статистик (6), (7).

    9
    На самом деле областью определения статистик
    t
    и
    t
    является область дискретных значений. Исследование распределений статистик показало, что даже при достаточно больших объемах выборок (
    100, 200
    n
    ) дискретные распределения статистик критерия
    существенно отличаются от распределения Стьюдента с
    n
    степенями свободы. На рис. 2 показаны функции распределения статистики
    t
    , а на рис. 3 – распределения статистики
    t
    , которые отличается еще большей дискретностью.
    Рис. 2. Функции распределения статистики критерия Фостера-Стюарта для обнаружения тренда в средних при различных объемах выборок
    Следовательно, использование распределений Стьюдента вместо истинных дискретных распределений статистик для определения достигнутого уровня значимости может приводить к ошибкам.

    10
    Рис. 3. Функции распределения статистики критерия Фостера-Стюарта для обнаружения тренда в дисперсиях при различных объемах выборок
    4. Критерий Кокса-Стюарта
    Как и предыдущий, данный непараметрический критерий используется для проверки последовательности измерений на предмет наличия тренда в среднем и в дисперсии.
    В критерии проверки отсутствия тренда в средних значениях в выборке объема
    n
    используется статистика [13]
    2 1
    ,
    1 1
    (
    2 1)
    n
    i n i
    i
    S
    n
    i
    h
    ,
    (8) где
    ,
    1
    i j
    h
    , если
    i
    j
    x
    x
    , и
    ,
    0
    i j
    h
    , если
    i
    j
    x
    x
    (
    i
    j
    ).
    Нормализованная статистика
    *
    1 1
    1 1
    [ ]
    [ ]
    S
    E S
    S
    D S
    ,
    (9) где
    2 1
    [ ]
    8
    n
    E S
    ,
    2 1
    (
    1)
    [ ]
    24
    n n
    D S
    , при справедливости проверяемой гипотезы об отсутствии тренда

    11 приближенно подчиняется стандартному нормальному закону.
    Распределение статистики
    *
    1
    S
    является дискретным и при малых
    n
    следует учитывать его отличие от стандартного нормального (см. рис. 4 при
    10
    n
    ). При объемах выборок порядка
    100
    n
    отличием распределения статистики от стандартного нормального закона при проведении анализа практически можно пренебречь и использовать для вычисления достигнутого уровня значимости функцию распределения стандартного нормального закона. Если реальные объемы выборок меньше, используя критерий и вычисляя достигнутый уровень значимости для полученного значения статистики
    *
    1
    S
    в соответствии со стандартным нормальным законом, надо иметь в виду введение возможной поправки на дискретность.
    Рис. 4. Сходимость к стандартному нормальному закону функции распределения статистики (9) критерия Кокса-Стюарта для обнаружения тренда в средних
    Критерий для проверки гипотезы отсутствия тренда в дисперсии
    (в характеристиках рассеяния) строится следующим образом.
    Выборка
    1
    ,...,
    n
    x
    x
    разбивается на [ / ]
    n k подвыборок объемом
    k
    элементов
    1
    ,...,
    k
    x
    x
    ;
    1 2
    ,...,
    k
    k
    x
    x
    ;
    2 1
    3
    ,...,
    k
    k
    x
    x
    ; ...;
    1
    ,...,
    n k
    n
    x
    x
    (если
    n
    не

    12 делится на
    k
    , отбрасывается необходимое число измерений в центре).
    Для каждой
    i
    -й подвыборки находится размах
    i
    w
    (1
    )
    i
    r (
    r
    n k
    ). Далее последовательность размахов
    i
    w
    проверяется на наличие тренда критерием со статистикой
    1
    S
    Величину
    k
    в [13] рекомендуется выбирать из следующих соотношений:
    90 5
    n
    k
    ;
    64 90 4
    n
    k
    ;
    48 64 3
    n
    k
    ;
    48 2
    n
    k
    Дискретность распределения статистики
    *
    1
    S
    при обнаружении тренда в дисперсии заметно выше (см. рис. 5), это естественно, так как анализируемая выборка размахов содержит лишь [ / ]
    n k элементов.
    Рис. 5. Сходимость к стандартному нормальному закону функции распределения статистики критерия Кокса-Стюарта для обнаружения тренда в дисперсиях
    5. Критерий Вальда-Вольфовитца
    Статистика критерия Вальда-Вольфовитца, предложенная в [14], основана на коэффициенте сериальной корреляции и имеет вид:

    13 1
    1 1
    1 1
    n
    i
    i
    n
    i
    R
    x x
    x x
    (10)
    Величина
    1
    R
    распределена асимптотически нормально с математическим ожиданием и дисперсией
    2 1
    1 2
    [
    ]
    (
    ) / (
    1)
    E R
    S
    S
    n
    ,
    4 2
    2 2
    2 2
    1 1
    2 1
    3 2
    4 2
    4 1
    2 1
    2 4
    4 2
    (
    )
    [
    ]
    1
    (
    1)(
    2)
    (
    1)
    S
    S S
    S S
    S
    S
    S
    S
    S
    S
    D R
    n
    n
    n
    n
    , где
    1
    r
    r
    r
    n
    S
    x
    x
    Нормализованная статистика
    *
    1 1
    1 1
    [
    ]
    [
    ]
    R
    E R
    R
    D R
    (11) подчиняется стандартному нормальному закону (0,1)
    N
    Исследование распределений статистики (11) в зависимости от объема выборки и для случая нарушения предположения о нормальности анализируемых выборок показало результаты, аналогичные для статистики (1): быструю сходимость распределения статистики (11) к стандартному нормальному закону и устойчивость этого распределения по отношению к отклонениям анализируемых данных от нормального закона.
    В работе [14] была отмечена возможность построения непараметрического аналога сериального коэффициента корреляции.
    Такой аналог был предложен в работе [15]. Пусть
    i
    R
    – ранг измерения
    i
    x
    в упорядоченном по возрастанию ряду значений
    1 2
    ,
    ,...,
    n
    x x
    x
    Ранговый критерий сериальной корреляции Вальда-Вольфовитца имеет вид [15]:
    1 1
    1 1
    1 2
    2
    n
    i
    i
    i
    n
    n
    R
    R
    R
    (12)
    Распределение этой статистики асимптотически нормально со

    14 средним и дисперсией
    [ ]
    0
    E R
    ,
    2
    (
    1)(
    3)(5 6)
    [ ]
    720
    n n
    n
    n
    D R
    Гипотеза случайности (об отсутствии тренда) отклоняется при больших по модулю значениях статистики
    *
    [ ]
    R
    R
    D R
    (13)
    Результаты моделирования показали, что распределение статистики (13) критерия смещено по отношению к предельному и очень медленно сходится к стандартному нормальному закону (см. рис. 6). Дискретностью же распределения статистики практически можно пренебречь.
    Рис. 6. Сходимость к стандартному нормальному закону распределения статистики (13) критерия Вальда-Вольфовитца
    6. Критерий Бартелса
    Пусть в последовательности
    n
    измерений
    i
    R
    – ранг
    i
    -го наблюдения
    i
    x
    . Бартелсом [16] был предложен ранговый критерий

    15 случайности ряда, основанный на статистике
    1 2
    1 1
    2 1
    (
    )
    (
    )
    n
    i
    i
    i
    n
    i
    i
    R
    R
    B
    R
    R
    (14)
    Гипотеза о случайности (об отсутствии тренда) отклоняется при больших по модулю значениях статистики
    *
    [ ]
    2
    [ ]
    2 5 (5 7)
    B
    E B
    B
    B
    D B
    n
    ,
    (15) которая при отсутствии тренда приближенно подчиняется стандартному нормальному закону.
    Исследования показали, что распределение статистики достаточно быстро сходится к стандартному нормальному (см. рис. 7).
    Рис. 7. Сходимость к стандартному нормальному закону распределения статистики критерия Бартелса
    7. Критерий Хсу
    Критерий обнаружения сдвига дисперсий основан на статистике
    [17]
    2 1
    2 1
    (
    1)(
    )
    (
    1)
    (
    )
    n
    i
    x
    i
    n
    i
    x
    i
    i
    x
    m
    H
    n
    x
    m
    ,
    0 1
    H
    (16)

    16
    Обычно критерий используется в стандартизированной форме
    *
    0,5
    [
    ]
    H
    H
    D H
    ,
    (17) где
    1
    [
    ]
    6(
    1)(
    2)
    n
    D H
    n
    n
    . Статистика (17) при справедливости гипотезы об отсутствии сдвига дисперсии подчиняется стандартному нормальному закону.
    Результаты моделирования показали, что при
    30
    n
    распределение статистики достаточно хорошо согласуется со стан- дартным нормальным законом (см. рис. 8).
    Рис. 8. Сходимость распределения статистики (17) критерия Хсу к стандартному нормальному закону
    Критерий Хсу относится к параметрическим критериям. По- этому, как и в случае любого параметрического критерия, связанного с проверкой гипотез о дисперсиях, распределения его статистики за- висят от закона, которому принадлежат анализируемые случайные ве- личины. Полученные в результате моделирования распределения ста-

    17 тистики критерия (17) в случае принадлежности случайных величин
    (ошибок измерений) законам распределения семейства (3) при раз- личных параметрах формы представлены на рис. 9.
    Рис. 9. Распределения статистики (17) в случае принадлежности случайных величин законам семейства (3) при различных значениях параметра формы
    30
    n
    Как можно видеть, распределения статистики (17) сильно зависит от закона распределения, которому принадлежат случайные величины. При этом наибольшее отклонение от стандартного нормального закона оказывается в случае принадлежности случайных величин законам с тяжелыми хвостами. Существенно влияет на распределение статистики и асимметричность закона.
    В [17] описан критерий, позволяющий определить точку изменения дисперсии в случае принадлежности ошибок измерений нормальному закону. Его статистика строится следующим образом.
    Пусть для
    1, 2,...,
    1
    k
    n
    2 1
    (
    )
    k
    k
    i
    x
    i
    w
    x
    m
    ,

    18
    n
    k
    k
    k
    w
    w
    k
    W
    w
    n
    k
    где
    k
    соответствует искомой точке изменения дисперсии.
    Далее из уравнения
    (
    , )
    k
    k
    F
    n k k
    W
    , где
    1 2
    ( ,
    )
    F f f

    - квантиль
    F
    - распределения Фишера с
    1
    f
    и
    2
    f
    степенями свободы, находятся оценки
    k
    , которые должны подчиняться равномерному закону. Статистика G-критерия имеет вид
    1 1
    1 1
    n
    k
    k
    G
    n
    ,
    0 1
    G
    (18)
    Гипотеза об отсутствии изменения дисперсии отклоняется с уровнем значимости
    , если
    1
    G
    G
    . В этом случае значение
    k
    , которому соответствует максимальная величина
    1 2
    k
    , дает оценку искомой точке изменения значения дисперсии в наблюдаемом ряду. Критические значения
    1
    G
    можно найти в [1].
    Как и критерий со статистиками (16)–(17) данный критерий применим только при извлечении выборок из нормальной гене- ральной совокупности.
    8. Ранговый критерий обнаружения сдвига дисперсии
    Ранговый критерий обнаружения сдвига дисперсии (харак- теристики рассеяния) в неизвестной точке основан на использовании семейства ранговых статистик вида [18]
    1
    (
    )
    n
    R
    n
    i
    i
    S
    ia R
    ,
    (19) где
    i
    R
    - ранги выборочных значений в упорядоченном ряду измерений.
    Метки критерия
    n
    a
    могут быть различными, например:

    19
    – метки Клотца
    2 1
    (
    1)
    ( )
    n
    i n
    a
    i
    U
    , где
    U

    -квантиль стандартного нормального закона;
    – метки Сэвиджа
    2 1
    1
    ( )
    1
    i
    n
    j
    a
    i
    n
    j
    Соответствующие (19) статистики обозначим
    ,
    1
    (
    )
    n
    R j
    jn
    i
    i
    S
    ia
    R
    ,
    1, 2
    j
    . При отсутствии сдвига дисперсии в ряду измерений
    ,
    R j
    S
    - статистики свободны от распределения и симметричны относительно
    ,
    1 1
    [
    ]
    ( )
    2
    n
    R j
    jn
    i
    n
    E S
    a
    i
    При
    15
    n
    и справедливости гипотезы об отсутствии сдвига в характеристике рассеяния случайной величины статистики
    ,
    ,
    *
    ,
    ,
    [
    ]
    [
    ]
    R j
    R j
    R j
    R j
    S
    E S
    S
    D S
    ,
    (20) где
    2
    ,1
    (
    1)
    1 1
    [
    ]
    2
    n
    R
    i n
    i
    n
    E S
    U
    ,
    ,2
    (
    1)
    [
    ]
    ;
    2
    R
    n n
    E S
    2 4
    ,1
    (
    1)
    ,1 1
    (
    1)
    1
    [
    ]
    [
    ]
    12 3
    3
    n
    R
    i n
    R
    i
    n n
    D S
    U
    E S
    n
    ;
    ,2 1
    (
    1)
    1
    [
    ]
    12
    n
    R
    j
    n n
    D S
    n
    j
    , приближенно подчиняются стандартному нормальному закону (см. рис. 10 и 11).

    20
    Рис. 10. Сходимость к стандартному нормальному закону распределения статистики
    *
    ,1
    R
    S
    рангового критерия (с метками Клотца) обнаружения сдвига дисперсии в неизвестной точке
    Рис. 11. Сходимость к стандартному нормальному закону распределения статистики
    *
    ,2
    R
    S
    рангового критерия (с метками Сэвиджа) обнаружения сдвига дисперсии в неизвестной точке
    9. Сравнительный анализ мощности критериев
    Анализ мощности критериев проводился для ситуации принадлежности наблюдаемых случайных величин нормальному

    21 закону. Проверяемой гипотезе
    0
    H
    соответствует выполнение предположения о независимости наблюдаемых случайных величин
    (отсутствие тренда).
    В качестве конкурирующих гипотез рассматривались различные ситуации при наличии тренда в средних или в дисперсии.
    При исследовании мощности критериев об отсутствии тренда в средних рассматривались модели задания линейного, периодического и смешанного тренда.
    В случае наличия линейного тренда случайные величины моделировались в соответствии с
    i
    i
    x
    a t
    ,
    (21) где
    i
    представляют собой независимые случайные величины, распределѐнные в соответствии с заданным законом (например, по стандартному нормальному закону),
    [0,1]
    t
    Справедливой проверяемой гипотезе
    0
    H
    соответствует значение параметра
    0
    a
    Величины
    i
    x
    (21) вычислялись в соответствии с выражением
    (
    1)
    i
    i
    x
    a i
    t
    , где шаг
    t
    определялся как
    1/
    t
    n
    в зависимости от объема выборки
    n
    . Псевдослучайные величины
    i
    генерировались в соответствии со стандартным нормальным законом
    (возможно и по любому другому). Исследовалась мощность критерия относительно конкурирующих гипотез с линейным трендом, задаваемым параметром
    0.5
    a
    и
    4
    a
    .
    Соответствующие конкурирующие гипотезы обозначены в дальнейшем как
    1
    H
    ,
    2
    H
    Примеры временных рядов при тренде с параметром
    0.5
    a
    и
    4
    a
    при объеме выборки
    100
    n
    приведены на рис.12а и 12б.

    22
    Рис. 12а. Линейный тренд при
    0.5
    a
    Рис. 12б. Линейный тренд при
    4
    a
    В случае периодического тренда случайные величины моделировались в соответствии с соотношением sin(2 )
    i
    i
    x
    a
    t
    ,
    (22) а в случае смешанного – в соответствии с sin(2 )
    i
    i
    x
    a t
    a
    t
    (23)
    Рис.13. Мощность критериев тренда и случайности относительно конкурирующих гипотез с линейным трендом
    На рис. 13 для уровня значимости
    0.05
    приведены значения мощности 1
    рассматриваемых в данной работе критериев тренда и

    23 случайности относительно конкурирующих гипотез
    1
    H
    (при
    0.5
    a
    ) и
    2
    H
    (при
    4
    a
    ) с линейным трендом (21) в зависимости от объема выборки
    n
    . Анализ мощности критериев показал, что критерий
    Фостера-Стюарта (
    t
    ) значительно уступает критериям Кокса-Стюарта
    (
    *
    1
    S
    ), критерию автокорреляции (
    *
    1,n
    r
    ), Вальда-Вольфовитца (
    *
    R
    ) и
    Бартелса (
    *
    B
    ).
    Рассматриваемые критерии проверки гипотез об отсутствии тренда в средних, включая критерий Аббе, можно упорядочить по мощности (относительно линейного тренда) следующим образом:
    Аббе (
    A
    S
    )
    Кокса-Стюарта (
    *
    1
    S
    )
    Бартелса (
    *
    B
    ) ранговой сериальной корреляции Вальда-Вольфовитца (
    *
    R
    ) автокорреляции
    (
    *
    1,n
    r
    ), сериальной корреляции Вальда-Вольфовитца (
    *
    1
    R
    )
    Фостера-
    Стюарта (
    t
    ). Если рассматривать в качестве конкурирующих гипотез наличие произвольного тренда, то целесообразно рекомендовать использование критериев Аббе, Бартелса, Вальда-Вольфовитца
    (ранговый и неранговый вариант) и автокорреляции.
    Критерий Фостера-Стюарта показал наименьшую мощность. В определенной степени данный результат объясняется сильной дискретностью распределения статистики критерия Фостера-Стюарта.
    Вследствие дискретности действительный уровень значимости существенно отличается от задаваемого
    0.05
    и получаемые оценки мощности оказываются заниженными.
    При исследовании мощности критериев обнаружения тренда в характеристиках рассеяния в качестве конкурирующих гипотез рассматривалась ситуация с линейным трендом в дисперсии.
    Исследовалась мощность критериев Фостера-Стюарта (
    t
    ), Кокса-
    Стюарта (
    *
    1
    S
    ), автокорреляции (
    *
    1,n
    r
    ), ранговой сериальной корреляции

    24
    Вальда-Волфовитца
    (
    *
    R
    ), сериальной корреляции
    Вальда-
    Вольфовитца (
    *
    1
    R
    ) и Бартелса (
    *
    B
    ). Оказалось, что критерии
    Фостера-Стюарта и Кокса-Стюарта, специально построенные для выявления тренда в дисперсии, весьма значительно превосходят по мощности остальные критерии. Для обнаружения тренда в дисперсии можно рекомендовать к применению критерии Фостера-Стюарта и
    Кокса-Стюарта, расположив их по предпочтению:Фостера-Стюарта (
    t
    ) Кокса-Стюарта (
    *
    2
    S
    ) .
    При исследовании мощности критериев сдвига дисперсии в неизвестной точке в качестве конкурирующих гипотез рассматривалось наличие скачкообразного сдвига в величине дисперсии.
    Исследовалась мощность ранговых критериев обнаружения сдвига дисперсии в неизвестной точке с метками Клотца
    (
    *
    ,1
    R
    S
    ), с метками Сэвиджа (
    *
    ,2
    R
    S
    ), критерия Хсу (
    *
    H
    ) и G-критерия. В случае принадлежности случайных величин нормальному закону критерии сдвига дисперсии в неизвестной точке можно упорядочить следующим образом: критерий Хсу (
    *
    H
    ) критерий сдвига дисперсии с метками Клотца (
    *
    ,1
    R
    S
    )
    G-критерий (
    G
    )
    Критерий сдвига дисперсии с метками Сэвиджа (
    *
    ,2
    R
    S
    ).
    10. Заключение
    Таким образом, на основании проведенных исследований, можно констатировать, что применение параметрических критериев обнаружения тренда в средних (критерий автокорреляции, Аббе) будет корректным и в тех случаях, когда мы имеем дело с законом, существенно отличающимся от нормального (но симметричным и без
    “тяжелых” хвостов).
    Это общая тенденция устойчивости распределений параметрических критериев так или иначе связанных с

    25 проверкой гипотез о математических ожиданиях [19, 20, 21] или проверкой гипотез о равенстве нулю коэффициентов парной, частной и множественной корреляции [11]. Однако параметрические критерии обнаружения тренда в средних лишь не многим превосходят по мощности непараметрические.
    Параметрические критерии обнаружения сдвига в дисперсии
    (критерий Хсу) мощнее непараметрических, но очень чувствительны к нарушению предположений о нормальности случайных величин (как и любые критерии, связанные с проверкой гипотез о дисперсиях [19,
    22, 23, 24, 25, 26, 27]).
    Использование критериев
    Фостера-Стюарта затруднено дискретностью распределений статистик и плохой сходимостью к соответствующим t-распределениям Стьюдента.
    Распределение статистики рангового критерия сериальной корреляции Вальда-Вольфовитца смещено относительно стандартного нормального закона, к которому очень медленно сходится. При использовании нерангового критерия такой проблемы не возникает.
    Полученные оценки мощности критериев позволяют судить о способности критериев обнаруживать наличие линейного и нелинейного тренда в среднем или в характеристиках рассеяния.
    Работа выполнена при поддержке РФФИ (проект № 09-01-
    00056а) и Федеральной целевой программы Минобрнауки РФ
    “Научные и научно-педагогические кадры инновационной России”.
    Список литературы
    1. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. – М.: ФИЗМАТЛИТ, 2006. – 816 с.
    2. Струнов В.И.. О применении критерия Аббе для анализа независимости рядов измерений, характеризующихся отличными от

    26 нормального законами распределения // Измерительная техника. 2006.
    № 8. – С. 13-17.
    3. Strunov V.I. Applying the Abbé test to the independence of measurement series with distributions deviating from normal //
    Measurement Technique. Vol. 49, No. 8, 2008. – P.962-969.
    4. Лемешко С.Б. Критерий независимости Аббе при нарушении предположений нормальности // Измерительная техника. 2006. № 10.
    – С.9-14.
    5. Lemeshko S.B. The Abbé independence test with deviations from normality // Measurement Technique. Vol. 49, No. 10, 2006. – P.962-969.
    6. Беркович А.С., Лемешко Б.Ю., Щеглов А.Е. Исследование распределений статистик критериев тренда и случайности //
    Материалы X международной конференции “Актуальные проблемы электронного приборостроения” АПЭП-2010. Новосибирск, 2010. –
    Т.6. – С.13-17.
    7. Лемешко Б.Ю., Постовалов С.Н. Компьютерные технологии анализа данных и исследования статистических закономерностей:
    Учеб. пособие. – Новосибирск: Изд-во НГТУ, 2004. – 120 с.
    8. Knoke J.D. Testing for randomness against autocorrelation: The parametric case // Biometrica. 1975. – V.62. – P.571-575.
    9. Денисов В.И., Лемешко Б.Ю., Постовалов С.Н. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Методические рекомендации. Часть I. Критерии типа
    χ
    2
    . – Новосибирск: Изд-во НГТУ, 1998. – С. 126.
    10. Р
    50.1.033-2001.
    Рекомендации по стандартизации.
    Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. –
    М.: Изд-во стандартов. 2002. – 87 с.

    27 11. Лемешко Б.Ю., Помадин С.С. Исследование распределений статистик корреляционного анализа при отклонении многомерного закона от нормального // Тр. V международной конференции "Актуальные проблемы электронного приборостроения" АПЭП-2000.
    Новосибирск, 2000. - Т. 7. - С. 184-187.
    12. Foster F.G., Stuart A. Distribution-free tests in time series dated on the breaking of records // JRSS. 1954. – V. B16, №1. – P.1-22.
    13. Cox D.R., Stuart A. Quick sign tests for trend in location and dispersion // Biometrica. 1955. – V.42. – P.80-95.
    14. Wald A., Wolfowitz J. An exact test for randomness in the non- parametric case based on serial correlation // AMS. 1943. V. 14. P. 378-
    388.
    15. Dufour J.-M., Roy R. Some robust exact results on sample autocorrelations and tests of randomness// J. of Econometrics. 1985. V. 29,
    P. 257-273.
    16. Bartels R. The rank version of von Neumann’s ratio test for randomness // JASA. 1982. V. 77, №377. P. 40-46.
    17. Hsu D.A. Test for variance shift at an unknown time point // Appl.
    Statist., 1977. – V.26, № 3. – P.279-284.
    18. Hsieh H.K. Nonparametric tests for scale shift at a unknown time point // Commun. Stat. – Theor. Meth., 1984. – V.13. № 11. – P.1335-
    1355.
    19. Лемешко
    Б.Ю., Помадин С.С. Проверка гипотез о математических ожиданиях и дисперсиях в задачах метрологии и контроля качества при вероятностных законах, отличающихся от нормального // Метрология. 2004. – № 3.- С.3-15.
    20. Лемешко Б.Ю., Лемешко С.Б. Об устойчивости и мощности критериев проверки однородности средних // Измерительная техника.
    2008. № 9. – С.23-28.

    28 21. Lemeshko B.Yu., Lemeshko S.B. Power and robustness of criteria used to verify the homogeneity of means // Measurement Techniques.
    2008. Vol. 51, № 9. - P.950-959.
    22. Лемешко Б.Ю., Лемешко С.Б., Горбунова А.А. О применении и мощности критериев проверки однородности дисперсий. Ч. I.
    Параметрические критерии // Измерительная техника. 2010. № 3. –
    С.10-16.
    23. Lemeshko B.Yu., Lemeshko S.B., and A. A. Gorbunova.
    Application and power of criteria for testing the homogeneity of variances.
    Part I. Parametric criteria // Measurement Techniques, Vol. 53, No. 3,
    2010. – P.237-246.
    24. Лемешко Б.Ю., Лемешко С.Б., Горбунова А.А. О применении и мощности критериев проверки однородности дисперсий. Ч. II.
    Непраметрические критерии // Измерительная техника. 2010. № 5. –
    С.11-18.
    25. Lemeshko B.Yu., Lemeshko S.B., and A. A. Gorbunova.
    Application and power of criteria for testing the homogeneity of variances.
    Part II. Nonparametric criteria // Measurement Techniques, Vol. 53, No. 5,
    2010. – P.476-486.
    26. Лемешко Б.Ю., Миркин Е.П. Критерии Бартлетта и Кокрена в измерительных задачах при вероятностных законах, отличающихся от нормального // Измерительная техника. 2004. № 10. – С. 10-16.
    27. Lemeshko B., Mirkin E. Bartlett and Cochran tests in measurements with probability laws different from normal // Measurement
    Techniques, 2004, Vol. 47, № 10. – P. 960-968.

    29
    UDC 519.24
    Application of tests for trend detection and checking for randomness
    Lemeshko B.Yu., Komissarova A.S., Tsheglov A.E.
    Novosibirsk state technical university, Novosibirsk, Russia,
    e-mail: Lemeshko@fpm.ami.nstu.ru
    Abstract. An analysis of asymptotic distributions of various tests for trend detection in mean and variance is conducted. Disadvantages of applying several tests under analysis are registered. The results of a comparative test power analysis are presented.
    Keywords: test for trend detection, autocorrelation test, Foster-Stuart test, Cox-Stuart test, Wald-Wolfowitz test, Bartels test, Hsu test, rank tests for scale shift, test power


    написать администратору сайта