Главная страница
Навигация по странице:

  • 2.4. Индексы корреляции и детерминации для парной нелинейной регрессии, их смысловое значение, оценки и значимость

  • 3. Моделирование временных рядов

  • 3.3. Задачи прогнозирования с помощью временных рядов.

  • Компьютерные технологии и математическое моделирование. Компьютерные технологии и математическое


    Скачать 2.91 Mb.
    НазваниеКомпьютерные технологии и математическое
    Дата24.04.2023
    Размер2.91 Mb.
    Формат файлаpdf
    Имя файлаКомпьютерные технологии и математическое моделирование.pdf
    ТипУчебно-практическое пособие
    #1086176
    страница3 из 5
    1   2   3   4   5
    2.3. Средняя ошибка аппроксимации
    Средняя ошибка аппроксимации ̅–это еще одна величина, позволяющая судить о качестве модели. Это среднее отклонение расчетных значений от фактических, полученных по уравнению регрессии.
    ̅

    |
    ̂|
    |
    |
    Допустимый предел значений ̅ составляет 8-10%.
    Оценку значимости уравнения регрессии в целом производят на основании F-критерия Фишера. Величина F-критерия вычисляется по следующей формуле
    ( )
    ( ) и сравнивается с табличным, определенным по таблице распределения Фишера-Снедекора
    (
    )
    при уровне значимости

    39
    (задается в условии задачи) и числом степеней свободы и
    (в случае рассматриваемой линейной регрессии).
    Если
    (
    )
    то построенное уравнение линейной регрессии значимо.
    Если
    (
    )
    то построенное уравнение линейной регрессии незначимо.
    Кроме оценки значимости уравнения регрессии в целом с использованием F-критерия Фишера, можно проводить оценку значимости линейного уравнения регрессии, исследуя значимость коэффициентов регрессии и и линейного коэффициента корреляции с использованием t-критерия Стьюдента.
    При проверке статистической значимости оценок а и bвводятся статистические гипотезы о равенстве нулю параметров и теоретического уравнения регрессии:
    – нулевая гипотеза (
    – конкурирующая гипотеза) в случае, если речь идет о проверке статистической значимости параметра
    а, или
    – нулевая гипотеза (
    – конкурирующая гипотеза) в случае, если речь идет о проверке статистической значимости параметра
    b.
    Невозможность отклонения какой либо из гипотез означает статистическую незначимость соответствующего коэффициента и наоборот, отклонение от какой либо из гипотез означает, что соответствующий коэффициент статистически значим.
    Проверка статистических гипотез осуществляется при некотором уровне значимости. Чаще всего это 5% и 1% уровни значимости.
    Если отклоняется на 1% уровне значимости, то отклоняется на
    5% уровне значимости.
    Если принимается на 5% уровне значимости, то принимается на 1% уровне значимости.

    40
    Если отклоняется на 5% уровне значимости, то необходимо ее проверять на 1% уровне значимости и, если при этом уровне она принимается, то результаты проверки гипотезы приводятся для двух уровней значимости.
    Вычисляются
    1.


    (
    ̂ )
    2.

    ,
    √∑
    ,


    – стандартные ошибки (стандартные отклонения) коэффициентов , и соответственно.
    3.
    ,
    ,
    4.
    – фактическое значение t-критерия Стьюдента при заданном уровне значимости и числе степеней свободы
    Затем производится сравнение полученных в третьем пункте значений с
    Если |
    |
    , то коэффициент статистически значим;
    Если |
    |
    , то коэффициент статистически незначим.
    Если |
    |
    , то коэффициент статистически значим;
    Если |
    |
    , то коэффициент статистически незначим.
    Если |
    |
    , то линейный коэффициент корреляции статистически значим;
    Если |
    |
    , то линейный коэффициент корреляции статистически незначим.
    Часто при проверке качества коэффициентов используют «грубое правило»:

    Если |
    | , то коэффициент статистически незначим;

    41

    Если |
    | , то коэффициент относительно слабо значим, рекомендуется воспользоваться таблицей критических точек распределения Стьюдента;

    Если |
    | , то коэффициент значим (это утверждение считается гарантированным при объеме выборки больше 20 и уровне значимости больше либо равном 0,05);

    Если |
    | , то коэффициент считается сильно значимым (вероятность ошибки при достаточном числе наблюдений не превосходит 0,001).
    Статистическая незначимость того или иного коэффициента означает случайную природу его формирования. Статистическая значимость - формирование под влиянием систематически действующего фактора X.
    После проверки статистической значимости коэффициентов регрессии рассчитываются доверительные интервалы для коэффициентов регрессии по следующей схеме:
    1.
    Определяются предельные ошибки для каждого коэффициента
    ,
    ;
    2.
    Составляются доверительные интервалы
    (
    ) – для параметра ;
    (
    ) – для параметра .
    Если в границы доверительного интервала попадает ноль, то оцениваемый параметр принимается равным нулю (статистически незначимым), поскольку не может принимать одновременно положительное и отрицательное значение.
    Доверительный интервал прогноза для парной линейной регрессии:

    42
    Обозначим
    – значение факторного признака, для которого надо вычислить точечный прогноз
    . Вычисляется это значение по уравнению линейной парной регрессии:
    Точное уравнение регрессии нам неизвестно. Поэтому мы не можем сделать точный прогноз. Можно только утверждать, что прогнозное значение результата при данном с вероятностью попадет в доверительный интервал. Вероятность называется уровнем надежности.
    Доверительный интервал прогноза индивидуального значения
    показателя
    в точке
    с заданным уровнем доверия следующий:
    (
    ), где стандартная ошибка индивидуального прогноза:

    (
    ̅)

    (
    ̅)
    Точность прогноза можно оценить с помощью относительной ошибки прогноза
    |
    |
    2.4. Индексы корреляции и детерминации для парной
    нелинейной регрессии, их смысловое значение, оценки и
    значимость
    Зачастую, с помощью линейной регрессии не удается удовлетворительно объяснить поведение зависимой переменной. В этом случае, для описания данных необходимо прибегнуть к построению моделей нелинейной регрессии.
    Различают два класса нелинейных регрессий:

    43 1.
    Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейных по оцениваемым параметрам, например,
    1.1.
    ̂
    – полиномиальная модель второй степени
    (целесообразна при наличии для рассматриваемого интервала фактора Х точки максимума или минимума показателя Y). Может, например, отражать зависимость между расходами на рекламу (Х) и прибылью (Y));
    1.2.
    ̂
    – полиномиальная модель третьей степени (может, например, отражать зависимость между объемом выпуска продукции (Х) и общими издержками (Y).
    В экономике наиболее часто используют многочлен второй степени, реже третьей степени. Ограничения в применении многочленов более высоких степеней связано с требованием однородности исследуемой совокупности: чем выше степень многочлена, тем больше изгибов имеет кривая и соответственно меньше однородность по результативному признаку. Графики многочленов имеют промежутки монотонности и точки экстремума, поэтому параметры применения этих моделей не всегда могут быть логически истолкованы. Поэтому, если такая зависимость четко не определена графически (параболическая), то ее лучше заменить другой нелинейной функцией.
    1.3.
    ̂
    – гиперболическая регрессия (используется в тех случаях, когда асимптотическое увеличение объясняющей переменной Х приближает зависимую переменную Y к некоторому пределу, например, может отражать зависимость между уровнем безработицы (Х) в процентах и процентном изменении заработной платы (Y));
    1.4.
    ̂ полулогарифмическая регрессия (используется в исследованиях влияния изменения независимой переменной Х на абсолютное изменение зависимой переменной Y, например, при анализе

    44 банковского вклада по его первоначальному значению и процентной ставки).
    2. Регрессии, нелинейные по оцениваемым параметрам, например,
    2.1.
    ̂
    – степенная регрессия. Эта функция может отражать: зависимость спроса Yна благо от его цены Х, в данном случае (b< 0), зависимость спроса Y на благо от его дохода Х, в данном случае (b>0), зависимость объѐма выпуска Y от использования ресурса Х, в данном случае (0
    2.2.
    ̂
    – показательная регрессия.Наиболее важным приложением этой функции является экономическая ситуация, когда анализируется изменение переменной у с постоянным темпом прироста во времени.
    2.3.
    ̂
    – экспоненциальная регрессия. Рассчитывает экспоненциальную кривую, наилучшим образом описывающую множество данных, для которых не выполняется условие пропорционального
    (линейного) изменения по времени. Например, ряд измерений роста населения всегда лучше описывается экспонентой, чем прямой линией.
    Для оценки параметров и нелинейной регрессии требуется провести линеаризациюпроцедуру, позволяющую представить нелинейную зависимость в виде линейной функции, и к вновь введенным переменным применить МНК.
    Если линеаризация невозможна, то применяются методы нелинейной регрессии.
    Линеаризацияосновных нелинейных моделей
    Функция
    Преобразования переменных
    Преобразование коэффициентов
    A
    B

    45
    ̂
    y
    ̂
    ̂
    x
    экспоненци альная
    ̂
    x
    Коэффициент эластичностипоказывает на сколько в среднем изменится результат, если фактор изменится на 1%. Для степенной функции коэффициент и естькоэффициент эластичности. Для остальных функций рассчитывается средний коэффициент эластичности по формуле
    ̅
    ( ̅)
    ̅
    ̅
    где ( )
    ̂ – уравнение регрессии.
    Вычисление коэффициента эластичности смысла не имеет, если для рассматриваемых признаков бессмысленно измерение в процентах.
    Показателем тесноты связи между признаками Х и Y служит индекс
    корреляции:
    √ где

    (
    ̅)

    (
    )
    ( ̅)

    (
    ̂ )
    Чем ближе значение индекса корреляции к единице, тем теснее связь между рассматриваемыми признаками.

    46
    Долю дисперсии результативного признака Y, объясняемую регрессией, в общей доле дисперсии результативного признака характеризует индекс детерминации, равный квадрату индекса корреляции и обозначаемый как
    С помощью индекса детерминации проводится проверка существенности в целом нелинейного уравнения регрессии. Для этого используется критерий Фишера-Снедекора:
    Вычисляется
    , где – число наблюдений, – число параметров при переменной x.
    По таблице распределения Фишера-Снедекора вычисляется
    (
    )
    при уровне значимости (задается в условии задачи) и числом степеней свободы и
    Если
    (
    )
    то построенное нелинейное уравнение регрессии значимо.
    Если
    (
    )
    то построенное нелинейное уравнение регрессии незначимо.
    Кроме этого, о качестве нелинейного уравнения регрессии можно судить и по средней ошибке аппроксимации, вычисляемой по формуле
    ̅

    |
    ̂|
    |
    |
    и которая должна быть меньше 10%, чтобы рассматриваемая нелинейная модель являлась адекватной.

    47
    3. Моделирование временных рядов
    3.1. Моделирование временного ряда. Основные элементы и
    характеристики временного ряда. Аддитивная и мультипликативная
    модели.
    Методы исследования моделей, основанных на данных пространственных выборок и временных рядов существенно отличаются.
    Объясняется это тем, что в отличие от пространственных выборок наблюдения во временных рядах нельзя считать независимыми.
    Под временным рядом(динамическим рядом, или рядом динамики) в экономике подразумевается последовательность наблюдений некоторого признака (случайной величины) Y в последовательные моменты времени.
    Отдельные наблюдения называются уровнями ряда, которые будем обозначать (
    ), где – число уровней.
    Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:
    1) факторы, формирующие тенденцию ряда;
    2) факторы, формирующие циклические колебания ряда;
    3) случайные факторы.
    В большинстве случаев фактический уровень временного ряда можно представить как сумму или произведение трендовой, циклической и случайной компонент:
    тренд,плавно меняющаяся компонента, описывающая чистое влияние долговременных факторов, то есть длительную тенденцию изменения признака (например, рост населения, экономическое развитие);

    сезонная
    компонента,
    отражающая повторяемость экономических процессов в течении не очень длительного периода (года,

    48 иногда месяца, недели, например, объем продаж товаров в различные времена года);
    случайная компонента, отражающая влияние не поддающихся учету и регистрации случайных факторов.
    Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного
    ряда. Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью
    временного ряда.
    3.2. Основные этапы анализа временных рядов:

    Графическое представление и описание поведения временного ряда;

    Выделение и удаление закономерных
    (неслучайных) составляющих временного ряда (тренда, сезонных и циклических составляющих);

    Сглаживание и фильтрация
    (удаление низко- или высокочастотных составляющих временного ряда);

    Исследование случайно составляющей временного ряда, построение и проверка адекватности математической модели для ее описания;

    Прогнозирование развития изучаемого процесса на основе имеющегося временного ряда;

    Исследование взаимосвязи между различными временными рядами.
    Среди наиболее распространенных методов анализа временных рядов выделим корреляционный и спектральный анализ, модели авторегрессии и скользящей средней.

    49
    3.3. Задачи прогнозирования с помощью временных рядов.
    Важнейшей классической задачей при исследовании экономических временных рядов является выявление и статистическая оценка основной тенденции развития изучаемого процесса и отклонений от нее.
    Среди наиболее распространенных методов анализа временных рядов выделим корреляционный и спектральный анализ, модели авторегрессии и скользящей средней.
    Автокорреляция. Коэффициенты автокорреляции.
    Автокорреляция уровней ряда – это корреляционная зависимость между последовательными уровнями временного ряда:

    (
    ̅̅̅)(
    ̅̅̅)
    √∑
    (
    ̅̅̅)

    (
    ̅̅̅)
    где
    ̅̅̅

    ;
    ̅̅̅

    –коэффициент автокорреляции уровней первого порядка;

    (
    ̅̅̅)(
    ̅ )
    √∑
    (
    ̅̅̅)

    (
    ̅ )
    где
    ̅̅̅

    ;
    ̅

    –коэффициент автокорреляции уровней второго порядка;
    Формулы для расчета коэффициентов автокорреляции старших порядков легко получить из формулы линейного коэффициента корреляции.
    Число периодов, по которым рассчитывается коэффициентавтокорреляции, называют лагом. С увеличением лага число парзначений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечениястатистической достоверности коэффициентов автокорреляциииспользовать правило – максимальный лаг должен быть не больше n/4.

    50
    Свойства коэффициента автокорреляции:
    1. Он строится по аналогии с линейным коэффициентомкорреляции и таким образом характеризует тесноту только линейнойсвязи текущего и предыдущего уровней ряда. Поэтому по коэффициентуавтокорреляции можно судить о наличии линейной (или близкой клинейной) тенденции.
    Для некоторых временных рядов, имеющихсильную нелинейную тенденцию (например, параболу второго порядкаили экспоненту), коэффициент автокорреляции уровней исходного рядаможет приближаться к нулю.
    2. По знаку коэффициента автокорреляции нельзя делать выводо возрастающей или убывающей тенденции в уровнях ряда.
    Большинствовременных рядов экономических данных содержат положительнуюавтокорреляцию уровней, однако при этом могут иметь убывающуютенденцию.
    Последовательность коэффициентов автокорреляции уровнейпервого, второго и т.д. порядков называют
    автокорреляционной функцией временного ряда. График зависимости ее значений от величинылага (порядка коэффициента автокорреляции) называетсякоррелограммой. Анализ автокорреляционной функции и коррелограммыпозволяетопределить лаг, при котором автокорреляция наиболее высокая, а, следовательно, и лаг, при котором связь между текущим и предыдущимиуровнями ряда наиболее тесная, т.е. при помощи анализаавтокорреляционной функции и коррелограммы можно выявитьструктуру ряда.
    Если наиболее высоким оказался коэффициент автокорреляциипервого порядка, исследуемый ряд содержит только тенденцию. Еслинаиболее высоким оказался коэффициент автокорреляции порядка k, торяд содержит циклические колебания с периодичностью в k
    моментоввремени. Если ни один из коэффициентов автокорреляции не являетсязначимым, можно сделать одно из двух предположений

    51 относительноструктуры этого ряда: либо ряд не содержит тенденции и циклическихколебаний, либо ряд содержит сильную нелинейную тенденцию, длявыявления которой нужно провести дополнительный анализ.
    Поэтомукоэффициент автокорреляции уровней и автокорреляционную функциюцелесообразно использовать для выявления во временном ряде наличияили отсутствия трендовой компоненты и циклической (сезонной) компоненты.
    Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний.
    Если амплитуда колебанийприблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
    Построение аддитивной, мультипликативной моделей сводится к расчету значений для каждого уровня ряда.
    Построение модели включает следующие шаги:
    1. выравнивание исходного ряда методом скользящей средней;
    2. расчет значений сезонной компоненты
    ;
    3. устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных в аддитивной или мультипликативной модели;
    4. аналитическое выравнивание уровней или в и расчет значений с использованием полученного уравнения тренда;
    5. расчет полученных по модели значений или ;
    6. расчет абсолютных и/или относительных ошибок.

    52
    Автокорреляция в остатках – корреляционная зависимость между значениями остатков
    (
    ̂ )за текущий и предыдущий моменты времени.
    Автокорреляция в остатках может быть вызвана несколькими причинами, имеющими различную природу.
    Она может быть связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака.
    В ряде случаев автокорреляция может быть следствием неправильной спецификации модели. Модель может не включать фактор, который оказывает существенное воздействие на результат влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени t.
    От истинной автокорреляции в остатках следует отличать ситуации, когда причина автокорреляции заключается в неправильной спецификации функциональной формы модели. В этом случае следует изменить форму модели, а не использовать специальные методы расчета параметров уравнения регрессии при наличии автокорреляции в остатках.
    Один из наиболее распространенных методов определения автокорреляции в остатках – это расчет критерия Дарбина – Уотсона:

    (
    )

    Можно показать, что при больших значениях nсуществует следующее соотношение между критерием Дарбина - Уотсона d и коэффициентом автокорреляции остатков первого порядка
    :
    (
    )
    Таким образом, если в остатках существует полная положительная автокорреляция и
    , то . Если в остатках полная отрицательная

    53 автокорреляция, то
    , и, следовательно, . Если автокорреляция остатков отсутствует, то
    , и . То есть .
    Алгоритм выявления автокорреляции остатков на основе критерия
    Дарбина– Уотсона:
    Выдвигается гипотеза об отсутствии автокорреляции остатков.
    Альтернативные гипотезы и состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках.
    Далее по специальным таблицам определяются критические значения Дарбина – Уотсона и для заданного числа наблюдений n, числа независимых переменных модели mи уровня значимости .
    По этим значениям числовой промежуток [ ]разбивают на пять отрезков.
    Принятие или отклонение каждой из гипотез с вероятностью осуществляется следующим образом:
    –есть положительная автокорреляция остатков, отклоняется; с вероятностью принимается гипотеза
    ;
    зона неопределенности;
    – нет оснований отклонять
    , то есть автокорреляция остатков отсутствует;
    – зона неопределенности;
    – есть отрицательная автокорреляция остатков, отклоняется; с вероятностью принимается гипотеза
    Если фактическое значение критерия Дарбина – Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу
    1   2   3   4   5


    написать администратору сайта