Рынок икт. Рынок ИКТ лабы. Решение систем линейных уравнений с помощью теоремы Крамера и с помощью обратной матрицы. Решение систем линейных уравнений методом ЖорданаГаусса. Построение экономикоматематической модели межотраслевого баланса модель затратывыпуск
Скачать 1.22 Mb.
|
4. Построение экономико-математической модели межотраслевого баланса (модель «затраты-выпуск»). Эффективное функционирование экономики предполагает наличие баланса между отдельными отраслями. Каждая отрасль при этом выступает двояко с одной стороны, как производитель некоторой продукции, ас другой - как потребитель продуктов, вырабатываемых другими отраслями. Для наглядного выражения 31 взаимной связи между отраслями используют таблицы определенного вида, которые называют таблицами межотраслевого баланса. В лабораторной работе рассматривается наиболее простой вариант модели межотраслевого баланса (модель Леонтьева, или модель «затраты-выпуск»). Алгебраическая теория анализа «затраты-выпуск» сводится к системе линейных уравнений, в которых параметрами являются коэффициенты затратна производство продукции. Пусть весь производственный сектор народного хозяйства разбит на n чистых отраслей. Чистая отрасль (это условное понятие) - некоторая часть народного хозяйства, более или менее цельная (например, энергетика, машиностроение, сельское хозяйство и т.п.). Пусть x ij - количество продукции й отрасли, расходуемое в й отрасли Xi - объем производства й отрасли заданный промежуток времени, так называемый валовой выпуск продукции i; y i - объем потребления продукции й отрасли внепроизводственной сфере, объем конечного потребления Z j - условно чистая продукция, которая включает оплату труда, чистый доходи амортизацию. Единицы измерения всех указанных величин могут быть или натуральными кубометры, тонны, штуки и т.п.), или стоимостными. В зависимости от этого различают натуральный и стоимостной межотраслевые балансы. Мы будем рассматривать стоимостной баланс. В таблице 2 отражена принципиальная схема межотраслевого баланса в стоимостном выражении. Таблица 2 - Принципиальная схема межотраслевого баланса в стоимостном выражении Производящие отрасли Потребляющие отрасли Конечный продукт Валовой продукт 1 2 … n 1 X 11 X 12 … X 1n y 1 X 1 2 X 21 X 22 … X 2n y 2 X 2 … … … … … … … N X n1 X n2 … X nn Условно чистая продукция Z 1 Z 2 … Z n n n у = Z j i=1 j =1 Валовой продукт X 1 X 2 … X n n n X i = X j i=1 j =1 Во-первых, рассматривая схему баланса по столбцам, можно сделать очевидный вывод, что итог материальных затрат любой потребляющей отрасли и ее условно чистой продукции равен валовой продукции этой отрасли. Данный вывод можно записать в виде соотношения n X j = x ij + Z i , j = 1,2,..., n. i=1 (2) Величина условно чистой продукции Z j , равна сумме амортизации, оплаты труда и чистого дохода й отрасли. Соотношение (2) охватывает систему из n уравнений, отражающих стоимостной состав продукции всех отраслей материальной сферы. 32 Во-вторых, рассматривая схему МОБ по строкам для каждой производящей отрасли, можно видеть, что валовая продукция той или иной отрасли равна сумме материальных затрат потребляющих ее продукцию отраслей и конечной продукции данной отрасли X j = x ij + y i , j = 1,2,..., n. j =1 (3) Формула (3) описывает систему из n уравнений, которые называются уравнениями распределения продукции отраслей материального производства по направлениям использования. Балансовый характер таблицы выражается в том, что n n X i = X j i=1 j =1 n n у = Z j i=1 j =1 Основу экономико-математической модели МОБ составляет матрица коэффициентов прямых затрата. Коэффициент прямых материальных затрата показывает, какое количество продукции й отрасли необходимо, если учитывать только прямые затраты, для производства единицы продукции й отрасли a ij = x ij X j , i, j = 1,2,..., n (4) Для дальнейшего рассмотрения модели Леонтьева сделаем два важных предположения. Первое состоит в том, что сложившуюся технологию производства считаем неизменной. Таким образом, матрица A = (а ij ) постоянна. Второе состоит в постулировании свойства линейности существующих технологий, те. для выпускай отраслью любого объема продукции X j необходимо затратить продукцию отрасли i в количестве a ij X j те. материальные издержки пропорциональны объему производимой продукции x ij = a ij * Xj (5) Подставляя (5) в балансовое соотношение (3), получаем n X i = a ij • X j + y i j =1 (6) или в матричной форме X = AX + Y (7) С помощью этой модели можно выполнять три вида плановых расчетов. • Задав в модели величины валовой продукции каждой отрасли (X i ), можно определить объемы конечной продукции каждой отрасли (Y i ): Y = (E –A) * X (8) n 33 • Задав величины конечной продукции всех отраслей (Y i ,), можно определить величины валовой продукции каждой отрасли (X i ): X = (E – A) -1 * Y (9) • Для ряда отраслей, задав величины валовой продукции, а для всех остальных - объемы конечной продукции, можно найти величины конечной продукции первых отраслей и объемы валовой продукции вторых. В формулах (8) и (9) Е обозначает единичную матрицу го порядка, а (E – обозначает матрицу, обратную матрице (E – A). Если определитель матрицы (E – A) неравен нулю, те. эта матрица невырожденная, то обратная к ней матрица существует. Обозначим эту обратную матрицу через В = (E – A) -1 , тогда систему уравнений в матричной форме (9) можно записать в виде X = B * Y. Элементы матрицы В называются коэффициентами полных материальных затрат. Они показывают, сколько всего нужно произвести продукции й отрасли для выпуска в сферу конечного использования единицы продукции й отрасли. Плановые расчеты по модели Леонтьева можно выполнять, если выполняется условие продуктивности. Будем называть неотрицательную матрицу А продуктивной, если существует такой неотрицательный вектор X ≥ 0, что ХА Х (10) Очевидно, что условие (10) означает существование положительного вектора конечной продукции Y > 0 для модели межотраслевого баланса (7). Для того, чтобы матрица коэффициентов прямых материальных затрат А была продуктивной, необходимо и достаточно, чтобы выполнялось одно из перечисленных ниже условий 1. Матрица (E – A) неотрицательно обратима, те. существует обратная матрица (E – A) -1 > 0; 2. Матричный ряд E + A + A 2 + A 3 + ... = A k k =0 сходится, причем его сумма равна обратной матрице (E – A) -1 ; 3. Все главные миноры матрицы (E – A), те. определители матриц, образованные элементами первых строки первых столбцов этой матрицы порядка от 1 до n, положительны. Более простым, но только достаточным признаком продуктивности матрицы А является ограничение на величину ее нормы, те. на величину наибольшей из сумм элементов матрицы А в каждом столбце. Если норма матрицы А строго меньше единицы, то эта матрица продуктивна повторим, что данное условие является только достаточными матрица A может оказаться продуктивной ив случае, когда ее норма больше единицы. Пример 12. Даны коэффициенты прямых затрат a ij и конечный продукт Y i для трехотраслевой экономической системы 0.3 0.1 0.4 200 A = 0.2 0.5 0.0,Y = 100 0.3 0.1 0.2 300 34 Требуется определить 1. Коэффициенты полных затрат. 2. Вектор валового выпуска. 3. Межотраслевые поставки продукции. 4. Проверить продуктивность матрицы А. 5. Заполнить схему межотраслевого баланса. Для решения задачи воспользуемся функциями EXCEL. Таблица 3 В таблице 3 приведены результаты решения задачи по первым трем пунктам. 1. В ячейки B6:D8 запишем элементы матрицы Е-А. Массив Е-А задан как диапазон ячеек. Выделим диапазон B10:D12 для размещения обратной матрицы В = Е - Аи введем формулу для вычислений МОБР(В6:О8). Затем следует нажать клавиши CTRL+SHIFT+ENTER. Все элементы матрицы коэффициентов полных затрат В неотрицательны, следовательно, матрица А продуктивна (ответ на пи. В ячейки G10:G12 запишем элементы вектора конечного продукта Y. Выделим диапазон В15:В17 для размещения вектора валового выпуска X, вычисляемого по формуле X = (E – A) -1 * Y. Затем вводим формулу для вычислений МУМНОЖ(В10:D12,G10:G12). Затем следует нажать клавиши CTRL+SHIFT+ENTER. 3. Межотраслевые поставки X ij вычисляем по формуле x ij = a ij * Xj. 4. Заполняем схему МОБ (таблица 4). АСЕ А 0.2 0.5 0 4 0.3 0.1 0.2 5 6 0.7 -0.1 -0.4 7 Е-А -0.2 0.5 0 8 -0.3 -0.1 0.8 9 1) Y 10 2.0408 0.6122 1.0204 200 11 В 0.8163 2.2448 0.4081 100 12 0.8673 0.5102 1.6836 300 13 14 2) 15 775.5102 16 X 510.2041 17 729.5918 18 19 3) 20 232.6531 51.02041 291.8367 21 Х) 155.102 255.102 0 22 232.6531 51.02041 145.9183 35 Таблица 4 - Cхема МОБ Производящие отрасли Потребляющие отрасли Конечный продукт Валовой продукт 1 2 3 1 232.6 51.0 291.8 200 775.3 2 155.1 255.0 0.0 100 510.1 3 232.6 51.1 145.9 300 729.6 Условно чистая продукция 155.0 153.1 291.9 600 Валовой продукт 775.3 510.1 729.6 2015 Задание 1. Для изготовления четырех видов продукции используют три вида сырья. Запасы сырья, нормы его расхода и цена каждого продукта приведены в таблице. Тип сырья Нормы расхода сырья на одно изделие Запасы сырья А Б В Г I 2 1 0,5 4 2400 II 1 5 3 0 1200 III 3 0 6 1 3000 Цена изделия 7,5 3 6 12 В задаче требуется определить 1. План выпуска продукции из условия максимизации ее стоимости. 2. Ценность каждого ресурса и его приоритет при решении задачи увеличения запаса ресурсов. 3. Максимальный интервал изменения запасов каждого из ресурсов, в пределах которого структура оптимального решения, те. номенклатура выпускаемой продукции, остается без изменений. 4. Суммарную стоимостную оценку ресурсов, используемых при производстве единицы каждого изделия. Выпуск какой продукции нерентабелен 5. Насколько уменьшится стоимость выпускаемой продукции при принудительном выпуске единицы нерентабельной продукции 6. Насколько можно снизить запас каждого из ресурсов, чтобы это не привело к уменьшению прибыли. 7. Интервалы изменения ценна каждый вид продукции, при которых сохраняется структура оптимального плана. 36 8. Насколько нужно снизить затраты каждого вида сырья на единицу продукции, чтобы сделать производство нерентабельного изделия рентабельным 9. Как изменится общая стоимость выпускаемой продукции и план ее выпуска, если запас сырья I вида увеличить на 100 кг, а II вида - уменьшить на 150 кг 10. Целесообразно ли выпускать изделие Д ценой 10 ед, если нормы затрат сырья 2, 4 и 3 кг Задание 2. Исходные данные транспортной задачи приведены схематически внутри прямоугольника заданы удельные транспортные затраты на перевозку единицы груза, слева указаны мощности поставщиков, а сверху - мощности потребителей. Сформулировать экономико-математическую модель исходной транспортной задачи, найти оптимальный план закрепления поставщиков за потребителями, установить единственность или не единственность оптимального плана. 7 7 7 7 2 4 16 30 17 10 16 6 20 27 26 9 23 10 13 4 22 3 1 10 3 1 5 4 24 Лабораторная работа 2 Использование инструмента Excel – пакет анализа Цель занятия усвоение технологии выполнения аналитических расчетов в программе корреляционного и регрессионного анализа многофакторных моделей для анализа и прогнозирования развития экономических систем этапы построения регрессионной модели. Этапы работы 1. Математический аппарат корреляционного и регрессионного анализа. Основные понятия и определения. 2. Решения задач корреляционного и регрессионного анализа с помощью пакета анализа. 1. Математический аппарат корреляционного и регрессионного анализа. Основные понятия и определения. В регрессионных моделях зависимая (объясняемая) переменная Y может быть представлена в виде функции Х Х, Х, ..., Х, где Х Х, Х, ..., Х -независимые объясняющие) переменные, или факторы. В зависимости от вида функции Х Х, 37 Х, ..., Х) модели делятся на линейные и нелинейные. В зависимости от количества включенных в модель факторов X модели делятся на однофакторные (парная модель регрессии) и многофакторные. При моделировании экономических процессов могут быть использованы два типа данных пространственные данные (cross-sectional data) и временные ряды (time-series data). Примерами временных данных могут быть ежеквартальные данные по инфляции, средней заработной плате, национальному доходу, денежной эмиссии за последние годы. Отличительной чертой временных данных является то, что они естественным образом упорядочены повремени, кроме того, наблюдения в близкие моменты времени часто бывают зависимыми. Наиболее часто используемым математическим аппаратом решения задач данного класса служат методы корреляционно-регрессионного анализа. Связь между переменной Y(t) и т независимыми факторами можно охарактеризовать функцией регрессии Y(t) =f(x 1 , х, ..., х т ), которая показывает, каково будет в среднем значение переменной у, если переменные х примут конкретное значение. Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования экономических явлений. В качестве зависимой переменной может выступать практически любой показатель, характеризующий, например, деятельность коммерческого банка или означающий курс ценной бумаги. Основными этапами построения регрессионной модели являются • Построение системы показателей (факторов. Сбор и предварительный анализ исходных данных. Построение матрицы коэффициентов парной корреляции. • Выбор вида модели и численная оценка ее параметров. • Проверка качества модели. • Оценка влияния отдельных факторов на основе модели. • Прогнозирование на основе модели регрессии. Построение системы показателей (факторов. Анализ матрицы коэффициентов парной корреляции Выбор факторов, влияющих на исследуемый показатель, производится, прежде всего, исходя из содержательного экономического анализа. Для получения надежных оценок в модель не следует включать слишком много факторов. Их число не должно превышать одной трети объема имеющихся данных тет. Для определения наиболее существенных факторов могут быть использованы коэффициенты линейной и множественной корреляции, детерминации частных коэффициентов корреляции. Отбор факторов для построения многофакторных моделей производится на основе качественного и количественного анализа социально-экономических явлений с использованием статистических и математических критериев. Формирование базы исходных данных. Сначала на основании содержательного анализа составляется перечень показателей, которые предполагается включить в модель. Затем производится сбор статистической информации и предварительный анализ данных. 38 ( y − y) *(x − x) ( y − y) 2 * (x − x) 2 i i x Значения переменных Y и X, содержащиеся в наблюдаемой совокупности, записываются в таблицу исходных данных (таблица 4.1.1). На второй стадии производятся сравнительная оценка и отсев части факторов. Это достигается анализом парных коэффициентов корреляции и оценкой (4.1.1) их значимости (4.1.2). Для этого составляется матрица парных коэффициентов корреляции, измеряющих тесноту связи каждого из факторов-признаков с результативным фактором и между собой (таблица 4.1.2). Таблица 1 № п/п Y X 1 X 2 … X m 1 y 1 X 11 X 21 … X m1 … … … … … … n y n X 1n X 2n … X mn Определение значения коэффициента корреляции. Коэффициент корреляции определяется по формуле r y,x = = COV (x, y) x * y N (1) N 1 N (x i − x) 2 x i где COV (x, y) = * (x − x)( y − y), = i=1 , x = i=1 N i=1 N N Таблица 2 Факторы Y X 1 X 2 … X m Y 1 r yx1 r yx2 … r yxm X 1 r yx1 1 r x1x2 … r x1xm X 2 r yx2 r x1x2 1 … r x2xm … … … … … … X m r yx r x1xm r x2xm … 1 Интерпретация полученной оценки коэффициента корреляции. Значение коэффициентов парной корреляции лежит в интервале от -1 до +1. Его положительное значение свидетельствует о прямой связи, отрицательное - об обратной, те. когда растет одна переменная, другая уменьшается. Чем ближе его значение к 1, тем теснее связь. Связь считается достаточно сильной, если коэффициент корреляции по абсолютной величине превышает 0.7, и слабой, если меньше 0.4. При равенстве его нулю связь полностью отсутствует. Этот коэффициент дает объективную оценку тесноты связи лишь при линейной зависимости переменных. Проверка значимости линейного коэффициента корреляции. Для оценки значимости коэффициента корреляции применяется критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле t набл = (2) 1 − r 2 (n − 2). r 2 39 Вычисленное по этой формуле значение t набл сравнивается с критическим значением критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости (α = 0,05) и числа степеней свободы (n - 2). Если t набл > t кр, то полученное значение коэффициента корреляции признается значимым (те. нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается. Таким образом, делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь. В модель включают те факторы, связь которых с зависимой переменной наиболее сильная. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств r xyi r xixk , r xyk r xixk , r xyi 0.8. Если приведенные неравенства (или хотя бы одно из них) не выполняются, тов модель включают тот фактор, который наиболее тесно связан с Y. Мулътиколлинеарностъ. Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных, те. решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экономических показателей это условие выполняется не всегда. Линейная или близкая к ней связь между факторами называется мулътиколлинеарностъю и приводит к линейной зависимости нормальных уравнений, что делает вычисление параметров либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Мультиколлинеарность может возникать в силу разных причин. Например, несколько неависимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания. В частности, так может случиться, когда значения одной независимой переменной являются лагированными значениями другой. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0.8. Чтобы избавиться от мультиколлинеарности, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной. На третьей, заключительной стадии производят окончательный отбор факторов путем анализа значимости вектора оценок параметров уравнений множественной регрессии с использованием критерия Стьюдента (k - количество факторов, включенных в модель после исключения незначимых факторов, k = m, если включены все анализируемые факторы. Выбор вида модели и оценка ее параметров Для отображения зависимости переменных могут использоваться показательная, параболическая и многие другие функции. Однако в практической работе наибольшее распространение получили модели линейной взаимосвязи, те. когда факторы входят в модель линейно. Линейная модель множественной регрессии имеет вид Y i = a 0 + a 1 x i1 + a 2 x i 2 + ... + a m x im + i (3) Анализ уравнения (3) и методика определения параметров становятся более наглядными, а расчетные процедуры существенно упрощаются, если воспользоваться матричной формой записи уравнения (4): 40 y 1 x x Y = X + . (4) Здесь Y - вектор зависимой переменной размерности х, представляющий собой n наблюдений значений y i , X - матрица независимых переменных, элементы которой суть n x m наблюдения значений т независимых переменных Х, Х Х, ..., Х т , размерность матрицы X равна п x m; α - подлежащий оцениванию вектор неизвестных параметров размерности m x 1; ε - вектор случайных отклонений возмущений) размерности п х 1. Таким образом, y 1 1 x 11 ... x 1m 0 y 1 x ... x Y = 2 , X = 21 2m , = 1 . ... ... ... ... ... ... n n1 x nm m Уравнение (4) содержит значения неизвестных параметров α 1, α 2, …, α m . Эти величины оцениваются на основе выборочных наблюдений, поэтому полученные расчетные показатели не являются истинными, а представляют собой лишь их статистические оценки. Модель линейной регрессии, в которой вместо истинных значений параметров подставлены их оценки (а именно такие регрессии и применяются на практике, имеет вид Y = Xa + e = Yˆ + e, (5) где а - вектор оценок параметров е - вектор оцененных отклонений регрессии, остатки регрессии е у- Ха Yˆ - оценка значений Y, равная Ха. Для оценивания неизвестного вектора параметров α воспользуемся методом наименьших квадратов (МНК). Формула для вычисления параметров регрессионного уравнения имеет вид a = (X T X ) −1 X T Y. (6) Рассмотрим случай зависимости переменной Y от одного фактора X. Необходимо подобрать уравнение Yˆ = a 0 + a 1 x. Используя (6), можно получить следующие выражения для вычисления аи а. 1 (x − x) *( y − y) 1 (x − x) *( y − y) a = N = N = 1 (x − x) 2 2 N (7) = (x − x) *( y − y) = COV (x, y) = r * e , (x − x) 2 a 0 = y − a 1 x. VAR(x) x, y x (8) Проверка качества модели Качество модели оценивается стандартным для математических моделей образом по адекватности и точности на основе анализа остатков регрессии е. Расчетные значения получаются путем подстановки в модель фактических значений всех включенных факторов. Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа, остатки 1 41 1 − e S 2 S 2 y 1 − t e(t) 2 ( y − y ) 2 t ( yˆ − y) 2 t t ( y − y) 2 S e должны вести себя как независимые (в действительности почти независимые, одинаково распределенные случайные величины. В классических методах регрессионного анализа предполагается также нормальный закон распределения остатков. Независимость остатков проверяется с помощью критерия Дарбина-Уотсона. Исследование остатков полезно начинать с изучения их графика. Он может показать наличие какой-то зависимости, неучтенной в модели. Например, при подборе простой линейной зависимости между У и X график остатков может показать необходимость перехода к нелинейной модели (квадратичной, полиномиальной, экспоненциальной) или включения в модель периодических компонент. График остатков (хорошо показывает и резко отклоняющиеся от модели наблюдения - выбросы. Подобным аномальным наблюдениям надо уделять особо пристальное внимание, так каких присутствие может грубо искажать значения оценок. Устранение эффектов выбросов может проводиться либо с помощью удаления этих точек из анализируемых данных (эта процедура называется цензурированием), либо с помощью применения методов оценивания параметров, устойчивых к подобным грубым отклонениям. Кроме рассмотренных выше характеристик, целесообразно использовать коэффициент множественной корреляции индекс корреляции) R, а также характеристики существенности модели в целом и отдельных ее коэффициентов R = = = , (9) где 2 - сумма квадратов уровней остаточной компоненты 2 y значения. - сумма квадратов отклонений уровней исходного ряда от его среднего Данный коэффициент является универсальным, так как отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной корреляционной модели коэффициент множественной корреляции равен коэффициенту парной корреляции. Коэффициент множественной корреляции (индекс корреляции, возведенный в квадрат (R 2 ), называется коэффициентом детерминации. R = 1 − e(t) 2 = ( yˆ t − y) 2 (10) ( y t − y ) 2 ( y t − Он показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, те. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов. В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скорректирован с учетом числа независимых переменных. Скорректированный R 2 , или R 2 , рассчитывается R 2 = 1 − (1 − R 2 ) n −1 , n − k −1 где п - число наблюдения k- число независимых переменных. t S 42 В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n-k-1), где k - количество факторов, включенных в модель. Квадратный корень из этой величины (S e ) называется стандартной ошибкой оценки. Для проверки значимости модели регрессии используется значение, вычисляемое как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение спи (п - k - 1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой R 2 F = k (1 − R 2 )(n − k −1) (11) Если существует k независимых переменных, то будет k + 1 коэффициентов регрессии (включая постоянную, отсюда число степеней свободы составит n-(k+1) или n-k-1. Целесообразно проанализировать также значимость отдельных коэффициентов регрессии. Это осуществляется по статистике путем проверки гипотезы о равенстве нулю го параметра уравнения (кроме свободного члена t ai = a j S aj , (12) где S aj - это стандартное (среднее квадратическое) отклонение коэффициента уравнения регрессии а. Величина представляет собой квадратный корень из произведения несмещенной оценки дисперсии иго диагонального элемента матрицы, обратной матрице системы нормальных уравнений. e(t) 2 S aj = S e * b jj , (13) T -1 где S e = n − k −1 , b jj - диагональный элемент матрицы (X X) . Если расчетное значение критерия с п - k - 1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится. Оценка влияния отдельных факторов на основе модели на зависимую переменную (коэффициенты эластичности и коэффициенты) Важную роль при оценке влияния факторов играют коэффициенты регрессионной модели. Однако непосредственно сих помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э) и коэффициенты β(j), которые рассчитываются соответственно по формулам Э j) = a( j)* X ср / Y ср ; ( j) = a( j)* S xj / S y , где S xj - среднее квадратическое отклонение фактора j. (14) (15) 43 yj Коэффициент эластичности показывает, насколько процентов изменяется зависимая переменная при изменении фактора j на 1%. Однако он не учитывает степень колеблемости факторов. Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения S v изменится зависимая переменная Y с изменением соответствующей независимой переменной X j на величину своего среднего квадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных. Указанные коэффициенты позволяют проранжировать факторы по степени влияния факторов на зависимую переменную. Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта-коэффициентов Δ(j): ( j) = r ( j) / R 2 , где r yj - коэффициент парной корреляции между фактором j (j = 1, ..., m) и зависимой переменной. Использование многофакторных моделей для анализа и прогнозирования развития экономических систем Одна из важнейших целей моделирования заключается в прогнозировании поведения исследуемого объекта. Обычно термин прогнозирование используется в тех ситуациях, когда требуется предсказать состояние системы в будущем. Для регрессионных моделей он имеет, однако, более широкое значение. Как уже отмечалось, данные могут не иметь временной структуры, но ив этих случаях вполне может возникнуть задача оценить значение зависимой переменной для некоторого набора независимых, объясняющих переменных, которых нет в исходных наблюдениях. Именно в этом смысле - как построение оценки зависимой переменной - и следует понимать прогнозирование в эконометрике. Проблема прогнозирования имеет многоразличных аспектов. Можно различать точечное и интервальное прогнозирование. В первом случае оценка - это конкретное число, во втором - интервал, в котором истинное значение переменной находится с заданным уровнем доверия. Кроме того, для временных рядов при нахождении прогноза существенно наличие или отсутствие корреляции повремени между ошибками. При использовании построенной модели для прогнозирования делается предположение о сохранении в период прогнозирования существовавших ранее взаимосвязей переменных. Для прогнозирования зависимой переменной на l шагов вперед необходимо знать прогнозные значения всех входящих в нее факторов. Их оценки могут быть получены на основе временных экстраполяционных моделей или заданы пользователем. Эти оценки подставляются в модель, и получаются прогнозные оценки. Построение точечных и интервальных прогнозов на основе регрессионной модели. Для того, чтобы определить область возможных значений результативного показателя, при рассчитанных значениях факторов следует учитывать два возможных источника ошибок рассеивание наблюдений относительно линии регрессии и ошибки, обусловленные математическим аппаратом построения самой 44 1 + 1 n t =1 N − 2 t N 2 пр пр линии регрессии. Ошибки первого рода измеряются с помощью характеристик точности, в частности, величиной S yˆ . Ошибки второго рода обусловлены фиксацией численного значения коэффициентов регрессии, в то время как они в действительности являются случайными, нормально распределенными. Для линейной модели доверительный интервал рассчитывается следующим образом. Оценивается величина отклонения от линии регрессии (обозначим ее буквой U): U (l) = S yˆ кр пр , (16) где пр = Х Т Х Т Х ) −1 Х пр , (17) Т ( Х 1(n+l ) , Х 2(n+l ) ,..., Х m(n+l ) ). Для модели парной регрессии формула (16) принимает вид U (l) = S yˆ t (x(n + l) − X ср ) n (18) ( X t t =1 − X cp ) Коэффициента является табличным значением статистики Стьюдента при заданном уровне значимости α и числа наблюдений, l - период прогнозирования. Если исследователь задает вероятность попадания прогнозируемой величины внутрь доверительного интервала, равную 70%, то t a = 1.05. Если вероятность составляет 95%, то t а = 1.96, а при 99% t а = 2.65. Как видно из формулы (18), величина U прямо пропорционально зависит от точности модели ( S yˆ ), коэффициента доверительной вероятности (t a ), степени удаления прогнозной оценки фактора Хот среднего значения и обратно пропорциональна объему наблюдений. В свою очередь S yˆ = (19) В результате получаем следующий интервал прогноза для шага прогнозирования l: • верхняя граница прогноза равна Y (n+l) + U(l), • нижняя граница прогноза равна Y (n+l) - U(l). Если построенная регрессионная модель адекватна и прогнозные оценки факторов достаточно надежны, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадет в интервал, образованный нижней и верхней границами. Пример 1. Бюджетное обследование семи случайно выбранных семей дало результаты (в тыс. руб, показанные в таблице 3. Таблица 3 Наблюдение Накопления. Y Доход, X 1 3 40 Х + 2 2 45 2 6 55 3 5 45 4 3.5 30 5 1.5 30 6 4.5 50 7 2 35 Требуется 1) построить однофакторную модель регрессии 2) оценить накопления семьи, имеющей доход 42 тыс. руб 3) отобразить на графике исходные данные, результаты моделирования. Решение. 1. Для вычисления параметров модели следует воспользоваться формулами (7) и (8). Промежуточные расчеты приведены в таблице 4. Таблица 4 Наблюдение Накопления, Y Доход, X ( y i − y) (x i − x) (x i − x) 2 ( y − y)(x i − x) 1 3 40 -0.643 -0.714 0.510 0.459 2 6 55 2.357 14.286 204.082 33.673 3 5 45 1.357 4.286 18.367 5.816 4 3.5 30 -0.143 -10.714 114.796 1.531 5 1.5 30 -2.143 -10.714 114.796 22.959 6 4.5 50 0.857 9.286 86.224 7.959 7 2 35 -1.643 -5.714 32.653 9.388 Сумма 25.5 285.00 0.000 0.000 571.429 81.786 Среднее значение 3.643 40.714 a = (x − x)( y − y) = 81.786 = 0.143125, 1 (x − x) 2 571.429 a 0 = y − a 1 * x = 3.643 − 0.143125 * 40.714 = −2.18438. Построена модель зависимости накопления от дохода yˆ t = a 0 + a 1 * x t = −2.184 + 0.143* x t 2. Для того чтобы определить накопления семьи при доходе 42 тыс. руб, необходимо подставить значение х в полученную модель. Y прогн. =-2,184+0,143*42=3,827. Величина отклонения от линии регрессии вычисляется по формуле (19), Таблица 5 S yˆ = = 0.9112. Наблюдение Накопления, Y Предсказанное Y, yˆ Остатки, ε ε 2 1 3 3.541 -0.5406 0.2923 2 6 5.688 0.3125 0.0977 3 5 4.256 0.7438 0.5532 t =1 = t N 2 N − 2 4.1516 / 5 46 1 + 1 + 1.653 7 571.429 4 3.5 2.109 1.3906 1.9338 5 1.5 2.109 -0.6094 0.3713 6 4.5 4.972 -0.4719 0.2227 7 2 2.825 -0.8250 0.6806 Сумма 25.5 25.500 0.0000 4.1516 U = 0.9112 * 2.015 * 1 + 1 7 + (42 − 40.714) 2 571.429 = 0.9112 * 2.015 * = = 0.9112 * 2.015 * 1.14575 = 1.965, t = 2.0015 = 0.01, x = 42, n = 7, = 0.1. Таким образом, прогнозное значение у прогн . = 3.827 будет находиться между верхней границей, равной 3.827 + 1.965 = 5.792, и нижней границей, равной 3.827 - 1.965 = 1.862. |