эконометрика. Эконометрика. Методические рекомендации по выполнению контрольной работы для студентов очнозаочной формы обучения по дисциплине

Название	Методические рекомендации по выполнению контрольной работы для студентов очнозаочной формы обучения по дисциплине
Анкор	эконометрика
Дата	13.10.2020
Размер	184.6 Kb.
Формат файла
Имя файла	Эконометрика.docx
Тип	Методические рекомендации #142586

Приложение 6

к рабочей программе
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФГБОУ ВО «Уральский государственный экономический университет»

УТВЕРЖДЕНЫ

на заседании кафедры Шахматного искусства и

компьютерной математики

МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ

КОНТРОЛЬНОЙ РАБОТЫ

для студентов очно-заочной формы обучения
по дисциплине

ЭКОНОМЕТРИКА
Направление подготовки

38.03.01 Экономика

Направленность (профиль)

МОДЕЛИ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ

При изучении влияния одних признаков явления на другие из цепи признаков, характеризующих данное явление, выделяются два признака: факториальный и результативный. Необходимо установить, какой из них является факториальным и какой – результативным. В этом помогает, прежде всего, логический предметный анализ.

В простейшем случае исследуется связь между двумя показателями, из которых один рассматривается как независимый показатель-фактор¹, а второй – как зависимая переменная². Наличие самой зависимости между этими показателями устанавливается, конечно, не математическим путем, а в результате качественного анализа, позволяющего вскрыть внутреннюю сущность изучаемого явления и порождающих его причин. Сам же регрессионный анализ предназначен для количественного измерения выявленной связи, хотя он нередко способствует и уточнению выводов самого качественного анализа.

Например, исследуется зависимость между стоимостью некоторого товара и объемом его продаж. Данные об изменении этих показателей собраны за определенный промежуток времени. Несомненно, анализируемые показатели связаны между собой. В качестве зависимой переменой (y) возьмем величину объема продаж, а в качестве независимой (x) – стоимость товара.

В первую очередь необходимо установить вид функции, связывающей показатели y и x, то есть найти такой вид уравнения регрессии, который наилучшим образом соответствует характеру изучаемой связи. Определение вида уравнения регрессии (вида связи) является важнейшей составной частью регрессионного анализа, поэтому его правильный подбор относится к наиболее ответственным этапам проводимого исследования.

Самый простой способ определения вида связи между показателями – визуальный. Нанесем на координатную плоскость все имеющиеся пары наблюдений (рис.1): цена товара в период t (х_t) и объем продаж товара в период t (y_t). Полученный разброс точек на координатной плоскости называется корреляционным полем.

Если на корреляционном поле визуально не вырисовывается одна из нелинейных функций, то для моделирования связи можно использовать линейную зависимость. Большинство экономических процессов достаточно корректно описывается линейными (или кусочно-линейными) связями в основном диапазоне своих наблюдаемых значений.

Рис. 1. Корреляционное поле

Соответственно, простейшим уравнением, которое может характеризовать зависимость между двумя переменными, является линейное уравнение. Предположим, что связь между анализируемыми показателями является именно линейной, то есть описывается уравнением прямой вида:

y_t = α + βx_t + _t (1),

где x_t и y_t – соответственно независимая и зависимая переменные,
α и β– коэффициенты регрессии, а _t – случайная компонента, характеризующая ошибки – возможные отклонения между реальными и расчетными значениями y_t.

Сразу же отметим, что не следует ожидать получения точного соотношения между какими-либо двумя (или – в общем случае – более) экономическими показателями, за исключением тех случаев, когда оно существует по определению. В статистическом анализе факт неточности соотношения признается путем явного включения в него случайного фактора, описываемого случайной составляющей _t (остаточным членом).

При этом полагается, что

x_t – неслучайная детерминированная величина, ее называют объясняющей (независимой) переменной, или регрессором (фактором);

y_t, _t – случайные величины;

y_t – объясняемая зависимая переменная (результирующий показатель);

_t – величина, характеризующая влияние на результирующий показатель неучтенных в модели факторов.

Существует несколько причин появления в модели случайной
составляющей:

Не включение объясняющих переменных.

Соотношение между y_t и x_t является упрощением. В действительности существуют другие факторы, влияющие на y_t, которые в явном виде не учтены в модели y_t= α + βx_t + _t, их суммарное влияние представлено в уравнении случайной составляющей _t. Влияние этих факторов приводит к тому, что наблюдаемые значения y_t лежат вне прямой α + βx_t.

Часто возникает ситуация, когда имеются переменные, которые мы хотели бы включить в регрессионное уравнение, но не можем этого сделать потому, что не знаем, как их измерить, например, психологические факторы. Возможно, существуют также другие факторы, которые мы можем измерить, но которые оказывают такое слабое влияние, что их не стоит учитывать. Кроме того, могут существовать факторы, которые являются существенными, но которые мы из-за отсутствия опыта таковыми не считаем. Объединив все эти составляющие, мы получаем то, что обозначено как _t. Если бы мы знали точный перечень всех факторов, которые влияют на y_t, и имели возможность точно их измерить, то могли бы включить их в уравнение в явном виде и исключить соответствующий элемент из случайной составляющей.

Агрегирование переменных.

Во многих случаях рассматриваемая зависимость – это попытка объединить вместе некоторое число экономических соотношений. В нашем случае, величина совокупного потребления – это попытка общего выражения совокупности решений, принимаемых отдельными потребителями в различные моменты времени. Так как отдельные соотношения, вероятно, имеют различные параметры, любая попытка определить точное соотношение между рентабельностью и затратами на рекламу является лишь аппроксимацией. Наблюдаемое расхождение при этом приписывается наличию случайной составляющей.

Неправильное описание структуры модели.

Структура модели может быть описана неправильно или не вполне правильно. Поскольку рассматриваемая нами зависимость представляет собой временной (динамический) ряд, то значение y_t может зависеть не от фактического значения х_t, а от значения, которое наблюдалось в предыдущем периоде. Если ожидаемое и фактическое значения тесно связаны, то будет казаться, что между y_t и х_t существует зависимость, но это будет лишь аппроксимация, и расхождение вновь будет связано с наличием случайной составляющей.

Неправильная функциональная спецификация.

Функциональное соотношение между y_t и х_t математически может быть определено неверно. Например, истинная зависимость может являться не линейной, а более сложной. Нелинейные зависимости будут рассмотрены позднее. Безусловно, надо постараться избежать возникновения этой проблемы, используя подходящую математическую модель, однако любая самая изощренная формула является лишь приближением, и существующее расхождение также вносит вклад в случайную составляющую.

Ошибки измерения.

Если в измерении одной или более взаимосвязанных переменных имеются (статистические) ошибки, то наблюдаемые значения не будут соответствовать точному соотношению, и существующее расхождение будет вносить вклад в случайную составляющую.

Случайная составляющая является суммарным проявлением всех перечисленных причин.

Очевидно, что если бы нас интересовало только измерение влияния х_t на y_t, то было бы значительно удобнее, если бы случайной составляющей не было. Если бы она отсутствовала, мы бы знали, что любое изменение y_t от наблюдения к наблюдению вызвано изменениемх_t, и смогли бы точно вычислить β. Однако в действительности каждое изменение y_t отчасти вызвано изменением _t, и это значительно усложняет исследования. По этой причине _t иногда интерпретируется как шум.

Очевидно, что чем меньше значения _t, тем точнее решается первая задача регрессионного анализа, которая состоит в получении оценок α и β.

Пример построения и анализа модели парной линейной
регрессии с использованием пакета Microsoft Excel

Решение эконометрических задач с помощью МНК реализовано во многих пакетах прикладных программ. Достаточно удобный интерфейс для этого предусмотрен в Microsoft Excel, но который мы и будем ориентироваться при описании решения задач регрессионного анализа.

Рассмотрим практические подходы к построению и анализу эконометрических моделей на примере конкретной задачи.

Менеджер не уверен в правильности выбранной цены на товар, поэтому на протяжении 17 периодов он варьирует цену и отслеживает количество проданных единиц товара. Статистические данные приведены в таблице.

Ставятся следующие задачи:

1) построить эконометрическую модель зависимости количества проданных единиц товара от цены;

2) исследовать качественные характеристики построенной эконометрической модели;

3) на основе модели определить оптимальную в смысле максимума выручки цену товара.

На рис. 2 представлены собранные менеджером статистические данные, занесенные в электронную таблицу Microsoft Excel.

Рис. 2. Таблица исходных данных для построения модели

Для получения численного решения задачи в Microsoft Excel следует воспользоваться программой анализа данных стандартного Пакета анализа. Для выполнения регрессионного анализа необходимо последовательно выбрать следующие пункты меню:

Данные → Анализ данных → Регрессия.

При отсутствии опции Анализ данных в меню Данные Пакет анализа следует подгрузить с помощью опции Надстройки.

В результате на экран вызывается окно диалога, которое необходимо заполнить:

Входной интервал Y: выделяются все значения зависимой переменной вместе с названием (в нашем случае, объем), т.е. выделяются ячейки, в которых содержатся числовые значения объема (в нашем случае, С7:С24);

Входной интервал Х: выделяются все значения независимой переменной вместе с названием (в нашем случае, цена), т.е. выделяются ячейки, в которых содержатся числовые значения цены (в нашем случае, В7:В24);

В позиции Метки ставится флажок, т.к. во входные интервалы включены не только числовые значения, но и имена переменных;

Помимо диапазона входных данных, задается информация о параметрах вывода. Результаты регрессионного анализа могут быть выведены на текущий рабочий лист, на отдельный рабочий лист (установкой флажка возле опции Новый рабочий лист), в новый файл (установкой флажка возле опции Новая рабочая книга) или на текущий рабочий лист (установкой флажка возле опции Выходной интервал). В последнем случае результаты решения будут выведены на тот же лист, где находятся исходные данные задачи, начиная с той позиции, которая будет указана пользователем в поле Выходной интервал.

В нашем случае в параметрах вывода в позиции Выходной интервал указывается адрес ячейки, являющейся левой верхней ячейкой диапазона вывода результатов (ячейка А30);

В позициях Остатки и Стандартизованные остатки ставятся флажки, поскольку эти результаты необходимы для полноценного анализа.

Вид окна диалога в нашем случае представлен на рис. 3.

Рис. 1. Окно диалога «Регрессия»

После заполнения всех необходимых полей диалога и нажатия кнопки «ОК» на экран будет выведено решение задачи (рис.4).

Рис. 2. Результаты решения задачи в пакете Excel

Результаты проведенного регрессионного анализа выводятся в четырех таблицах под общим названием Вывод итогов.

Для полноценного анализа полученных результатов необходимо решить четыре выше описанные задачи регрессионного анализа.

Задача 1. Определение числовых значений коэффициентов модели.

Регрессионная модель в общем случае имеет вид:

у = a + b x.

В нашей задаче объем продаж выполняет роль зависимой переменной у, а цена единицы товара является факторной переменной х. Для записи регрессионной модели в частном (а не общем) виде необходимо определить числовые значения параметров а и b.

Числовые значения параметров а и bвыведены в столбце Коэффициенты третьей таблицы Вывода итогов.

Здесь Y-пересечение является константой уравнения регрессии (параметр а). В нашем случае константа а равна 3076.

Формально параметр а определяет величину y при нулевом значении х. Т.е. условно можно сказать, что при нулевой цене объем продаж составит 3076 штук.

Однако поскольку в реальности цена не может иметь нулевого значения, то буквальная трактовка параметра а не имеет экономического смысла.

Проанализируем знак параметра а. В случае, когда а > 0, относительное изменение результата происходит медленнее, чем изменение фактора. В нашем случае а равно 3076, поэтому относительное изменение объема (у) происходит медленнее, чем изменение цены (х).

Коэффициент регрессии b показывает величину изменения результата при увеличении фактора на единицу. В случае, когда b < 0, связь между показателями является обратной, т.е. с ростом х снижается y. В нашем случае b равно –182, следовательно, с ростом цены на 1 р. объем продаж снижается в среднем на 182 единицы.

Выполнив анализ коэффициентов, можно записать полученную регрессионную модель:

Объем = 3076 – 182 Цена.

Коэффициент регрессии b дает возможность оценить, как в среднем меняется результирующий показатель при изменении фактора. Но поскольку, как уже отмечалось, в эконометрических исследованиях редко имеется возможность использовать генеральную совокупность данных, необходимо проанализировать границы изменения найденных коэффициентов.

Для этого рассмотрим доверительные интервалы коэффициентов, выведенные в столбцах Нижние 95% и Верхние 95%. Доверительный интервал показывает интервал изменения соответствующего параметра регрессии в 95% случаев при тех или иных изменениях исходных данных. В нашем примере величина константы при изменении исходных данных почти наверняка (с вероятностью 95%) будет лежать в интервале от 2807 до 3346, а величина коэффициента перед переменной Цена – в интервале от –206 до –158.

Т.о., в среднем при росте цены на 1 р., объем продаж снижается на 182 единицы. В лучшем случае объем продаж снизится на 158 единиц при увеличении цены на 1 р. В худшем случае объем продаж снизится на 206 единиц при увеличении цены на 1 р.

В выводимых Excel результатах регрессии столбцы Нижние 95% и Верхние 95% повторяются дважды. Это связано с тем, что пользователю предоставляется возможность, помимо стандартного 95%-го указать интересующий его уровень значимости. Если есть необходимость помимо 95%-го доверительного интервала получить интервал с другим уровнем надежности результатов следует при заполнении окна диалога Регрессия нажатием левой кнопки мыши поставить флажок возле опции Уровень надежности и в соответствующем поле указать его значение.

Задача 2. Анализ статистической значимости коэффициентов регрессионной модели.

Помимо коэффициентов регрессии в третьей таблице Вывода итогов в столбце Стандартная ошибка выведены значения стандартных отклонений коэффициентов модели, которые рассчитываются по ранее рассмотренным формулам.

В нашем случае стандартная ошибка коэффициента а равна 126, а коэффициента b равна 11. Для обоих коэффициентов значения стандартных ошибок не превышают половины модуля величины коэффициента (3076 и –182 соответственно), поэтому можно сделать вывод о том, что данные коэффициенты являются достоверными.

В рамках решения второй задачи для исследования значимости параметров также проверяется вероятность выполнения нулевой гипотезы для найденных коэффициентов a и b. Вероятность выполнения нулевой гипотезы проверяется с использованием статистики Стьюдента, числовые значения которой приводятся в столбце t-статистика.

Для нашего примера статистика Стьюдента для параметра а составляет 24, для параметра b равна –16.

На основании этих значений рассчитываются вероятности выполнения нулевых гипотез для обоих параметров, которые выводятся в столбце Р-Значение.

В нашем случае вероятность выполнения нулевой гипотезы для коэффициента а (т.е. вероятность того, что а = 0) равна нулю (меньше порогового значения в 5%). Т.о., можно считать параметр а отличным от нуля и статистически достоверным. Вероятность выполнения нулевой гипотезы для коэффициента b (т.е. вероятность того, что b = 0) также равна нулю. Т.о., параметр b тоже можно считать отличным от нуля и статистически достоверным.

Обобщая вышесказанное, подчеркнем, что Р-Значение определяет:

– вероятность выполнения нулевой гипотезы для соответствующего коэффициента регрессии;

– т.е. вероятность незначимости (недостоверности) соответствующего коэффициента регрессии;

– т.е. вероятность того, что фактор x не оказывает линейного влияния на результативный показатель y.

Задача 3. Расчет и анализ показателей качества построенной регрессионной модели.

Расчет показателей качества модели проводится на основе дисперсионного анализа.

В таблице Дисперсионный анализ (вторая таблица Вывода итогов) в столбце SS указаны значения дисперсий: объясняемой регрессионной моделью (RSS), остаточной (ESS) и общей (TSS).

TSS – это сумма квадратов отклонений реальных значений у от среднего значения у. Величина TSS выводится в строке Итого. В нашем случае величина TSS равна 1 903 406.

RSS – это сумма квадратов отклонений модельных значений у от среднего значения у. Величина RSS выводится в строке Регрессия. В нашем случае величина RSS равна 1 802 215.

ESS – это сумма квадратов отклонений реальных значений у от модельных значений у. Величина ESS выводится в строке Остаток. В нашем случае величина ESS равна 101 191.

Как описывалось выше, зная значение дисперсий, можно рассчитать один из показателей качества регрессионной модели – коэффициент детерминации. Числовое значение коэффициента детерминации выводится в первой таблице Вывода итогов в строке R-квадрат.

R-квадрат – коэффициент детерминации, рассчитывается как отношение объясненной дисперсии (RSS) к общей дисперсии (TSS).

R-квадрат определяет:

– долю дисперсии, объясненную регрессионной моделью;

– долю разброса данных, объясненного регрессионной моделью;

– долю наблюдений, попавших под описание регрессионной модели.

В нашем случае доля объясненной дисперсии составляет 94,7%, т.е. под описание регрессионной модели попадает 94,7% наблюдений.

Наряду с коэффициентом детерминации, в первой таблице Вывода итогов выводится величина уточненного коэффициента детерминации R_норм – в строке Нормированный R-квадрат.

Для расчета уточненного коэффициента детерминации используются значения степеней свободы, которые выводятся во второй таблице в столбце df.

Общее число степеней свободы выводится в строке Итого и рассчитывается как количество наблюдений минус один (n–1). Число степеней свободы для величины RSS выводится в строке Регрессия и рассчитывается как разность между количеством наблюдений и числом факторных переменных (n–k). Число степеней свободы для величины ESS выводится в строке Остаток и рассчитывается как разность между количеством наблюдений и количеством переменных модели (n–k–1).

В нашем случае значения степеней свободы равны соответственно
16, 15 и 1.

Объясненная и остаточная дисперсии на одну степень свободы выводятся в столбце MS второй таблицы Вывода итогов. Для расчета общей дисперсии на одну степень свободы следует разделить величину общей дисперсии на соответствующее количество степеней свободы, равное (n–1).

В нашем случае объясненная дисперсия на одну степень свободы равна 1 802 215, остаточная дисперсия на одну степень свободы равна 6 746, общая дисперсия на одну степень свободы равна 118 963.

Чтобы рассчитать уточненный коэффициент детерминации необходимо из единицы вычесть отношение остаточной дисперсии на одну степень свободы к общей дисперсии на одну степень свободы.

В результате для нашего примера получаем величину
R_норм = 0,943, которая выводится в первой таблице в строке Нормированный R-квадрат.

Нормированный R-квадрат определяет долю дисперсии (т.е. долю разброса данных), объясненную факторами модели.

Вычислив квадратный корень из коэффициента детерминации, получаем коэффициент корреляции, который измеряет тесноту связи в регрессионной модели и выводится в строке Множественный R первой таблицы Вывода итогов.

Коэффициент корреляции является важнейшим показателем для оценки качества регрессионной модели. Этот показатель определяет, насколько тесно связаны между собой зависимая и факторная переменные в построенной модели.

В нашем случае значение коэффициента корреляции близко к единице (Множественный R = 0,973), что свидетельствует о наличии достаточно тесной связи между исследуемыми экономическими показателями и подтверждает влияние цены на изменение объема продаж.

Дополнительно можно провести исследование надежности коэффициента корреляции. Поскольку объем анализируемой информации составляет меньше 50 наблюдений, то исследование надежности проводится с использованием величины погрешности коэффициента корреляции P_R.

В нашей задаче

Определим гарантийный минимум и гарантийный максимум коэффициента корреляции для нашей задачи:

min R = R – 3P_R = 0,973 – 3 · 0,013 = 0,934;

max R = R + 3P_R = 0,973 + 3 · 0,013 = 1,012.

Гарантийный минимум коэффициента корреляции в условиях решаемой задачи превышает пороговое значение для коэффициента корреляции, что подтверждает его надежность.

В некоторых случаях низкое значение коэффициента корреляции, как уже отмечалось выше, может быть связано с наличием в изучаемой выборке аномальных наблюдений – статистических выбросов, которые искажают как величины коэффициентов регрессии, определяющих меру влияния фактора на результат, так и характеристику тесноты связи. Если величина коэффициента корреляции в решаемой задаче меньше 0,7, то,
в первую очередь, следует проверить наличие статистических выбросов. Если объем статистической выборки позволяет ее сократить, то даже при приемлемом значении коэффициента корреляции рекомендуется исключать из набора исходных данных статистические выбросы.

Напомним, что статистический выброс – это наблюдение, резко отклонившееся от линии регрессии вверх или вниз. Если наблюдение является статистическим выбросом, его стандартный остаток по абсолютной величине больше или равен 2. Величины стандартных остатков выводятся в столбце Стандартные остатки четвертой таблицы Вывода итогов.

В нашем случае 4-е и 12-е наблюдения являются статистическими выбросами. С определенной долей условности можно считать, что для остальных наблюдений реальный и модельный объем продаж приблизительно совпадают.

4-е наблюдение является выбросом вверх (стандартный остаток равен 2,32). Это не означает, что объем продаж в 4-м периоде был слишком большим. Появление этого выброса связано с тем, что при установленной в 4-м периоде цене объем продаж был значительно выше, чем можно было бы ожидать согласно построенной модели.

12-е наблюдение является выбросом вниз (стандартный остаток равен –2,03). Это также не означает, что объем продаж в 12-м периоде был мал. Появление этого выброса связано с тем, что при установленной в 12-м периоде цене объем продаж был существенно ниже, чем можно было бы ожидать согласно построенной модели.

В нашем случае исходный объем выборки составлял 17 наблюдений, что позволяет удалить два обнаруженных выброса (17 / 8 > 2). Процедура удаления статистических выбросов заключается в удалении из исходных данных тех строк, которые соответствуют наблюдениям-выбросам (в нашем случае это 11 и 19 строки).

Для измененных данных повторяется процедура регрессионного анализа, результаты проведения которого представлены на рис. 5.

Рис. 3. Результаты решения задачи после удаления выбросов в пакете Excel

Как видно из рис. 5, удаление статистических выбросов позволило повысить тесноту связи между ценой и объемом продаж. Коэффициент корреляции, измеряющий тесноту связи, увеличился с 0,973 до 0,988. Соответственно, увеличилась и доля объясненного разброса данных до 97,6%. Отметим, что изменилась и мера влияния цены на объем продаж, а именно: увеличение цены на 1 р. приводит к снижению объема продаж на 189 единиц. Последнее значение следует признать более точным. В результате удаления статистических выбросов изменились и границы доверительных интервалов, они стали более узкими. Подчеркнем, что чем уже доверительный интервал, тем точнее полученные результаты.

Числовые значения стандартных остатков рассчитываются с помощью процедуры стандартизации разностей между реальными и модельными значениями зависимой переменной для каждого наблюдения, т.е. стандартизации остатков. Величины остатков выводятся в столбце Остатки четвертой таблицы Вывода итогов.

По величине остатков можно сравнить реальные и модельные значения зависимой переменной. Если остаток для какого-либо наблюдения больше нуля, то реальное значение в этом наблюдении больше модельного, и наоборот: при отрицательном остатке модельное значение больше.

Например, для рассматриваемой задачи в 6-м наблюдении реальное значение объема продаж меньше модельного, т.к. остаток для этого наблюдения равен –47,82. В 10-м наблюдении реальное значение объема продаж больше модельного на 24,07, т.к. остаток для этого наблюдения равен 24,07.

В четвертой таблице Вывода итогов, помимо остатков и стандартных остатков, выводятся модельные значения зависимой переменной для каждого наблюдения. Для расчета модельных значений в построенной регрессионной модели фактор х должен последовательно принять все реальные значения из изучаемой выборки. Модельные значения зависимой переменной у выводятся в столбце Предсказанное у.

Для решаемой задачи столбец имеет название Предсказанное Объем и содержит модельные значения объема продаж для всех 15-ти наблюдений. Например, в 14-м наблюдении модельный объем продаж равен 1578. Это значение можно получить подстановкой в регрессионную модель значения цены для 14-го периода:

Объем = 3146 – 189· Цена = 3146 – 189· 8,31 = 1578.

Задача 4. Определение статистической достоверности построенной регрессионной модели.

Статистическая достоверность регрессионной модели проверяется с помощью нулевой гипотезы для коэффициента детерминации. Найдя отношение объясненной дисперсии на одну степень свободы к остаточной дисперсии на одну степень свободы, получаем величину статистики Фишера для решаемой задачи. Величина статистики Фишера выведена во второй таблице Вывода итогов в столбце F.

В нашем случае величина F равна 540.

С помощью статистики Фишера определяется вероятность выполнения нуль-гипотезы для коэффициента детерминации, которая выводится в столбце Значимость F.

В нашей задаче Значимость F равна нулю, следовательно, нулевая гипотеза отвергается на 95%-м уровне значимости, а коэффициент детерминации признается статистически достоверным.

Значимость F определяет:

– вероятность выполнения нулевой гипотезы для коэффициента детерминации R²;

– т.е. вероятность того, что наблюдений для проведения регрессии недостаточно.

После решения всех четырех задач регрессионного анализа делается общий вывод о качестве построенной модели. Особое внимание при оценке качества необходимо уделить следующим аспектам анализа:

связь между изучаемыми показателями должна быть тесной, т.е. коэффициент корреляции (Множественный R) должен быть больше или равен 0,7;
коэффициенты модели, определяющие меру влияния факторов на результат, должны быть достоверными, т.е. все Р-Значения должны быть меньше 5%;
регрессионная модель в целом должна быть достоверна (количество наблюдений должно быть достаточным), т.е. величина Значимость F должна быть меньше 5%;
результаты регрессионного анализа не должны содержать статистических выбросов, которые могут быть удалены.

После удаления статистических выбросов построенную регрессионную модель можно признать качественной. Однако перед нами еще стояла задача нахождения оптимальной цены товара, при которой достигается максимум выручки.

Выручку можно рассматривать как произведение цены на объем продаж. Для простоты введем обозначения: V – объем продаж, Р – цена единицы товара. Уравнение регрессии в таком случае записывается в следующем виде:

V = 3146 – 189· P.

Если обе части данного уравнения умножить на Р, то левая часть будет содержать формулу выручки, и можно записать:

VР = 3146· P – 189· P².

Из курса математического анализа известно, что для нахождения экстремума функции необходимо ее производную приравнять к нулю. Возьмем производную по цене от выручки и приравняем ее к нулю:

(V· P)'_p = 3146 – 189· P = 0.

Из последнего равенства легко найти оптимальное значение цены.

Если взять вторую производную от выручки по цене и проанализировать знак полученного результата, то можно убедиться в том, что в данной точке действительно достигается максимум функции, т.к. вторая производная отрицательна:

(V· P) ''_p = –189.

Т.о., для достижения максимальной выручки менеджеру следует установить цену продажи единицы товара на уровне 16,68 р.

1 В дальнейшем этот показатель будет обозначаться через x.

2 В дальнейшем этот показатель будет обозначаться через y.