щщ. БАЗДАРЕВА МУ раздела КНИР1 по курсу Анализ данных и аналитика в. Методические указания к выполнению раздела книр1 по курсу Анализ данных и аналитика в принятии решений
Скачать 471.8 Kb.
|
Министерство образования и науки РФ Федеральное государственное автономное образовательное учреждения высшего образования «Национальный исследовательский технологический университет «МИСиС» Институт информационных технологий и компьютерных наук Кафедра бизнес-информатики и систем управления производством МЕТОДИЧЕСКИЕ УКАЗАНИЯ к выполнению раздела КНИР1 по курсу «Анализ данных и аналитика в принятии решений» Направление подготовки: 38.03.05 Бизнес-информатика Профиль: Архитектура предприятия и Направление подготовки:38.03.03 Прикладная информатика Профиль: Прикладная информатика в экономике Семестр 5
Содержание Цели и задачи раздела КНИР1 по курсу «Анализ данных и аналитика в принятии решений»…………………………………………………………...................................3 Постановка задачи раздела КНИР1 с полным набором числовых данных…………3 Методы анализа информации и прогнозирования показателей функционирования систем……………………………………………………………………………………4 Множественная регрессия………………………………………………………….4 3.1.1.Отбор факторов для построения множественной регрессии……………….4 3.1.2. Оценка параметров модели, значимости уравнения множественной регрессии и её коэффициентов……………………………………………………………….5. 3.1.3.Прогнозирование на основе разработанной эконометрической модели….5 3.1.4 Примеры к разделу 3.1……………………………………………………….5 3.2 Временные ряды…………………………………………………………………….12 3.2.1. Задачи анализа временных рядов……………………………………………12 3.2.2. Пример к разделу 3.2…………………………………………………………13 3.2.3. Анализ аддитивной и мультипликативной моделей временных рядов……………………………………………………………………………………………17 3.3 Дисперсионный анализ информации……………………………………………….22 3.3.1. Однофакторный дисперсионный анализ……………………………………..22 3.3.2. Примеры к разделу 3.2………………………………………………………. 23 3.3.3. Двухфакторный дисперсионный анализ……………………………………..27 3.4 Кластерный анализ…………………………………………………………………...27 Заключение в разделе КНИР1 «Анализ данных и аналитика в принятии решений»..28 Библиографический список……………………………………………………………...28 1. Цели и задачи раздела КНИР1 «Анализ данных и аналитика в принятии решений» Получение информации о показателях состояния и эффективности исследуемого объекта, бизнес-процесса, системы, предприятия по имеющимся статистическим данным; Выявление на фоне случайных отклонений основных закономерностей, присущих исследуемому объекту, бизнес-процессу, рынку, исходя из накопленной информации; Количественная оценка факторов, влияющих на исследуемые результативные экономические показатели; Построение модели исследуемого бизнес-процесса или системы; Количественная оценка показателей модели; Интерпретация результатов анализа данных; Оценка достоверности и точности модели и, получаемых на её основе, выводов и заключений. Выводы на основе полученных результатов с рекомендуемыми управленческими решениями 2. Постановка задачи раздела КНИР1 Реальная бизнес статистика в качестве отдельного наблюдения содержит как исследуемый показатель Y, так и значения тех факторов, для которых соответствующее значение Y было зафиксировано. В разделе должна быть дана ссылка на сайты из которых собрана информация для анализа Требуется обработать данные о показателях исследуемого бизнес-процесса или системы, выявить существующие закономерности для того, чтобы в дальнейшем прогнозировать результативные экономические показатели с требующейся достоверностью. Для этой цели использовать модель множественной регрессии или (и) модели временных рядов: аддитивного или мультипликативного, в зависимости от исходной информации. Для систематизации и группировки данных, например, когда требуется определить наиболее эффективные методы управления персоналом, следует ставить задачу и использовать методы дисперсионного и(или) кластерного анализа. 3. Методы анализа информации и прогнозирования показателей функционирования систем 3. 1. Множественная регрессия Подробно построение множественной и парной линейной и нелинейной регрессии изложено в [2], [3]. 3.1.1. Отбор факторов при построении множественной регрессии. Отбор факторов производится на основе качественного теоретико-экономического анализа и обычно осуществляется в две стадии: – на первой стадии факторы подбираются исходя из сущности проблемы; – на второй стадии применяются формальные статистические критерии
Таблица 1 Факторы Х1 и Х2 и др. не должны быть взаимно коррелированы. По исходным данным вычисляется матрица выборочных парных коэффициентов корреляции и выявляются пары переменных, имеющих высокие коэффициенты корреляции. Если такие переменные существуют, то говорят о мультиколлинеарности между ними. В уравнение регрессии, как правило, включается только один из коллинеарных факторов, при этом предпочтение отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. После исключения коллинеарных факторов осуществляется процедура отбора факторов, наиболее влияющих на изменение результативного признака (факторов, включаемых в регрессию). Ранжирование факторов выполняется на основе значений частных коэффициентов корреляции. Значимость факторов, включенных в уравнение регрессии, проверяется с помощью частного критерия Фишера. Кроме точности модели, для исследователя наиболее важными качествами модели являются простота модели и возможность наглядной интерпретации параметров модели. По этой причине наиболее широко используются линейная и степенная модели. 3.1.2. Оценка параметров модели, значимости уравнения множественной регрессии и её коэффициентов Для оценки параметров уравнения множественной регрессии применяется метод наименьших квадратов (МНК), в EXCEL можно использовать также надстройку АНАЛИЗ ДАННЫХ. Величина коэффициента детерминации используется для оценки качества регрессионной модели. Чем его величина больше, тем лучше данная модель согласуется с данными наблюдений. Низкое значение коэффициента (индекса) множественной корреляции означает, что, либо в регрессионную модель не включены существенные факторы, либо рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. В этом случае требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости. Статистическая значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера. Статистическая значимость коэффициентов уравнения множественной регрессии и интервальная оценка параметров уравнения производится с помощью t-критерия Стьюдента. Оценки параметров, полученные МНК, являются эффективными только при выполнении предпосылок МНК. После построения модели следует вычислить остатки регрессии и проверить, удовлетворяются ли предпосылки. В частности, определить, какая ситуация – гомоскедастичность или гетероскедастичность имеет место. Для оценки гетероскедастичности можно использовать тест Гольдфельда–Квандта. При нарушении гомоскедастичности рекомендуется заменять традиционный метод наименьших квадратов обобщенным методом [3]. 3.1.3. Оценка неизвестных значений зависимой переменной На основе полученной модели осуществляется точечный и интервальный прогноз значений исследуемого показателя, анализ особенностей влияния учтенных в модели факторов на исследуемый показатель. 3.1.4 Примеры к разделу 3.1 Пример 1. По четырнадцати филиалам страховой компании ПАО «САК «Энергогарант» имеются данные, характеризующие зависимость чистой годовой прибыли от годовых размеров собственных средств, страховых резервов, страховых премий и страховых выплат (млн руб.) (таблица 1). Объем привлеченных средств составляет менее 10% и в расчете не рассматривается. По исходным данным необходимо построить и исследовать уравнение множественной линейной регрессии. Таблица 2 – Исходные данные
|