щщ. БАЗДАРЕВА МУ раздела КНИР1 по курсу Анализ данных и аналитика в. Методические указания к выполнению раздела книр1 по курсу Анализ данных и аналитика в принятии решений

Название	Методические указания к выполнению раздела книр1 по курсу Анализ данных и аналитика в принятии решений
Дата	06.02.2023
Размер	471.8 Kb.
Формат файла
Имя файла	БАЗДАРЕВА МУ раздела КНИР1 по курсу Анализ данных и аналитика в.docx
Тип	Методические указания #922583
страница	1 из 4

1 2 3 4

Министерство образования и науки РФ

Федеральное государственное автономное образовательное

учреждения высшего образования

«Национальный исследовательский технологический университет «МИСиС»

Институт информационных технологий и компьютерных наук

Кафедра бизнес-информатики и систем управления производством

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

к выполнению раздела КНИР1

по курсу «Анализ данных и аналитика в принятии решений»

Направление подготовки: 38.03.05 Бизнес-информатика

Профиль: Архитектура предприятия и

Направление подготовки:38.03.03 Прикладная информатика

Профиль: Прикладная информатика в экономике
Семестр 5

Согласованно:		Утвердил:
Консультант по анализу данных Доцент каф. БИСУП Баздарева З.В.		Руководитель программы обучения, зав.кафедрой БИСУП Пятецкий В.Е
Подпись: _________		Подпись: _________
	Москва 2021

Содержание

Цели и задачи раздела КНИР1 по курсу «Анализ данных и аналитика в принятии решений»…………………………………………………………...................................3
Постановка задачи раздела КНИР1 с полным набором числовых данных…………3
Методы анализа информации и прогнозирования показателей функционирования систем……………………………………………………………………………………4

Множественная регрессия………………………………………………………….4

3.1.1.Отбор факторов для построения множественной регрессии……………….4

3.1.2. Оценка параметров модели, значимости уравнения множественной регрессии и её коэффициентов……………………………………………………………….5.

3.1.3.Прогнозирование на основе разработанной эконометрической модели….5

3.1.4 Примеры к разделу 3.1……………………………………………………….5

3.2 Временные ряды…………………………………………………………………….12

3.2.1. Задачи анализа временных рядов……………………………………………12

3.2.2. Пример к разделу 3.2…………………………………………………………13

3.2.3. Анализ аддитивной и мультипликативной моделей временных

рядов……………………………………………………………………………………………17

3.3 Дисперсионный анализ информации……………………………………………….22

3.3.1. Однофакторный дисперсионный анализ……………………………………..22

3.3.2. Примеры к разделу 3.2………………………………………………………. 23

3.3.3. Двухфакторный дисперсионный анализ……………………………………..27

3.4 Кластерный анализ…………………………………………………………………...27

Заключение в разделе КНИР1 «Анализ данных и аналитика в принятии решений»..28
Библиографический список……………………………………………………………...28

1. Цели и задачи раздела КНИР1 «Анализ данных и аналитика в принятии решений»

Получение информации о показателях состояния и эффективности исследуемого объекта, бизнес-процесса, системы, предприятия по имеющимся статистическим данным;
Выявление на фоне случайных отклонений основных закономерностей, присущих исследуемому объекту, бизнес-процессу, рынку, исходя из накопленной информации;
Количественная оценка факторов, влияющих на исследуемые результативные экономические показатели;
Построение модели исследуемого бизнес-процесса или системы;
Количественная оценка показателей модели;
Интерпретация результатов анализа данных;
Оценка достоверности и точности модели и, получаемых на её основе, выводов и заключений.
Выводы на основе полученных результатов с рекомендуемыми управленческими решениями

2. Постановка задачи раздела КНИР1
Реальная бизнес статистика в качестве отдельного наблюдения содержит как исследуемый показатель Y, так и значения тех факторов, для которых соответствующее значение Y было зафиксировано. В разделе должна быть дана ссылка на сайты из которых собрана информация для анализа

Требуется обработать данные о показателях исследуемого бизнес-процесса или системы, выявить существующие закономерности для того, чтобы в дальнейшем прогнозировать результативные экономические показатели с требующейся достоверностью. Для этой цели использовать модель множественной регрессии или (и) модели временных рядов: аддитивного или мультипликативного, в зависимости от исходной информации. Для систематизации и группировки данных, например, когда требуется определить наиболее эффективные методы управления персоналом, следует ставить задачу и использовать методы дисперсионного и(или) кластерного анализа.
3. Методы анализа информации и прогнозирования показателей функционирования систем
3. 1. Множественная регрессия

Подробно построение множественной и парной линейной и нелинейной регрессии изложено в [2], [3].
3.1.1. Отбор факторов при построении множественной регрессии.

Отбор факторов производится на основе качественного теоретико-экономического анализа и обычно осуществляется в две стадии:

– на первой стадии факторы подбираются исходя из сущности проблемы;

– на второй стадии применяются формальные статистические критерии

№ наблюдения	Y	Х₁	Х₂

Таблица 1

Факторы Х₁ и Х₂ и др. не должны быть взаимно коррелированы. По исходным данным вычисляется матрица выборочных парных коэффициентов корреляции и выявляются пары переменных, имеющих высокие коэффициенты корреляции. Если такие переменные существуют, то говорят о мультиколлинеарности между ними.

В уравнение регрессии, как правило, включается только один из коллинеарных факторов, при этом предпочтение отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.

После исключения коллинеарных факторов осуществляется процедура отбора факторов, наиболее влияющих на изменение результативного признака (факторов, включаемых в регрессию). Ранжирование факторов выполняется на основе значений частных коэффициентов корреляции.

Значимость факторов, включенных в уравнение регрессии, проверяется с помощью частного критерия Фишера.

Кроме точности модели, для исследователя наиболее важными качествами модели являются простота модели и возможность наглядной интерпретации параметров модели.

По этой причине наиболее широко используются линейная и степенная модели.

3.1.2. Оценка параметров модели, значимости уравнения множественной регрессии и её коэффициентов

Для оценки параметров уравнения множественной регрессии применяется метод наименьших квадратов (МНК), в EXCEL можно использовать также надстройку АНАЛИЗ ДАННЫХ.

Величина коэффициента детерминации используется для оценки качества регрессионной модели. Чем его величина больше, тем лучше данная модель согласуется с данными наблюдений.

Низкое значение коэффициента (индекса) множественной корреляции означает, что, либо в регрессионную модель не включены существенные факторы, либо рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. В этом случае требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.

Статистическая значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера. Статистическая значимость коэффициентов уравнения множественной регрессии и интервальная оценка параметров уравнения производится с помощью t-критерия Стьюдента.

Оценки параметров, полученные МНК, являются эффективными только при выполнении предпосылок МНК. После построения модели следует вычислить остатки регрессии и проверить, удовлетворяются ли предпосылки. В частности, определить, какая ситуация – гомоскедастичность или гетероскедастичность имеет место. Для оценки гетероскедастичности можно использовать тест Гольдфельда–Квандта.

При нарушении гомоскедастичности рекомендуется заменять традиционный метод наименьших квадратов обобщенным методом [3].
3.1.3. Оценка неизвестных значений зависимой переменной
На основе полученной модели осуществляется точечный и интервальный прогноз значений исследуемого показателя, анализ особенностей влияния учтенных в модели факторов на исследуемый показатель.
3.1.4 Примеры к разделу 3.1

Пример 1. По четырнадцати филиалам страховой компании ПАО «САК «Энергогарант» имеются данные, характеризующие зависимость чистой годовой прибыли от годовых размеров собственных средств, страховых резервов, страховых премий и страховых выплат (млн руб.) (таблица 1). Объем привлеченных средств составляет менее 10% и в расчете не рассматривается. По исходным данным необходимо построить и исследовать уравнение множественной линейной регрессии.
Таблица 2 – Исходные данные

№ филиала	Годовая прибыль	Собственные средства	Страховые резервы	Страховые премии	Страховые выплаты
1	92	3444	9563	11456	1659
2	42	2658	6354	5249	2625
3	186	9723	10245	12968	4489
4	48	4526	6398	7589	6896
5	38	5369	5692	7256	5698
6	74	2248	6359	4963	4321
7	48	5671	6892	7259	6692
8	82	4312	7256	6935	756
9	45	2226	8256	2693	5532
10	46	3654	5982	6324	3235
11	65	2635	6359	7853	5325
12	29	2463	7532	8253	6862
13	34	3265	5632	7564	6325
14	66	7546	7625	9638	4569

1 2 3 4