Главная страница
Навигация по странице:

  • Исходные данные для выполнения задания

  • ЗАДАНИЕ № 2 Тема: Основы регрессионного анализа. Парная линейная регрессия Цель

  • ЗАДАНИЕ № 3 Тема: Основы регрессионного анализа. Множественная регрессия Цель

  • ЗАДАНИЕ № 4 Тема: Основы анализа временных рядов Цель

  • 2. КУРСОВАЯ РАБОТА Тема: Построение и анализ регрессионных моделей Цель

  • 3. ТРЕБОВАНИЯ К СОДЕРЖАНИЮ ОТЧЕТА

  • ЛИТЕРАТУРА Основная литература

  • Дополнительная литература

  • Интернет-ресурсы и информационно-справочные материалы

  • Лабораторные работы. Тема Первичный статистический анализ


    Скачать 76.33 Kb.
    НазваниеТема Первичный статистический анализ
    Дата28.04.2022
    Размер76.33 Kb.
    Формат файлаdocx
    Имя файлаЛабораторные работы.docx
    ТипДокументы
    #502757

    ЗАДАНИЕ № 1

    Тема: Первичный статистический анализ.
    Корреляционный анализ


    Цель:


    Постановка задачи
    Крупное торговое предприятие реализует различные виды товаров в 50 торговых точках. Каждый магазин сети фиксирует в общей базе данных сведения о количестве покупателей и выручке, получаемой по каждому товару. Необходимо проанализировать собранные за день работы торговой сети данные с помощью методов первичного статистического анализа и корреляционного анализа.
    Порядок выполнения


    1. По имеющимся результатам наблюдений для каждого показателя определить основные статистические характеристики (среднее, медиану, дисперсию, среднеквадратическое отклонение, коэффициенты асимметрии и эксцесса, коэффициент вариации1), сделать предварительные выводы о свойствах выборки.

    2. Провести разбиение выборок на классы однородности и построить гистограммы. Проанализировать полученные графики.

    3. Сформулировать и проверить гипотезу о согласии выборочных данных с нормальным распределением на основе критерия χ2-Пирсона. Сделать выводы.

    4. Нанести исходные данные на координатную плоскость и сделать обоснованное предварительное заключение о наличии (отсутствии) связи между всеми парами факторов, а также о ее характере (положительная или отрицательная) и форме (линейная или нелинейная).

    5. Рассчитать парные коэффициенты корреляции для каждой пары показателей. Построить корреляционную матрицу. Используя t-критерий Стьюдента, проверить значимость полученных коэффициентов корреляции. Сделать выводы о тесноте связи между факторами.

    6. Для каждой пары показателей вычислить частный коэффициент корреляции и проверить его на значимость. Для значимых коэффициентов построить 95% доверительные интервалы. Сделать выводы.

    7. Вычислить все возможные множественные коэффициенты корреляции. Сделать выводы.

    8. По результатам работы сделать общие выводы и сформулировать рекомендации.

    Исходные данные для выполнения задания
    Каждый вариант содержит информацию о числе посетителей и выручке от продаж четырех видов товаров. Статистические данные и номера вариантов распределяются преподавателем.

    Инструментарий
    Теоретические материалы, необходимые для выполнения задания, содержатся в [4]: для задач 1-3 – в разделе 8.2, для задач 4-7 – в главе 2. Также студенты могут воспользоваться следующими функциями MS Excel [10].

    арифметическое среднее СРЗНАЧ()

    медиана МЕДИАНА()

    дисперсия ДИСП()

    среднеквадратическое отклонение СТАНДОТКЛОН()

    коэффициент асимметрии СКОС()

    коэффициент эксцесса ЭКСЦЕСС()

    квантиль распределения Стьюдента СТЬЮДЕНТРАСПОБР()

    квантиль распределения -Пирсона ХИ2ОБР()

    коэффициент парной корреляции КОРРЕЛ()

    При построении гистограмм для определения числа элементов выборки, попадающих в заданный интервал, можно применять функцию
    СЧЁТЕСЛИ(). Кроме того, для вычисления матрицы коэффициентов парной корреляции можно использовать надстройку MS Excel "Корреляция" в разделе "Анализ данных" [10].
    Контрольные вопросы


    1. Понятие выборки и генеральной совокупности.

    2. Основные выборочные характеристики и их статистическая интерпретация.

    3. Основные частотные характеристики эмпирического распределения.

    4. Гипотеза о согласии с нормальным распределением и порядок ее проверки.

    5. Основные виды зависимостей рядов данных.

    6. Понятие корреляционного поля. Анализ корреляционного поля.

    7. Парный коэффициент корреляции. Основные свойства.

    8. Проверка значимости коэффициента корреляции.

    9. Парный, частный и множественный коэффициенты корреляции. Определения и основные отличия.

    ЗАДАНИЕ № 2

    Тема: Основы регрессионного анализа. Парная линейная регрессия
    Цель: ознакомиться с основными положениями, понятиями и методами анализа линейной модели парной регрессии;
    Постановка задачи
    По результатам корреляционного анализа (см. задание №1) выбрать пару факторов, которые связаны наиболее тесно, обозначив их x и y соответственно. Полагая, что связь между ними может быть описана линейной функцией, записать уравнения и , определяющие искомую связь.
    Порядок выполнения


    1. Вычислить оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Дать содержательную интерпретацию результатов и выбрать для дальнейшего анализа одно из уравнений.

    2. Проверить значимость всех параметров выбранной модели регрессии по критерию Стьюдента. Для значимых коэффициентов построить доверительные интервалы. Сформулировать выводы.

    3. Проверить значимость модели (уравнения регрессии) в целом с помощью критерия Фишера. Сформулировать выводы.

    4. Построить таблицу дисперсионного анализа, сделать выводы.

    5. Выбрать прогнозную точку xП в стороне от основного массива данных. Используя уравнение регрессии, выполнить точечный и интервальный прогнозы величины y в точке xП. Проанализировать полученные результаты.

    6. Построить 95% доверительный интервал для уравнения регрессии на всем диапазоне исходных данных. Изобразить в одной системе координат исходные данные, линию регрессии, 95% доверительный интервал, проанализировать полученный график.

    7. Сделать общие выводы, касающиеся проделанной работы и эконометрической интерпретации полученных результатов, разработать рекомендации.


    Инструментарий
    Теоретические материалы, необходимые для выполнения данного задания, содержатся в [4], в главе 3. Также студенты могут воспользоваться функцией ЛИНЕЙН() для оценки параметров парной регрессии или надстройкой MS Excel "Регрессия" в разделе "Анализ данных" [10].
    Контрольные вопросы


    1. Определение регрессии. Виды регрессии.

    2. Модель парной регрессии. Содержательный смысл ее элементов.

    3. Метод наименьших квадратов. Основные предположения.

    4. Теорема Гаусса-Маркова, ее содержательный смысл.

    5. Свойства оценок метода наименьших квадратов.

    6. Интерпретация параметров и модели парной регрессии. Смысловое различие величин , и , .

    7. Остатки и ошибки модели парной регрессии.

    8. Гипотеза о значимости параметра. Порядок проверки.

    9. Построение доверительных интервалов для параметров регрессионного

    уравнения.

    1. Что такое TSS, RSS, ESS? Как связаны между собой эти величины?

    2. Коэффициент детерминации. Основные свойства.

    3. Проверка значимости регрессионного уравнения.

    4. Понятие и виды прогнозирования в регрессионных моделях.


    ЗАДАНИЕ № 3
    Тема: Основы регрессионного анализа. Множественная регрессия
    Цель: ознакомиться с основными положениями, понятиями и методами анализа линейных моделей множественной регрессии.
    Постановка задачи
    Мелкооптовый магазин реализует хозяйственные товары. Руководство магазина заинтересовано в анализе факторов, влияющих на показатели прибыли предприятия. Имеются данные о полученной прибыли (y) и количестве проданных товаров за определенный период времени ( – мыло, – стиральный порошок, – средство для мытья посуды, – краска, – монтажная пена). Необходимо исследовать данные при помощи методов множественного регрессионного анализа.
    Порядок выполнения


    1. Записать уравнение линейной зависимости прибыли от объемов реализации проданных товаров.

    2. С помощью метода наименьших квадратов найти оценки всех неизвестных параметров уравнения регрессии. Проинтерпретировать результаты.

    3. Проверить значимость параметров уравнения по критерию Стьюдента. Для значимых коэффициентов построить доверительные интервалы. Сделать выводы.

    4. Вычислить коэффициент детерминации и с помощью критерия Фишера проверить на значимость построенное регрессионное уравнение. Сделать выводы.

    5. Построить корреляционную матрицу всех регрессоров, с ее помощью исследовать вопрос о наличии мультиколлинеарности в регрессионной модели. По результатам анализа выявить регрессоры, присутствие которых в модели снижает эффект мультиколлинеарности, и записать новую модель регрессии. Оценить параметры этой модели, проверить их значимость, сравнить качество новой модели с первоначальной. Сделать выводы.

    6. Построить 95% доверительные интервалы для обоих уравнений регрессии на всем диапазоне исходных данных, изобразить в одной системе координат исходные данные, линии регрессии, 95% доверительные интервалы. Проанализировать полученные результаты.

    7. Сделать общие выводы, касающиеся проделанной работы и интерпретации полученных результатов, разработать рекомендации.


    Исходные данные для выполнения задания
    Каждый вариант содержит информацию о прибыли и объеме продаж пяти видов товаров. Статистические данные и номера вариантов распределяются преподавателем.
    Инструментарий
    Теоретические материалы, необходимые для выполнения задания, содержатся в [4], в главе 4.

    Также студенты могут воспользоваться функцией ЛИНЕЙН() для оценки параметров парной регрессии или надстройками MS Excel "Корреляция" и "Регрессия" в разделе "Анализ данных"[10].
    Контрольные вопросы


    1. Модель множественной регрессии. Основные определения. Матричные обозначения.

    2. Отличия моделей парной и множественной регрессии. Теорема Гаусса-Маркова.

    3. Метод наименьших квадратов для модели множественной регрессии.

    4. Гипотеза о значимости параметра. Порядок проверки.

    5. Построение доверительных интервалов для параметров регрессионного уравнения.

    6. Проверка значимости регрессионного уравнения.

    7. Мультиколлинеарность и ее признаки. Методы выявления мультиколлинеарности.

    8. Методы устранения мультиколлинеарности.

    9. Методы ранжирования входных факторов.

    10. Коэффициенты эластичности: определение и виды.

    ЗАДАНИЕ № 4
    Тема: Основы анализа временных рядов
    Цель: ознакомиться с основными понятиями, статистическими характеристиками и методами, используемыми при анализе временных рядов.
    Постановка задачи
    Руководство супермаркета заинтересовано в оптимизации управления запасами. Для этого необходимо с помощью методов анализа временных рядов изучить динамику продаж определенной категории товаров.
    Порядок выполнения


    1. Построить график заданного временного ряда, провести первичный статистический анализ временного ряда, включая вычисление среднего значения и мер разброса.

    2. Построить и проанализировать график автокорреляционной функции. Сделать предварительные заключения о наличии неслучайных компонент в разложении временного ряда.

    3. На основе критериев серий, восходящих и нисходящих серий, Фостера-Стьюарта, Аббе и инверсий проверить гипотезу о наличии неслучайных компонент во временных рядах, сделать выводы.

    4. Выделить сезонную компоненту временного ряда на основе метода скользящего среднего. Сделать выводы.

    5. Провести аналитическое выравнивание временного ряда, полученного после устранения сезонной компоненты, используя в качестве модели тренда линейную модель парной регрессии. Провести оценку значимости параметров и модели в целом. Сделать выводы.

    6. Вычислить точечные и интервальные прогнозные значения временного ряда на сезон вперед, сделать выводы.

    7. Разработать рекомендации по результатам проделанной работы.


    Исходные данные для выполнения задания
    Каждый вариант содержит информацию о ежедневных продажах определенной категории товаров в течение десяти недель. Статистические данные и номера вариантов распределяются преподавателем.
    Инструментарий
    Теоретические материалы, необходимые для выполнения задания, содержатся в [4], в главах 6 и 7.

    Также студенты могут воспользоваться функцией ЛИНЕЙН() для оценки параметров линейного тренда или надстройками MS Excel "Корреляция" и "Регрессия" в разделе "Анализ данных"[10].
    Контрольные вопросы


    1. Пространственные и временные данные: специфика и особенности построения моделей. Определение временного ряда.

    2. Основные типы факторов, определяющих значения временного ряда.

    3. Аддитивная и мультипликативная модели временного ряда.

    4. Стационарность временного ряда в широком и узком смысле.

    5. Автоковариационная и автокорреляционная функции.

    6. Коррелограммы временных рядов при наличии только случайной компоненты; при наличии тренда; при наличии сезонной компоненты; при наличии нескольких компонент одновременно.

    7. Гипотеза о наличии в структуре временного ряда неслучайных компонент и ее проверка.

    8. Критерий серий.

    9. Критерий восходящих и нисходящих серий.

    10. Критерий Аббе.

    11. Критерий Фостера-Стюарта.

    12. Критерий инверсий.

    13. Метод скользящего среднего.

    14. Метод отклонений от тренда.


    2. КУРСОВАЯ РАБОТА
    Тема: Построение и анализ регрессионных моделей
    Цель: ознакомиться с основными методами построения, анализа и выбора регрессионных моделей.
    Постановка задачи
    Федеральной службой государственной статистики Российской Федерации ежеквартально проводятся бюджетные обследования домашних хозяйств по всем регионам России об условиях проживания и уровне благосостояния населения [12]. Необходимо проанализировать данные обследования о расходах и доходах домохозяйств по заданному территориальному округу (переменная ТЕРРИТОРИЯ) и типу населенного пункта (город/село, переменная ТИПНАС). В рамках работы считается, что домохозяйства описываются следующими показателями:

    1. расходы на продукты питания (переменная ПРОДПИТ, y1);

    2. расходы на непродовольственные товары (переменная НЕПРОД, y2);

    3. расходы на оплату услуг (переменная УСЛУГИ, y3);

    4. расходы на покупку алкогольной продукции (переменная АЛКО, x0);

    5. доходы домохозяйства (переменная ДОХОД, x1);

    6. сбережения домохозяйства (переменная СБЕРЕЖ, x2);

    7. число людей в домохозяйстве (ЧИСЛОЛЮД, x3);

    8. число детей в домохозяйстве (ЧИСЛОДЕТ, x4).

    Требуется построить, проанализировать и проинтерпретировать модель, описывающую изменение значения отклика (y) в зависимости от значений объясняющих переменных (x0, x1, x2, x3 и x4) в пределах указанной территории и типа населенного пункта.
    Порядок выполнения


    1. Построить корреляционные поля по данным о значениях отклика и каждом объясняющем показателе x0, x1, x2, x3, x4. Сделать предварительное заключение о наличии (отсутствии) связи между этими факторами, о ее виде и форме, а также о наличии аномальных наблюдений (выбросов).

    2. Провести формальную проверку на наличие выбросов путем обнаружения всех наблюдений i, для которых выполняется соотношение , где Х – матрица всех значений входных переменных x1 и x2, i-я строка этой матрицы. Удалить из выборки обнаруженные выбросы, указать их долю во всем объеме выборки.

    3. На основе оставшихся наблюдений провести первичный эконометрический анализ, включающий расчет основных выборочных характеристик и построение гистограмм. Cделать выводы, проинтерпретировать полученные результаты.

    4. Рассчитать выборочные парные коэффициенты корреляции для всех возможных пар переменных (в случае порядковых переменных – число людей и число детей – воспользоваться коэффициентами ранговой корреляции Спирмена), проверить их на значимость по критерию Стьюдента, сделать выводы о наличии и тесноте взаимосвязи между признаками.

    5. Построить линейную модель множественной регрессии для отклика, определенного по варианту задания, и входных переменных . Оценить ее по методу наименьших квадратов. Проинтерпретировать полученные значения оценок параметров модели. Проверить параметры модели на значимость. Оценить качество построенной модели на основе критерия Фишера. Сделать выводы.

    6. Проранжировать входные факторы по степени влияния на отклик при помощи коэффициентов эластичности. Сделать выводы.

    7. С помощью критерия Голдфельда-Квандта или Бартлетта изучить модель на предмет наличия гетероскедастичности относительно переменной x1. При помощи критерия Глейзера или Уайта оценить форму гетероскедастичности. Избавиться от гетероскедастичности путем корректировки исходных данных (значений отклика).

    8. Оценить заново параметры модели множественной регрессии, проверить их на значимость по критерию Стьюдента, выяснить вопрос о значимости модели в целом по критерию Фишера. Сравнить полученные результаты с исходной моделью, сделать выводы.

    9. На основе лучшего по критерию Фишера уравнения рассчитать частное уравнение регрессии для наиболее часто встречающихся в данных значениях числа людей и числа детей в домохозяйстве и при медианных значениях остальных входных факторов. Изобразить на графике исходные данные (без выбросов), линию регрессии и 95%-й доверительный интервал. Проанализировать полученные результаты.

    10. Сделать общие выводы по проделанной работе в терминах исходных показателей, дать рекомендации для заданного вариантом региона Российской Федерации и соответствующего типа местности.


    Исходные данные для выполнения задания
    Каждый вариант содержит информацию о значениях исследуемых показателей для конкретного региона Российской Федерации. Выбор задания по вариантам осуществляется в соответствии с файлом с данными, предоставляемом преподавателем.
    Инструментарий
    Теоретические материалы, необходимые для выполнения работы, содержатся в [4], в главах 2, 3, 4.

    Также студенты могут воспользоваться функцией ЛИНЕЙН() для оценки параметров регрессионных моделей или надстройками MS Excel "Корреляция" и "Регрессия" в разделе "Анализ данных" [10].
    Контрольные вопросы

    1. Парный коэффициент корреляции. Основные свойства.

    2. Проверка значимости коэффициента корреляции.

    3. Модель парной регрессии. Содержательный смысл ее элементов.

    4. Метод наименьших квадратов. Основные предположения.

    5. Гипотеза о значимости параметра. Порядок проверки.

    6. Построение доверительных интервалов для параметров регрессионного уравнения.

    7. Способы ранжирования входных факторов в модели множественной регрессии.

    8. Что такое TSS, RSS, ESS? Как связаны между собой эти величины?

    9. Коэффициент детерминации. Основные свойства.

    10. Проверка значимости регрессионного уравнения.

    11. Гетероскедастичность и ее признаки.

    12. Методы выявления гетероскедастичности.

    13. Методы устранения гетероскедастичности.


    3. ТРЕБОВАНИЯ К СОДЕРЖАНИЮ ОТЧЕТА
    Каждая работа предполагает оформление отчета, который должен отражать ход выполнения всех заданий работы. Он включает в себя:

    1. Титульный лист.

    2. Цель и задачи работы.

    3. Описание хода выполнения (порядок действий) работы.

    4. Результаты (расчеты, графики, таблицы и т.п.).

    5. Выводы и рекомендации (результаты обработки исходных данных и оценка полноты решения поставленной задачи).

    Отчет должен быть представлен в распечатанном виде.
    ЛИТЕРАТУРА
    Основная литература

    1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.Т.1. - М.: Юнити, 1998. – 1022 с.

    2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Т.2. - М.: Юнити, 2001. – 432 с.

    3. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. – М.: Дело, 2001. – 400 с.

    4. Тимофеев В.С., Фаддеенков А.В., Щеколдин В.Ю. Эконометрика Новосибирск: Изд-во НГТУ, 2015. – 354 с.

    5. Бабешко Л.О. Основы эконометрического моделирования. – М.: КомКнига, 2006. – 432 с.

    6. Вербик М. Путеводитель по современной эконометрике. – М.: Научная книга, 2008. - 616 с.


    Дополнительная литература

    1. Green W.H. Econometric analysis. 6th edition. – Prentice Hall, 2007. – 1216 p.

    2. Gujarati D. N., Porter D. C. Basic econometrics. 5th edition. - New York: The McGraw-Hill series, Economics. - 922 p.

    3. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. – 416 с.

    4. Винстон У.Л. Бизнес-моделирование и анализ данных. Решение актуальных задач с помощью Microsoft Excel. СПб.: Питер, 2018. – 864 с.

    5. Доугерти К. Введение в эконометрику. – М.: МГУ, 1999. – 402 с.


    Интернет-ресурсы и информационно-справочные материалы

    1. Федеральная служба государственной статистики (Росстат) [Электронный ресурс] : официальный интернет-ресурс.- Федеральная служба государственной статистики, 1999-2017. - Режим доступа: http://www.gks.ru. - Загл. с экрана.

    2. Система доступа к результатам обследований (Росстат) [Электронный ресурс] : официальный интернет-ресурс.- Федеральная служба государственной статистики, 1999-2017. - Режим доступа: http://www.obdx.gks.ru. - Загл. с экрана.

    3. The World Bank [Электронный ресурс]: официальный сайт Всемирного банка. - The World Bank Group, 2017. - Режим доступа: http://www.worldbank.org. - Загл. с экрана.

    1 Выборочное значение коэффициента вариации, являющееся мерой относительной изменчивости наблюдаемой случайной величины, вычисляют по формуле , где – среднее, а – среднеквадратическое отклонение.



    написать администратору сайта