анализ коррект. Лабораторная работа 4. использование Корреляционного анализа в задачах статистического исследования результатов научного эксперимента
Скачать 335.5 Kb.
|
Лабораторная работа №4. использование Корреляционного анализа в задачах статистического исследования результатов научного эксперимента Цель работы: Приобретение навыков корреляционного анализа в задачах статистического исследования с применением программного продукта MSExcel. Теоретический материал и инструкции по применению программного средства Параметрический корреляционный анализ Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками. Обычно связь между выборками носит не функциональный, а вероятностный (или стохастический) характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении стохастических зависимостей различают корреляцию и регрессию. Корреляционный анализ состоит в определении степени связи между двумя случайными величинами Xи Y. В качестве меры такой связи используется коэффициент корреляции. Коэффициент корреляции оценивается по выборке объема п связанных пар наблюдений (xi, yi) из совместной генеральной совокупности Xи Y. Существует несколько типов коэффициентов корреляции, применение которых зависит от измерения (способа шкалирования) величин Xи Y. Для оценки степени взаимосвязи величин Xи Y, измеренных в количественных шкалах, используется коэффициент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки Xи Y распределены по нормальному закону. При таком распределении большая часть значений группируется около некоторого среднего значения, по обе стороны от которого частота наблюдений равномерно снижается. 1. Линейный коэффициент корреляции — параметр, который характеризует степень линейной взаимосвязи между двумя выборками, рассчитывается по формуле (4.1): (4.1) где хi — значения, принимаемые в выборке X, yi — значения, принимаемые в выборке Y; — средняя по X, — средняя по Y. Коэффициент корреляции изменяется от -1 до 1. Когда при расчете получается величина большая +1 или меньшая -1 — следовательно, произошла ошибка в вычислениях. При значении 0 линейной зависимости между двумя выборками нет. Знак коэффициента корреляции очень важен для интерпретации полученной связи. Если знак коэффициента линейной корреляции — плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости. Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости. (см. таблицу 4.1): Таблица 4.1 Теснота связи и величина коэффициента корреляции.
Для того чтобы оценить наличие связи между двумя переменными, также можно использовать t-статистику Стьюдента, которая оценивает отношение величины линейного коэффициента корреляции к среднему квадратичному отклонению и рассчитывается по формуле (4.2) (4.2) Полученную величину tрасч сравнивают с табличным значением t-критерия Стьюдента с n-2 степенями свободы. Если tрасч > tтабл, то практически невероятно, что найденное значение обусловлено только случайными совпадениями величин X и Y в выборке из генеральной совокупности, т.е. существует зависимость между X и Y. И наоборот, если tрасч < tтабл, то величины X и Y независимы. Проведение параметрического корреляционного анализа Условие задачи: По 20 заводам производителям нефтеперекачивающих насосов были установлены затраты на рекламную кампанию и количество проданных насосов, после ее проведения каждым заводом. Необходимо определить коэффициент корреляции между исследуемыми признаками, используя: Формулу линейного коэффициента корреляции. Статистическую функцию КОРРЕЛ. Расчет коэффициента корреляции Пирсона с использованием формулы (4.1). Откройте новую книгу MS Excel и создайте таблицу согласно рис. 4.1, сохраните в своей папке под именем Параметрический_Анализ.xls. Рис.4.1 - Данные для задачи. В ячейке D2 рассчитайте (среднее значение переменной ). В диапазоне ячеек E2:E21 рассчитайте (отклонение значений переменной от среднего значения ). В ячейке F2 рассчитайте (среднее значение переменной ). В диапазоне ячеек G2:G21 рассчитайте (отклонение значений переменной от среднего значения ). В ячейке H2 рассчитайте сумму произведений , воспользовавшись математической функцией СУММПРОИЗВ. В диапазоне ячеек I2:I21 рассчитайте (квадраты отклонений значений переменной от среднего значения ). В диапазоне ячеек J2:J21 рассчитайте (квадраты отклонений значений переменной от среднего значения ). В ячейке K2 рассчитайте . В ячейке L2 рассчитайте . В ячейке M2 рассчитайте . В ячейке N2 рассчитайте коэффициент линейной корреляции . Сделайте вывод о тесноте связи между затратами на рекламу и количеством привлеченных туристов и направлении этой связи. Расчет коэффициента корреляции с использованием функции КОРРЕЛ. В ячейке D23 рассчитайте коэффициент корреляции, используя функцию КОРРЕЛ из категории Статистические. Синтаксис функции КОРРЕЛ: КОРРЕЛ (массив 1; массив 2): где массив 1 – ссылка на диапазон ячеек первой выборки (X); массив 2 – ссылка на диапазон ячеек второй выборки (Y). Оцените значимость коэффициента корреляции. С этой целью рассматриваются две гипотезы. Основная Н0: xy=0 и альтернативная Н1: xy≠0. Для проверки гипотезы Н0 рассчитайте t-статистику Стьюдента по формуле (4.2) в ячейке D24. В нашем случае число степеней свободы ν = n-2=20-2 = 18 (количество наблюдений минус два). Сравните полученное значение с критическим значением tν,α распределения Стьюдента. (При ν =18 и вероятности α = 0,05, tν,α,табл = 1,734). Сделайте вывод о значимости коэффициента корреляции. Расчет коэффициента корреляции с использованием Пакета анализа MS Excel. (Для версии XP) Сначала убедитесь, что был активизирован Пакет анализа, т.е. в меню Сервис есть команда Анализ данных. Если нет, то выполните команду Сервис/Надстройки. В диалоговом окне Надстройки установите флажок Пакет анализа и щелкните по кнопке ОК. (Для версии 2007 и выше) Сначала убедитесь, что был активизирован Пакет анализа, т.е. в меню Данные есть команда Анализ данных. Если нет, то выполните команду Сервис/Надстройки. В диалоговом окне Надстройки установите флажок Пакет анализа и щелкните по кнопке ОК. Далее выполните команду Анализ данных. Выберите инструмент анализа Корреляции. В диалоговом окне Корреляция установите параметры согласно рис.4.2. Рис.4.2 - Окно Корреляция. На новом рабочем листе получите значение коэффициента корреляции. Сравните с ранее полученными результатами. Сохраните изменения в книге. Далее выберите инструмент Описательная статистика и проанализируйте данные с установленными параметрами согласно рис. 4.3 Рис.4.3 - Описательная Статистика. ПОРЯДОК ВЫПОЛНЕНИЯ ЗАДАНИЯ Получить у преподавателя два номера заданий. Используя программный продукт MS Excel и рассмотренный пример необходимо определить коэффициент корреляции между исследуемыми признаками, используя: Формулу линейного коэффициента корреляции. Статистическую функцию КОРРЕЛ. Продемонстрировать преподавателю электронный вариант решения поставленной задачи. СОДЕРЖАНИЕ ОТЧЕТА Титульный лист. Тема, цель и основное содержание работы. Описание процесса решения задачи. Промежуточные и итоговые результаты. Выводы по работе. ВАРИАНТЫ ЗАДАНИЙ
ВОПРОСЫ ДЛЯ САМОПОДГОТОВКИ: В чем заключается суть корреляционного анализа? Что называется линейным коэффициентом корреляции? Какими функциями реализован корреляционный анализ в MSExcel? |