Статистика синергия. Статистика. Литература по теме Практические задания
Скачать 1.83 Mb.
|
Тема 9. Измерение и прогнозирование взаимосвязи с помощью корреляционно-регрессионного анализа Цель изучения темы состоит в формировании системы знаний и компетенций о статистических методах, применяемых для анализа взаимосвязи между социально-экономическими явлениями, построения ее моделей, оценке и интерпретации параметров этих моделей. В результате успешного освоения темы Вы: Узнаете: · в чем разница между корреляционным и регрессионным анализом; · основные условия применения корреляционного анализа; · для чего используется линейный коэффициент корреляции и как интерпретируется его значение; · основные условия применения регрессионного анализа; · для чего используется парная линейная регрессия; · основные правила интерпретации показателей связи. Приобретете компетенции: · владение методами количественного анализа и моделирования, теоретического и экспериментального исследования; · владение основными методами, способами и средствами получения, хранения, переработки информации, навыками работы с компьютером как средством управления информацией; · понимание роли и значения информации в развитии современного общества и экономических знаний; · способность оценивать воздействие макроэкономической среды на функционирование организаций и органов государственного и муниципального управления; · умение применять количественные и качественные методы анализа при принятии управленческих решений и строить экономические, финансовые и организационно-управленческие модели; · способность оценивать эффективность использования различных систем учета и распределения затрат, иметь навыки калькулирования и анализа себестоимости продукции и способностью принимать обоснованные управленческие решения на основе данных управленческого учета; · способность обосновывать решения в сфере управления оборотным капиталом и выбора источника финансирования; · способность рассчитывать парный линейный коэффициент корреляции и делать по нему выводы; · способность рассчитывать параметры линейного и нелинейного уравнения регрессии; · способность интерпретировать коэффициенты регрессии и эластичности. В процессе освоения темы акцентируйте внимание на следующих ключевых понятиях: · корреляционный анализ; · регрессионный анализ; · линейный коэффициент корреляции Пирсона; · уравнение регрессии; · коэффициент регрессии; · парная линейная регрессия; · теоретическое корреляционное отношение; · коэффициент эластичности. Вопросы темы: 1. Корреляционный анализ. 2. Регрессионный анализ. Теоретический материал по теме Вопрос 1. Корреляционный анализ. Корреляционный анализ используется для количественного определения тесноты и направления связи между признаками при помощи коэффициента корреляции. Знаки при коэффициенте корреляции характеризуют направление связи между изучаемыми признаками, а по его значению характеризуют силу или тесноту связи между признаками. Корреляционный анализ дает ответы на следующие вопросы: · существует ли между рассматриваемыми признаками взаимосвязь вообще? · если связь существует, то каково ее направление: значения результативного признака растут или уменьшаются под влиянием факторного? · насколько тесной является эта взаимосвязь? Для проведения корреляционного анализа необходимо выполнение следующих условий: 1. Признаки, между которыми исследуется взаимосвязь, должны иметь количественное выражение, т.е. каждая единица совокупности должна характеризоваться двумя числами – значением факторного и значением результативного признаков. 2. Данные по каждому признаку должны иметь одинаковую размерность и методологию расчета. Например, изучая зависимость заработной платы сотрудника от стажа его работы, нельзя, чтобы у части сотрудников стаж был указан в месяцах, а у части – в годах, или у одних брался номинальный (до вычета налогов), а у других – реальный размер заработной платы. В данных не должно быть пропусков (например, неизвестен стаж хотя бы у одного сотрудника). Единицы, имеющие пропуски в значениях факторного или результативного признаков, исключаются из исходных данных. 3. Рассматриваемая совокупность должна быть однородна по составу единиц и существенна по их количеству. Например, качество анализа будет выше, если рассматривать взаимосвязь зарплаты и стажа по категориям сотрудников (вспомогательные работники, рабочие, административный персонал, менеджеры и т.п.), используя данные как можно большего числа сотрудников каждой категории. Если по аналитическому выражению связь между признаками можно описать уравнением прямой, для выявления наличия, направленности и тесноты связи рассчитывают линейный коэффициент корреляции. Линейный коэффициент корреляции Пирсона, обозначаемый r, характеризует тесноту и направление связи между двумя признаками в случае наличия между ними линейной зависимости. Линейный коэффициент корреляции изменяется в пределах от -1 до +1: . Корреляция, равная 1, указывает на идеальную взаимосвязь в виде прямой линии, причем более высокие значения одной переменной соответствуют предсказуемым более высоким значениям другой переменной. Корреляция, равная -1, указывает на отрицательную идеальную взаимосвязь в виде прямой линии, причем одна переменная уменьшается с ростом другой. Абсолютное значение коэффициента корреляции указывает на силу взаимосвязи, а знак (+ или -) указывает направление (увеличение или уменьшение) связи. В таблице 47 показано, как следует интерпретировать связь в каждом конкретном случае. Таблица 47. Интерпретация значения линейного коэффициента корреляции
Расчет линейного коэффициента корреляции осуществляется по формуле: , (73) где ; ; ; ; n – число наблюдений. Вычисление линейного коэффициента корреляции удобно проводить при помощи вспомогательной таблицы (табл. 48): Таблица 48. Вспомогательная таблица для расчета линейного коэффициента корреляции
Если преобразовать формулу 73, то линейный коэффициент корреляции можно вычислить, используя итоговые суммы из таблицы 48: (74) Числитель выражает взаимодействие двух переменных и определяет знак корреляции. Если между переменными существует сильная положительная взаимосвязь, числитель примет положительное значение, если сильная обратная – числитель примет отрицательное значение. Знаменатель формул 73 и 74 всегда положителен, т.к. он является произведением средних квадратических отклонений по X и Y, которые всегда больше нуля, т.к. рассчитываются как квадратный корень из дисперсии. Пример 1. Определим тесноту взаимосвязи между величиной товарооборота и количеством обслуженных клиентов десяти крупнейших туристических компаний/групп по итогам 2011 г. (по данным kommersant.ru, табл. 49). Таблица 49. Показатели деятельности крупнейших туристических компаний/групп по итогам 2011 г. (по данным kommersant.ru)
Диаграмма рассеяния, представленная на рис. 28, отображает положительную по направлению и близкую к линейной взаимосвязь между товарооборотом компаний (результативный признак y) и количеством обслуженных клиентов (факторный признак x) – точки на графике поднимаются вверх при движении по оси x, ось области концентрации облака точек имеет вид, наиболее близкий по форме к прямой линии. Рис. 28. Диаграмма рассеяния, характеризующая взаимосвязь между величиной товарооборота и количеством обслуженных клиентов наиболее крупных по итогам 2011 г. туристических компаний/групп Подтвердим предположение о наличии положительной связи на основании расчета линейного коэффициента корреляции. 1. Используя формулу (73), получаем: 2. По формуле (74) значение коэффициента корреляции составило: Таким образом, можно сделать вывод, что между величиной товарооборота туристической компании и количеством обслуженных ею клиентов существует сильная по тесноте и прямая по направлению взаимосвязь. Существенно облегчить и ускорить расчет показателей взаимосвязи позволяет широко распространенный стандартный табличный редактор MS Excel. Для расчета величины парного линейного коэффициента корреляции Пирсона необходимо в редакторе данных построить таблицу с исходными значениями анализируемых показателей и ввести вручную или вызвать с помощью меню специальную команду-функцию PEARSON. Синтаксис этой команды имеет следующий вид: |