Главная страница
Навигация по странице:

  • Кафедра высшей математики и системного моделирования сложных процессов РЕФЕРАТ по дисциплине: «

  • Выполнил: слушатель магистратуры 1 курса лейтенант вн.службы М.В Рыжих Проверил: профессор кафедры ВМиСМСП

  • 1. Понятие корреляционной связи

  • 2. Классификация корреляционных связей

  • 3. Коэффициент корреляции и его свойства

  • 4. Значимость коэффициента корреляции

  • Шаг 1.

  • 5. Виды связи между переменными

  • 6.Примеры нахождения коэффициента корреляции

  • Заключение Список используемой литературы

  • корреляция. Проведение корреляционного анализа в планировании и обработке результатов эксперимента


    Скачать 1.31 Mb.
    НазваниеПроведение корреляционного анализа в планировании и обработке результатов эксперимента
    Дата13.12.2018
    Размер1.31 Mb.
    Формат файлаdocx
    Имя файлакорреляция.docx
    ТипРеферат
    #60158

    Санкт-Петербургский университет государственной противопожарной службы МЧС России

    Кафедра высшей математики и системного моделирования сложных

    процессов

    РЕФЕРАТ

    по дисциплине:

    «Планирование и обработка результатов эксперимента»
    на тему:

    «Проведение корреляционного анализа в планировании и обработке результатов эксперимента»

    Выполнил: слушатель магистратуры 1 курса

    лейтенант вн.службы

    М.В Рыжих

    Проверил: профессор кафедры ВМиСМСП

    к.п.н., доцент Е.С.Калинина


    Санкт-Петербург

    2018

    СОДЕРЖАНИЕ

    Введение 3

    1. Понятие корреляционной связи 4

    2. Общая классификация корреляционных связей 5

    3. Коэффициент корреляции и его свойства 7

    4. Значимость коэффициента корреляции 9

    5. Виды связи между переменными 10

    6. Примеры нахождения коэффициента корреляции 12

    Заключение 15

    Список литературы 16


    Введение

    Дисциплина планирование и обработка результатов эксперимента является математико-статистической дисциплиной, изучающей методы организации экспериментальных исследований. Именно труды английского ученого-статиста Р. Фишера в 1935 году положили начало планированию эксперимента. Фишер подчеркивал, что именинно результаты планирования эксперимента дают существенный выигрыш в точности оценок.

    В 60-х годах ХХ века современная теория планирования эксперимента начала складываться как отдельная дисциплина, методы которой были тесно связаны с математических программированием и с теорией приближения функций.

    Планирование эксперимента заключается в выборе оптимального плана эксперимента, который бы удовлетворял всем заданным требованиям.

    Важная особенность дисциплины планирование и обработки результатов эксперимента заключается в применении таких методов, которые при расчетах давали бы минимальную погрешность математической модели без потери информации с наименьшими затратами и по которым можно было бы судить об адекватности модели.

    Цель планирования эксперимента – нахождение таких условий и правил проведения опытов, при которых удастся получить надежную и достоверную информацию об объекте, а также представить эту информацию в компактной и удобной форме с количественной оценкой точности.

    Среди основных методов планирования, применяемых на разных этапах исследования, одним из самых важных является корреляционный анализ, цель которого заключается в определение зависимости между варьируемыми факторами.

    1. Понятие корреляционной связи

    Нередко при обработке данных исследователи интересуются, как связаны переменные в одной или нескольких изучаемых выборках. Может ли температура воздуха влиять на качество производственного оборудования? Рост влиять на вес человека? и т.д.

    Такая зависимость между варьируемыми факторами называется корреляционной. Корреляционная связь - это связь между двумя или несколькими переменными, позволяющая судить о том, как с ростом одной переменной изменяется другая.

    На примере роста и веса человека выявлена положительная корреляционная связь, при увеличении роста- увеличивается и вес человека, но имеются и исключения. Причиной таких исключений является воздействие многих факторов на человека, а именно генетических, психологических, экологических и т .д.

    Важно помнить, что корреляционная связь не рассматривается как причинно-следственная зависимость, так как она свидетельствует только лишь о наличии связи между переменными.

    Подводя итог, можно сказать, что задачами корреляционного анализа являются:

    1. Установление направления связи между варьируемыми признаками;

    2. Установление формы связи между варьируемыми признаками;

    3. Измерение тесноты этой связи;

    4. Проверка уровня значимости полученного коэффициента корреляции.


    2. Классификация корреляционных связей

    Корреляционные связи можно классифицировать по следующим критериям: по форме, направлению и степени (силе). По форме: прямолинейная или криволинейной. Прямолинейной может быть, например, связь между количеством решенных задач в семестре и получением положительной оценки на зачете (рис.1). То есть, чем больше задач решит студент, тем больше знаний он получит и тем больше вероятность получить положительную оценку на зачете. Криволинейной: например, связь между уровнем мотивации и эффективностью выполнения задачи (рис 2). При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации (максимальная эффективность), дальнейшему повышению мотивации сопутствует уже снижение эффективности.

    c:\users\м-видео\desktop\hello_html_mac2ab57.png

    Рис. 1 - Связь между количеством решенных задач и оценкой на зачете


    c:\users\м-видео\desktop\hello_html_mac2ab57.png

    Рис. 2 – Связь между уровнем мотивации и эффективностью выполнения задачи



    По направлению корреляционная связь:

    1. Положительная (прямая), то есть с увеличением одного признака -увеличивается другой (рис.3). Коэффициент корреляции имеет положительный знак.

    2. Отрицательная (обратная), при увеличении или уменьшении признака, другой изменяется в обратную сторону. соотношения обратные (рис. 4). Коэффициент корреляции имеет положительный отрицательный знак.

    3. Отсутствует связь (рис.5).

    c:\users\м-видео\desktop\hello_html_mac2ab57.png c:\users\м-видео\desktop\hello_html_mac2ab57.png

    Рис. 3 – Прямая корреляция Рис. 4 – Обратная корреляция
    c:\users\м-видео\desktop\hello_html_mac2ab57.png

    Рис. 5 – Связи нет.

    Также связь может быть множественной и парной.

    Простая связь означает наличие двух переменных:



    Рис. 6- Простая связь

    Множественная связь означает наличие несколько переменных:


    Рис. 7– Множественная связь

    3. Коэффициент корреляции и его свойства

    Как говорилось ранее в п. 1.2., коэффициент корреляции используется для определения тесноты связи между изучаемыми переменными.

    Коэффициент корреляции является общепринятой в математической статистике характеристикой связи между двумя случайными величинами.

    Коэффициент корреляции измеряет силу и направление связи между двумя переменными.
    Обозначения:

    Выборочный коэффициент корреляции: r

    Коэффициент корреляции генеральной совокупности: ρ

    Коэффициент корреляции вычисляется по формуле:
    (1)

    Это, так называемый, коэффициент корреляции Пирсона, равный произведению моментов. Он назван по имени статистика Карла Пирсона, который первый провел исследования в этой области.

    После несложных преобразований, из первой формулы можно получить другую формулу для коэффициента.

    (2)

    Как мы увидим, она более пригодна для вычисления коэффициента при помощи таблиц.

    Из формулы видно, что для вычисления r необходимо найти средние значения признаков и , а также отклонения каждого статистического данного от его среднего , . Зная эти значения, находятся суммы , .

    Для ясности и полноты знаний о коэффициенте корреляции рассмотрим его основные свойства:

    1. r изменяется в интервале от -1 до +1.

    2. Знак перед величиной r указывает на направление связи, «+»-связь положительная, «-» -отрицательная.

    3. Величина r указывает, как близко расположены точки к прямой линии, если r = +1 или r= —1, то имеется абсолютная (функциональная) корреляция по всем точкам, лежащим на линии (практически это маловероятно); если r0, то линейной корреляции нет. Чем ближе r к крайним точкам (±1), тем больше степень линейной связи.

    4. Коэффициент корреляции безразмерен.

    Теснота связи между величинами определяется по величине коэффициента корреляции. Сила связи определяется по шкале Чеддока ( табл.1)

    Табл. 1- Шкала Чеддока

    Количественная мера тесноты связи

    Качественная характеристика силы связи

    0,1 - 0,3

    Слабая

    0,3 - 0,5

    Умеренная

    0,5 - 0,7

    Заметная

    0,7 - 0,9

    Высокая

    0,9 - 0,99

    Весьма высокая

    4. Значимость коэффициента корреляции

    Коэффициент корреляции генеральной совокупности ρ – это корреляция, вычисленная с использованием всевозможных пар значений признаков (х,у) генеральной совокупности.

    Требуется:

    Оценить коэффициент корреляции генеральной совокупности ρ на основе значения коэффициента корреляции выборки r.

    Условия:

    Выборочный коэффициент корреляции r используется для оценки ρ, если выполнены следующие предположения:

      • переменные х и у линейно зависимы;

      • переменные являются случайными;

      • обе переменные имеют нормальное распределение.

    Чтобы принять верное решение, необходимо воспользоваться процедурой проверки гипотезы. Она включает традиционные пять шагов:

    Шаг 1. Сформулировать гипотезы.

    Шаг 2. Построить критическую область.

    Шаг 3. Вычислить значение критерия.

    Шаг 4. Сравнить, принять решение.

    Шаг 5. Написать ответ.

    Гипотезы формируются следующим образом:

    Основная гипотеза Н0: ρ = 0

    Альтернативная гипотеза Н1: ρ ≠ 0

    Основная гипотеза утверждает, что не существует корреляции между признаками х и у в генеральной совокупности. Альтернативная гипотеза утверждает, что корреляция между признаками х и у в генеральной совокупности значима.

    Когда основная гипотеза отвергается на определенном уровне значимости, это значит, что существует значимое различие между значением r и 0. Когда основная гипотеза принимается, это значит, что значение r не сильно отличается от 0 и является случайным.

    Для проверки гипотезы используется t-критерий с df = n – 2 степенями свободы:

    (3)

    Затем он и сравнивается с табличным значением критерия: если значение , то нулевая гипотеза принимается, если , то Н0 отвергается и принимается альтернативная гипотеза.

    5. Виды связи между переменными

    Когда проверка гипотезы показывает, что существует значимая линейная связь между переменными, исследователь должен рассмотреть возможные виды связи между переменными и выбрать ту, которая диктуется логикой исследования.

    1. Прямая причинно-следственная связь

    2. Обратная причинно-следственная связь

    3. Связь вызвана третьей (скрытой) переменной

    4. Взаимосвязь вызвана несколькими скрытыми переменными

    5. Связи нет, наблюдаемая зависимость случайна

    Рассмотрим их на простых примерах, описанных ниже

    1. Прямая причинно-следственная связь между переменными(переменная х определяет значение переменной у).

    Наличие воды ускоряет рост растений. Яд вызывает смерть. Температура воздуха прямо влияет на скорость таяния льда.



    Рис. 8 - Прямая причинно-следственная связь

    2. Обратная причинно-следственная связь между переменными(переменная у определяет значение переменной х).

    Исследователь может думать, что чрезмерное потребление кофе вызывает нервозность. Но, может быть, очень нервный человек выпивает кофе, чтобы успокоить свои нервы?



    Рис. 9 - Обратная причинно-следственная связь

    3.Связь между переменными может быть вызвана третьей переменной.

    Исследователь установил, что существует некая зависимость между числом утонувших людей и числом выпитых безалкогольных напитков в летнее время. А может быть, обе переменные связаны с жарой и потребностью людей во влаге?



    Рис. 10 - Связь, вызванная третьей переменной

    4.Несколько переменных

    Взаимосвязь может быть определена несколькими скрытыми переменными. Исследователь может обнаружить значимую связь между оценками студентов в университете и оценками в школе. Но, возможно, действуют и другие переменные: IQ, количество часов занятий, влияние родителей, мотивация, возраст, авторитет преподавателей.



    Рис.11- Связь нескольких переменных

    5.Зависимость случайна

    Исследователь может найти значимую зависимость между увеличением количества людей, которые занимаются спортом и увеличением количества людей, которые совершают преступления. Но здравый смысл говорит, что любая связь между этими двумя переменными должна быть случайной.



    Рис.12 -Зависимость случайна

    6.Примеры нахождения коэффициента корреляции

    Для успешного усвоения данного материала рассмотрим примеры нахождения коэффициента корреляции.

    Пример №1: Установите, есть ли взаимосвязь между оперативными данными МЧС и Рослесхоза за август по количеству природных пожаров.

    Табл. 2- Исходные данные

    Дата

    Оперативные

    данные МЧС

    Оперативные

    данные

    Рослесхоза

    Дата

    Оперативные

    данные МЧС

    Оперативные данные

    Рослесхоза

    02.08

    19

    58

    14.08

    34

    24

    03.08

    18

    57

    22.08

    11

    3

    06.08

    29

    58

    23.08

    9

    17

    07.08

    23

    56

    27.08

    2

    14

    08.08

    25

    45

    28.08

    2

    16

    10.08

    26

    18

    29.08

    3

    12

    13.08

    32

    20

    30.08

    4

    12

    Решение. Определим выборочный коэффициент корреляции по формуле (1), промежуточные результаты вычислений представим в таблице 3.

    Табл. 3-Промежуточные результаты

















    1

    19

    58

    2,07

    4,29

    28,71

    824,51

    59,48

    2

    18

    57

    1,07

    1,15

    27,71

    768,08

    29,69

    3

    29

    58

    12,07

    145,72

    28,71

    824,51

    346,62

    4

    23

    56

    6,07

    36,86

    26,71

    713,65

    162,19

    5

    25

    45

    8,07

    65,15

    15,71

    246,94

    126,84

    6

    26

    18

    9,07

    82,29

    -11,29

    127,37

    -102,38

    7

    32

    20

    15,07

    227,15

    -9,29

    86,22

    -139,95

    8

    34

    24

    17,07

    291,43

    -5,29

    27,94

    -90,23

    9

    11

    3

    -5,93

    35,15

    -26,29

    690,94

    155,84

    10

    9

    17

    -7,93

    62,86

    -12,29

    150,94

    97,41

    11

    2

    14

    -14,93

    222,86

    -15,29

    233,65

    228,19

    12

    2

    16

    -14,93

    222,86

    -13,29

    176,51

    198,34

    13

    3

    12

    -13,93

    194,01

    -17,29

    298,80

    240,77

    14

    4

    12

    -12,93

    167,15

    -17,29

    298,80

    223,48



    237

    410



    1758,93



    5468,86

    1536,29

    Найдем среднее число пожаров для каждого из признаков: , .

    Выборочный коэффициент корреляции равен . Так как выборочный коэффициент корреляции равен 0,495, то между признаками связь слабая.

    Пример №2: Десять испытуемых в эксперименте по запоминанию в ситуации с помехами и без них имели следующие результаты (в балах):

    Табл. 4- Исходные данные

    Испытуемый

    А

    Б

    В

    Г

    Д

    Е

    Ж

    З

    И

    К

    запоминание без помех

    6

    7

    8

    7

    7

    4

    5

    6

    8

    7

    запоминание с помехами

    2

    6

    4

    3

    2

    1

    2

    3

    3

    2


    Существует ли значимая корреляционная связь между показателями?

    Решение. Определим выборочный коэффициент корреляции по формуле (1), промежуточные результаты представим в таблице 5.

    Табл. 5-Промежуточные результаты

















    А

    6

    2

    -0,5

    0,25

    -0,8

    0,64

    0,4

    Б

    7

    6

    0,5

    0,25

    3,2

    10,24

    1,6

    В

    8

    4

    1,5

    2,25

    1,2

    1,44

    1,8

    Г

    7

    3

    0,5

    0,25

    0,2

    0,04

    0,1

    Д

    7

    2

    0,5

    0,25

    -0,8

    0,64

    -0,4

    Е

    4

    1

    -2,5

    6,25

    -1,8

    3,24

    4,5

    Ж

    5

    2

    -1,5

    2,25

    -0,8

    0,64

    1,2

    З

    6

    3

    -0,5

    0,25

    0,2

    0,04

    -0,1

    И

    8

    3

    1,5

    2,25

    0,2

    0,04

    0,3

    К

    7

    2

    0,5

    0,25

    -0,8

    0,64

    -0,4




    65

    28




    14,5




    17,6

    9


    Средние значения равны , . Выборочный коэффициент корреляции равен . Так как , то между признаками существует хорошая связь.

    Заключение

    Список используемой литературы


    написать администратору сайта