Главная страница
Навигация по странице:

  • Межгрупповая дисперсия

  • Статистическое изучение взаимосвязей: непараметрические оценки

  • курс лекций по статистике. 5fan_ru_Статистика. Курс лекций. Лекция 2 Сводка и группировка материалов статистического наблюдения Тема 2 Статистическая совокупность и её характеристики Лекция 3 Абсолютные, относительные и средние величины


    Скачать 1.46 Mb.
    НазваниеЛекция 2 Сводка и группировка материалов статистического наблюдения Тема 2 Статистическая совокупность и её характеристики Лекция 3 Абсолютные, относительные и средние величины
    Анкоркурс лекций по статистике
    Дата27.09.2019
    Размер1.46 Mb.
    Формат файлаdoc
    Имя файла5fan_ru_Статистика. Курс лекций.doc
    ТипЛекция
    #87830
    страница11 из 14
    1   ...   6   7   8   9   10   11   12   13   14

    Генри Р. Нив «Пространство Доктора Деминга»



    План

      1. Понятие и виды вариации.

      2. Абсолютные и средние показатели вариации.

      3. Показатели относительного рассеивания.

    Введение

    Первой особенностью статистики как науки является то, что ис­следуются не отдельные факты, а массовые явления и процессы, выступающие как множества отдельных фактов, обладающих как индивидуальными, так и общими признака­ми.

    Единицы совокупности наряду с общими для всех еди­ниц признаками, обусловливающими качественную определенность сово­купности, обладают индивидуальными особенностями и различиями, от­личающими их друг от друга, т. е. существует вариация признаков. Ва­риация этих признаков обусловлена различным сочетанием условий, со­ставляющих развитие элементов множества.

    Вариация – это изменение величины либо значение признака при переходе от одного объекта (или группы объектов) к другому; точнее говоря – от одной единицы совокупности к другой. Обычно под вариацией мы понимает обусловленное перекрещивающимся влиянием различных факторов на данное явление изменение величин только в пределах однородной совокупности.

    Именно наличие вариации предопределяет необходимость стати­стики. Вариация признака отражается статистическим распределением.
    1. Понятие и виды вариации

    Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака.

    Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае.

    Средняя величина — это абстрактная, обобщающая характеристика признака изучаемой совокупности, но она не показывает строения совокупности, которое весьма существенно для ее познания. Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от нее. В некоторых случаях отдельные значения признака близко примыкают к средней арифметической и мало от нее отличаются. В таких случаях средняя хорошо представляет всю совокупность.

    В других, наоборот, отдельные значения совокупности далеко отстают от средней, и средняя плохо представляет всю совокупность.

    Колеблемость отдельных значений характеризуют показатели вариации.

    Термин «вариация» произошел от латинского variatio –«изменение, колеблемость, различие». Однако не всякие различия принято называть вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака: случайную и систематическую.

    Вариация, порождаемая существенными факторами, носит систематический характер, т.е. наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической.

    Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.

    Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией.

    Следовательно, общая вариация слагается из систематической и случайной вариации.

    Степень близости данных отдельных единиц к средней измеряется рядом абсолютных, средних и относительных показателей.

    2 Абсолютные и средние показатели вариации

    Для характеристики совокупностей и исчисленных величин важно знать, какая вариация изучаемого признака скрывается за средним.

    Для характеристики колеблемости признака используется ряд показателей.

    Размах колебаний (размах вариации) – это разность между наибольшим () и наименьшим () значениями вариантов



    Среднее линейное отклонение вычисляется по следующим формулам:




    для несгруппированных данных




    для сгруппированных данных (вариационного ряда)

    Основными обобщающими показателями вариации в статистике являются дисперсии и среднеквадратическое отклонение.

    Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. Дисперсия обычно называется средним квадратом отклонений и обозначается и рассчитывается по следующим формулам:

    — дисперсия невзвешенная (простая);

    — дисперсия взвешенная.

     Замечание. Дисперсию удобнее рассчитывать по формуле: ,

    где – среднее квадрата, – квадрат средней.

    Дисперсия имеет большое значение в статистическом анализе. Однако её применение как меры вариации в ряде случаев бывает не совсем удобным, потому что размерность дисперсии равна квадрату размерности изучаемого признака. В таких случаях для измерения вариации признака вычисляют среднеквадратическое отклонение.

    Среднеквадратическое отклонение представляет собой корень квадратный из дисперсии и обозначается S:

    Среднеквадратическое отклонение - это обобщающая характеристика абсолютных размеров вариации признака в совокупности.

    Выражается оно в тех же единицах измерения, что и признак (в метрах, тоннах, процентах, гектарах и т.д.).

    Среднеквадратическое отклонение является мерилом надежности средней. Чем меньше среднеквадратическое отклонение, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.

    Вычислению среднеквадратического отклонения предшествует расчет дисперсии.
    Основные свойства дисперсии.

    • Уменьшение или увеличение весов (частот) варьирующего признака в определенное число раз дисперсии не изменяет.

    • Уменьшение или увеличение каждого значения признака на одну и ту же постоянную величину А дисперсии не изменяет.

    • Уменьшение или увеличение каждого значения признака в раз соответственно уменьшает или увеличивает дисперсию в раз, а среднеквадратическое отклонение - в раз.

    • Дисперсия признака относительно произвольной величины всегда больше дисперсии относительно средней арифметической на квадрат разности между средней и произвольной величиной: . Если А равна нулю, то приходим к следующему равенству: , т.е. дисперсия признака равна разности между средним квадратом значений признака и квадратом средней.

    Каждое свойство при расчете дисперсии может быть применено самостоятельно или в сочетании с другими.

    Элементы дисперсионного или факторного анализа.

    Общая дисперсия характеризует общую вариацию признака под влиянием всех условий, всех причин, вызывающих эту вариацию.

    Для определения влияния постоянного фактора на величину вариации пользуются аналитической группировкой.

    Размеры систематической вариации определяются при помощи дисперсии групповых средних.

    Межгрупповая дисперсия s2 характеризует колеблемость групповых или частных средних около общей средней и исчисляется по формуле:

    

    где – средняя по каждой отдельной группе, или групповая средняя

    - средняя по всей совокупности;

    - число единиц совокупности;

    - частоты или веса.

    Таким образом, межгрупповая дисперсия характеризует систематическую вариацию, которая возникает под влиянием фактора признака, положенного в основу группировки. Эту дисперсию называют факторной дисперсией

    Для определения влияния случайных факторов и их роли в общей вариации определяют дисперсию в пределах каждой группы, т.е. внутригрупповую дисперсию, а затем среднюю из внутригрупповых дисперсий.

    Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

    

    Средняя из внутригрупповых дисперсий характеризует случайную вариацию, которая возникает под влиянием всех факторов, кроме фактора, положенного в основание группировки. Эту дисперсию называют остаточной дисперсией.

    Чтобы определить её, надо рассчитать вначале внутригрупповые дисперсии по каждой группе в отдельности, а затем среднюю из них: .



    Между общей дисперсией, факторной и остаточной дисперсий существует соотношение, определяемое правилом сложения дисперсий.

    Согласно этому правилу общая дисперсия равна сумме факторной и остаточной дисперсий:



    Зная любые два вида дисперсий, можно определить или проверить правильность расчета третьего вида.

    Правило сложения дисперсий позволяет выявить зависимость результата от определяющих факторов с помощью соотношения межгрупповой дисперсии и общей дисперсии.
    Соотношение называется эмпирическим коэффициентом детерминации.

    Он показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки.

    Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного отношения:


    Это отношение характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака.

    Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1.

    Если , то группировочный признак не оказывает влияния на результативный. Если , то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям.


    3. Показатели относительного рассеивания

    Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

    1. Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней.



    2. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины.



    3. Коэффициент вариации.



    Учитывая, что среднеквадратическое отклонение дает обобщающую характеристику колеблемости всех вариантов совокупности, коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. При этом исходят из того, что если V больше 40 %, то это говорит о большой колеблемости признака в изучаемой совокупности.

    Вопросы для самоконтроля

    1. Дайте определение понятию «вариация».

    2. Какие виды вариации можете перечислить?

    3. Что понимается под систематической и случайной вариацией?

    4. Какие существуют показатели вариации? Для каких целей они применяются?

    5. Размах вариации.

    6. Порядок расчета среднего линейного отклонения.

    7. Понятие дисперсии признака.

    8. Свойства дисперсии и ее расчет.

    9. Что такое среднеквадратическое отклонение и каков по­рядок его вычисления?

    10. Что такое коэффициент вариации, для каких целей он применяется и как рассчитывается?

    11. В чем сущность показателя дисперсия?

    12. Свойства и правила сложения дисперсий.

    13. Эмпирическое корреляционное отношение и порядок его интерпретации.

     Литература


    1. Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 6 С.46-57

    2. Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.4, п.4.1.



    Тема 4: «Статистическое изучение взаимосвязей: непараметрические оценки»

    Взмах крыла бабочки в Айове может привести к тайфуну в Индонезии.

    Эдвард Лоренц
    Я размышлял о чудесных взаимосвязях в мире, о том, что посреди этой центрально-азиатской степи я кормил монгольскую козу швейцарским сыром;

    сыр был произведен, так сказать, ее сородичами,

    теперь великий круг молочных продуктов сомкнулся –

    все, так мне вдруг показалось, было друг другу родственно,

    близко, доверительно и всегда оставалось частью нерасторжимого целого, ...

    Крахт К.  Карта мира
    План

    1. Понятие и виды статистической связи
    2. 1   ...   6   7   8   9   10   11   12   13   14


    написать администратору сайта