Главная страница
Навигация по странице:

  • 3.3.1. Однофакторный дисперсионный анализ

  • 3.3.2. Примеры к разделу 3.3 .Пример 1

  • «Однофакторный дисперсионный анализ»

  • F.ОБР.ПХ(0,05;2;15).

  • СТЬЮДЕНТ.ОБР.2Х(0,05;15).

  • 3.3.3. Двухфакторный дисперсионный анализ

  • 3.4.2. Пример к разделу 3.4.

  • 4. За ключение в разделе КНИР1 «Анализ данных и аналитика в принятии решений»

  • 5. Библиографический список

  • щщ. БАЗДАРЕВА МУ раздела КНИР1 по курсу Анализ данных и аналитика в. Методические указания к выполнению раздела книр1 по курсу Анализ данных и аналитика в принятии решений


    Скачать 471.8 Kb.
    НазваниеМетодические указания к выполнению раздела книр1 по курсу Анализ данных и аналитика в принятии решений
    Дата06.02.2023
    Размер471.8 Kb.
    Формат файлаdocx
    Имя файлаБАЗДАРЕВА МУ раздела КНИР1 по курсу Анализ данных и аналитика в.docx
    ТипМетодические указания
    #922583
    страница4 из 4
    1   2   3   4

    3.3. Дисперсионный анализ информации


    Дисперсионный анализ позволяет исследовать различие между группами данных, определять, носят ли эти расхождения случайный характер или вызваны конкретными обстоятельствами. Дисперсионный анализ дает общую схему проверки статистических гипотез, основанную на изучении различных источников вариации, позволяет оценить влияние одного или нескольких факторов на результирующий признак [1], [2].

    3.3.1. Однофакторный дисперсионный анализ

    Данные для однофакторного дисперсионного анализа − это k независимых выборок из k генеральных совокупностей. Однофакторный дисперсионный анализ сравнивает два источника вариации: между выборками (межгрупповую вариацию) и внутри каждой выборки (внутригрупповую вариацию). Каждая генеральная совокупность подчиняется нормальному распределению, причем стандартные отклонения одинаковы.

    Гипотеза Н0 утверждает, что все средние равны между собой. Альтернативная гипотеза Н1 говорит о том, что не все средние равны между собой (существуют хотя бы две неравные средние).

    Фактор А имеет k уровней. На каждом уровне проводится выборка объемом nj (j=1,2,…k). Тогда общее число наблюдений n=n1+n2+ …+nk.

    Пусть xij(i=1,2,…, nj) −результатыj- той выборки. Рассчитываются:

    ;

    ;

    .

    А также статистика

    .

    Доверительная вероятность р, α=1-р. По таблице F- распределения находится граничная точка Fα;k-1;n-k . Если F> Fα;k-1;n-k, то гипотеза Н0 отклоняется на уровне значимости α.

    3.3.2. Примеры к разделу 3.3.

    Пример 1. Предприятие минерально-сырьевого комплекса решает вопрос о выборе одной из трех систем контроля качества. Все три системы протестированы. Результаты тестов представлены в табл. 2. Доверительная вероятность р=0,95

    Таблица 2

    Номер системы

    Число выявленных бракованных изделий

    в партии продукции

    1

    1, 2, 3, 0, 2, 1

    2

    2, 3, 1, 0, 1

    3

    2, 2, 3, 2


    Решение:

    Проверяется гипотеза об отсутствии влияния различий между системами контроля качества на результат тестирования систем. Предполагается, что выборки получены из независимых нормальных генеральных совокупностей с одинаковой генеральной дисперсией.

    Т.к. р=0,95, α=1-0,95=0,05.

    Н0: различия между системами не влияют на результаты тестирования систем.

    Н1: различия между системами влияют на результаты тестирования систем.

    Рассчитывается и заполняется табл. 3.

    В ней сумма элементов каждой строки второго столбца записывается в третьем столбце, а число элементов в каждой строке второго столбца −в соответствующей строке 4-го столбца. В последней строке рассчитана сумма чисел соответствующего столбца.

    Таблица 3

    Номер системы

    Число бракованных изделий xij

    Сумма

    nij

    1

    1, 2, 3, 0, 2, 1

    9

    6

    2

    2, 3, 1, 0, 1

    7

    5

    3

    2, 2, 3, 2

    9

    4

    Сумма

    -

    25

    15

    =

    =12+22+32+02+22+12+22+32+12+02+12+22+22+32+22-252/15≈13,33.

    =92/6+72/5+92/4-252/15≈1,88.

    =1,33-1,88=11,45

    Статистика =

    По таблице F-распределения находится граничная точка F0,05;3-1;15-3= =3,89.

    0,99<3,88= F0,05;3-1;15-3 , следовательно, принимается гипотеза Н0 на уровне значимости 5%. Т.е. различия между системами контроля не влияют на результаты тестирования систем. Поэтому можно перейти на более дешевую из трех систему контроля качества.

    Рассмотрим на примере следующей задачи некоторые особенности применения пакета программ Excel для исследованиявлияния отдельных качественных факторов на исследуемый признак методом дисперсионного анализа.
    Пример 2.

    Имеется три организации, на которых внедрены однотипные информационные системы (ИС). В течение шести месяцев определялась стоимость консалтинговых услуг в млн. руб. по сопровождению перечисленных систем. Требуется на уровне значимости α = 0,05 установить наличие зависимости стоимости консалтинговых услуг от варианта информационной системы.

    Исходные данные:



    Решение:

    1. Внесем исходные данные в таблицу MS Excel


    Для исследования модели воспользуемся инструментом «Однофакторный дисперсионный анализ» надстройки MS Excel «Анализ данных».

    Укажем входной интервал A1:G4. Укажем, что данные сгруппированы по строкам.



    Результаты представлены на рисунке.



    Проверка нулевой гипотезы осуществляется на основе критерия Фишера

    Fα(m-1, mn-m). В рассматриваемом случае наблюдаемое значение F=5,48, что больше критического значения F0,05(2,15) = 3,68, которое найдено с помощью функции F.ОБР.ПХ(0,05;2;15).

    Таким образом, вариант ИС существенным образом влияет на стоимость консалтинговых услуг по сопровождению указанных систем.

    Оценим силу этого влияния с помощью коэффициента детерминации

    d= SS межгр/ SS= 320,33/758,5 = 0,422

    Попарное сравнение вариантов ИС по влиянию на стоимость консалтинговых услуг по сопровождению рассматриваемых систем проверим при помощи проверки гипотез

    H0(ij): αi = αj при альтернативной гипотезе H1(ij): αi αj, где i и j – индекс варианта ИС. В нашем случае (ij) равно (12), (13) и (23).

    Вычислим значение статистики

    =

    имеющей распределение Стьюдента с nm-m степенями свободы.

    В нашем случае nm-m= 18-3 = 15, = = 5,4

    = = -2,46

    = 0,69

    = -3,15

    Критическая точка распределения Стьюдента при 5% уровне значимости = =2,13, которое найдено с помощью функции СТЬЮДЕНТ.ОБР.2Х(0,05;15).

    Влияние 2 и 3 варианта ИС на стоимость консалтинговых услуг по сопровождению указанных систем одинаково. Различия между стоимостью консалтинговых услуг по сопровождению систем 1 и 2, 1 и 3 зафиксированы с уровнем статистической значимости 0,05.

    3.3.3. Двухфакторный дисперсионный анализ

    При двухфакторном дисперсионном анализе рассматривается влияние факторов А и В на конечный результат. Дисперсионный анализ в этом случае основывается на результатах эксперимента, проводимого на различных уровнях каждого из факторов. Все предположения, сделанные выше, при однофакторном анализе остаются в силе. Подробно метод изложен в [2]

    3.4. Кластерный анализ

    3.4.1. Задачи кластерного анализа

    Кластерный анализ предназначен для разбиения совокупности объектов на однородные группы (кластеры, или классы). По сути, это задача многомерной классификации данных

    Существует около 100 разных алгоритмов кластеризации, однако наиболее часто используются иерархический кластерный анализ и кластеризация методов K-средних.

    Кластерный анализ применяется:

    • в маркетинге для сегментации конкурентов и потребителей;

    • в менеджменте и экономике для разбиения персонала на различные по уровню мотивации группы, классификации поставщиков, выявлении схожих производственных ситуаций, при которых возникает брак;

    • в медицине для классификации симптомов, пациентов, препаратов;

    • в социологии для разбиения респондентов на однородные группы.

    Кластерный анализ хорошо зарекомендовал себя во всех сферах жизнедеятельности человека. Он работает даже тогда, когда данных мало и не выполняются требования нормальности распределений случайных величин и другие требования классических методов статистического анализа.
    3.4.2. Пример к разделу 3.4. Проведено анкетирование сотрудников предприятия минерально-сырьевого комплекса. Требуется определить наиболее эффективные методы управления персоналом.

    Подробно пример рассмотрен в [2]

    4. Заключение в разделе КНИР1 «Анализ данных и аналитика в принятии решений»

    Важной, а часто, и самой главной частью этого раздела является заключение. Оно должно содержать

    • выводы с основными числовыми показателями, рассчитанными вами в результате анализа данных (решения задач раздела),

    • их интерпретацию (что означают эти расчетные значения)

    • управленческие решения (рекомендации по управлению), которые должны повысить эффективность анализируемого бизнес процесса или системы (предприятия)

    5. Библиографический список

    1. Баздарева З.В. Математические методы в экономике и управлении/З.В.Баздарева.- М.: Изд. Дом МИСиС, 2019.-138 с.

    2. Баздарева З.В. Статистика /З.В.Баздарева.- М.: Изд .Дом МИСиС, 2017.-238 с.

    3. Баздарева З.В. Эконометрика: учеб. пособие.- М.: МГГУ, 2014.-182 с.


    1   2   3   4


    написать администратору сайта