Главная страница
Навигация по странице:

  • Расчет долей (вероятностей)

  • Доли (вероятности) в разрезе заказов Доли (вероятности) в разрезе пола

  • К расчету зависимости пол − заказ десерта. Фактические и теоретические частоты

  • Фактические частоты

  • Теоретические частоты

  • К расчету зависимости пол − заказ десерта. Значение

  • Решение Основные статистические характеристики переменных

  • метод количественного анализа. ККЗ_МКА_Фомина СИ_ДО-308МВА. Московский финансовопромышленный университет Синергия


    Скачать 0.51 Mb.
    НазваниеМосковский финансовопромышленный университет Синергия
    Анкорметод количественного анализа
    Дата24.06.2022
    Размер0.51 Mb.
    Формат файлаdoc
    Имя файлаККЗ_МКА_Фомина СИ_ДО-308МВА.doc
    ТипПрограмма
    #613782
    страница2 из 3
    1   2   3

    Решение

    Из условия следует, что из общего количества мужчин, учтенных в исследовании (320) десерт заказали 96. Это означает, что вероятность того, что мужчина закажет десерт равна . Аналогично, если десерт заказали всего 136 человек, и женщин среди них было 40 то вероятность того, что заказавшим десерт окажется женщина равна

    Расчет долей (вероятностей)

    Доли (вероятности) в разрезе заказов

    Доли (вероятности) в разрезе пола

    Заказ десерта

    Мужской

    Женский

    Всего

    Заказ десерта

    Мужской

    Женский

    Всего

    Да

    0,30

    0,14

    0,23

    Да

    0,71

    0,29

    1,00

    Нет

    0,70

    0,86

    0,77

    Нет

    0,48

    0,52

    1,00

    Всего

    1,00

    1,00

    1,00

    Всего

    0,53

    0,47

    1,00

    Заказ говядины

     

     

     

    Заказ говядины

     

     

     

    Да

    0,38

    0,16

    0,23

    Да

    0,52

    0,48

    1,00

    Нет

    0,62

    0,84

    0,77

    Нет

    0,25

    0,75

    1,00

    Всего

    1,00

    1,00

    1,00

    Всего

    0,31

    0,69

    1,00


    Принимаем условие, что исследуемые события независимы, т. е. выбор одного посетителя на зависит от выбора другого.

    1. Вероятность того, что первый же клиент закажет десерт

    2. Вероятность того, что первый клиент не закажет говядину

    3. Пусть A − событие «клиент заказал десерт». Его вероятность P(A) = 0,23.

    Пусть B − событие «клиент заказал говядину». Его вероятность P(B) = 0,23.

    Тогда вероятность того, что случится хотя бы одно из событий A или B можно найти по формуле сложения вероятностей совместных событий:

    P(A + B) = P(A) + P(B) − P(AB) = 0,23 + 0,23 − 0,23 · 0,23 = 0,40

    Вероятность того, что первый клиент закажет десерт или говядину 0,40.

    4. Пусть A − событие «клиент оказался женщиной». Его вероятность P(A) = 0,47.

    Пусть B − событие «клиент не заказал десерт». Его вероятность P(B) = 0,77.

    Вероятность совместного появления события A и B найдем по формуле умножения вероятности:

    P(AB) = P(A) · P(B) = 0,47 · 0,77 = 0,36

    Вероятность того, что первый клиент окажется женщиной и не закажет десерт 0,36.

    5. Алгоритм вычислений аналогичен п. 4.

    P(AB) = P(A) · P(B) = 0,23 · 0,23 = 0,05

    Вероятность того, что клиент закажет десерт и говядину 0,05.

    6. Алгоритм вычислений аналогичен п. 3.

    A − событие «клиент оказался женщиной». Его вероятность P(A) = 0,47.

    Пусть B − событие «клиент не заказал десерт». Его вероятность P(B) = 0,77.

    Тогда вероятность того, что случится хотя бы одно из событий A или B можно найти по формуле сложения вероятностей совместных событий:

    P(A + B) = P(A) + P(B) − P(AB) = 0,47 + 0,77 − 0,47 · 0,77 = 0,88

    Вероятность того, что первый клиент окажется женщиной или не закажет десерт 0,88.

    7. Если клиент, у которого официант принял заказ, оказался женщиной, вероятность того, что она не закажет десерт (по определению условной вероятности).

    9. Чтобы узнать, являются ли пол клиента и заказ десерта статистически независимыми, используем таблицы сопряженности и критерий χ2.

    Суть метода состоит в следующем.

    Выдвигаются две гипотезы: основная Н0 (рассматриваемые признаки независимы) и альтернативная Н1 (признаки зависимы). Принимаем уровень значимости α (в данной работе везде принято α = 0,05).

    Далее строится таблица сопряженности признаков. Один признак располагается по строкам, другой – по столбцам. В клетках указана фактическая частота, то есть сколько раз такое сочетание данных встречается в выборке.

    Затем строится аналогичная таблица, содержащая теоретические частоты (частоты, ожидаемые при H0), рассчитанные по следующей формуле:



    (0)

    где: fOi, fOj − сумма частот по i-й строке и по jстолбцу соответственно;

    − общая сумма частот.

    Потом следует выяснить, насколько значимо отличаются фактические и теоретические частоты. Для этого используется χ2-критерий, рассчитываемый по формуле:



    (0)

    Далее сравниваются значения и . Последнее определяется по уровню значимости и числу степеней свободы df. Число степеней свободы принимается равным произведению количества строк в таблице сопряженности, уменьшенного на 1 на количество столбцов, уменьшенное на 1.

    Если , то есть фактические и теоретические частоты значимо отличаются друг от друга, есть основания отвергнуть гипотезу H0 и принять гипотезу H1. Следовательно предположение о наличии связи между признаками считается верным. В противном случае ( ) оснований отвергнуть H0 нет, признается отсутствие статистически значимой связи между признаками.

    Проверим гипотезу о связи между полом и заказом десерта.

    Основная гипотеза Н0: рассматриваемые признаки независимы.

    Альтернативная гипотеза Н1: признаки зависимы.

    Таблица сопряженности с фактическими и теоретическими частотами представлена ниже, расчет теоретических частот проводился по формуле (1). Расчет значения представлен в табл.

    К расчету зависимости пол − заказ десерта. Фактические и теоретические частоты

    Фактические частоты

    Заказ десерта

    Мужской

    Женский

    Всего

    Да

    96

    40

    136

    Нет

    224

    240

    464

    Всего

    320

    280

    600

    Теоретические частоты

    Заказ десерта

    Мужской

    Женский

    Всего

    Да

    72,53

    63,47

    136

    Нет

    247,47

    216,53

    464

    Всего

    320

    280

    600


    К расчету зависимости пол − заказ десерта. Значение



    f0

    fE

    f0fE

    (f0fE)2



    1

    96

    72,53

    23,47

    550,68

    7,59

    2

    224

    247,47

    -23,47

    550,68

    2,23

    3

    40

    63,47

    -23,47

    550,68

    8,68

    4

    240

    216,53

    23,47

    550,68

    2,54

    Сумма

     

     

     

     

    21,04


    Получаем

    Учитывая количество строк в таблицах сопряженности, равное 2, и количество столбцов, равное 2, получаем количество степеней свободы df = (2 − 1) · (2 − 1) = 1. Принимаем α = 0,05.

    Получаем



    Гипотеза H0 отвергается. Принимается гипотеза H1: между полом и заказом десерта есть статистически значимая связь.

    Задание 4

    В рабочей книге PIZZA.XLS содержатся данные о 36 порциях пиццы: стоимость в долларах, количество калорий и количество жира в граммах для трех категорий продуктов: сырной пиццы из пиццерии (тип 1), сырной пиццы из супермаркета (тип 2) и острой пиццы из супермаркета (тип 3).

    Используйте инструмент Сводные таблицы и функции вычисления статистических характеристик.

    Вычислите распределение частот и процентное распределение для стоимости, калорий и жирности.

    Постройте кривую распределения (полигон накопленных процентов) для стоимости, калорий и жирности.

    Изучите аналитически и графически взаимосвязь переменных.

    Какие выводы можно сделать о стоимости, количестве калорий и жирности каждой из разновидностей пиццы?

    Решение

    Основные статистические характеристики переменных

    Показатель

    Цена

    Калории

    Жир

    Объем выборки n

    36

    36

    36

    min

    0,540

    280,00

    4,00

    max

    1,920

    412,00

    26,00

    Размах вариации

    1,380

    132,00

    22,00

    k

    6

    6

    6

    Δ

    0,230

    22,00

    3,67

    Среднее

    1,099

    351,81

    15,61

    Дисперсия

    0,105

    1 241,38

    25,85

    Среднеквадратическое

    0,324

    35,23

    5,08

    Коэффициент вариации

    0,295

    0,10

    0,33


    Значения k и Δ в таблице – количество интервалов и длина интервала – будут необходимы для дальнейших расчетов. Число интервалов определяется по формуле Стерджеса: с округлением до ближайшего целого.

    k = 1 + log2n

    (0)

    Ширину каждого интервала берем одинаковой и равной:



    (0)

    Средние значения показывают, что пицца – довольно жирный и калорийный продукт. Впрочем, для жирности нужно сделать оговорку: у нее достаточно большая дисперсия и коэффициент вариации. Это значит, что в выборку попали и образцы с невысокой жирностью.

    Используя формулы (3) и (4) и функции, встроенные в Excel, разобьем массив каждой переменной на интервалы и найдем их частоты.
    1   2   3


    написать администратору сайта