Главная страница
Навигация по странице:

  • Задача 1. Тема: «Нормальное распределение»

  • Задача 2. Тема: «Интервальные оценки»

  • Задача 3. Тема: «Проверка статистических гипотез»

  • Задача 4. Тема: «Критерий согласия Пирсона»

  • Задача 5. Тема: «Ранговая корреляция».

  • Задача 6. Тема: «Линейная корреляция и регрессия».

  • Теория вероятностей и мат статистика. Теория вероятностей контрольн. Нормальное распределение 3 Задача Тема Интервальные оценки 3


    Скачать 55.4 Kb.
    НазваниеНормальное распределение 3 Задача Тема Интервальные оценки 3
    АнкорТеория вероятностей и мат статистика
    Дата03.10.2022
    Размер55.4 Kb.
    Формат файлаdocx
    Имя файлаТеория вероятностей контрольн.docx
    ТипЗадача
    #710509


    Оглавление
    Задача 1. Тема: «Нормальное распределение» 3

    Задача 2. Тема: «Интервальные оценки» 3

    Задача 3. Тема: «Проверка статистических гипотез» 4

    Задача 4. Тема: «Критерий согласия Пирсона» 5

    Задача 5. Тема: «Ранговая корреляция» 6

    Задача 6. Тема: «Линейная корреляция и регрессия» 7

    Задача 1. Тема: «Нормальное распределение»

    Средний срок службы коробки передач до капитального ремонта у автомобиля определенной марки составляет 56 мес. со стандартным отклонением 16 мес. Привлекая покупателей, производитель хочет дать гарантию на этот узел, обещая сделать бесплатно любое число ремонтов коробки передач нового автомобиля в случае ее поломки до определенного срока. Пусть срок службы коробки передач подчиняется нормальному закону. На сколько месяцев в таком случае производитель должен дать гарантию для этой детали, чтобы число бесплатных ремонтов не превышало 2,275% проданных автомобилей?

    Решение

    Дано

    Срок службы должен оказаться в интервале при условии

    Вероятность попадания величины X в заданный интервал

    , где Ф – интегральная функция Лапласа

    Имеем:



    Ответ:число бесплатных ремонтов не превысит 2,275% проданных автомобилей при условии, что производитель даст гарантию на коробку передач на срок 24 месяца.
    Задача 2. Тема: «Интервальные оценки»

    С помощью случайной выборки оценивается среднее время ежедневного просмотра телепередач абонентами кабельного телевидения в период с 18 до 22 ч. Каким должен быть объем выборки в этом случае, если в предыдущих выборочных обследованиях стандартное отклонение времени просмотра передач составило 40 мин., а отклонение выборочной средней от генеральной средней по абсолютной величине не должно превышать 5 мин. с вероятностью 0,9?

    Решение

    По условию:

    Для определения объема повторной выборки, необходимого для того, чтобы гарантировать определенную точность оценки генеральной средней, задаваемую предельной ошибкой выборки  , при заданной надежности  , используем формулу:



    По условию задачи доверительная вероятность равна , что соответствует ,

    Таким образом, объем повторной выборки приблизительно будет равен:



    Учитывая, что необходимо не превышать заданную ошибку, округляем результат до большего целого: 

    Итак, чтобы с вероятностью 0,9 и точностью  минут оценить среднее время ежедневного просмотра телепередач абонентами кабельного телевидения в период с 18 до 22 час., требуется обследовать не менее 174 абонентов.
    Задача 3. Тема: «Проверка статистических гипотез»

    Компания по производству безалкогольных напитков предполагает выпустить на рынок новую модификацию популярного напитка, в котором сахар заменен сукразитом. Компания хотела бы быть уверенной в том, что не менее 70% ее потребителей предпочтут новую модификацию напитка. Новый напиток был предложен на пробу 2000 человек, и 1422 из них сказали, что он вкуснее старого. Может ли компания отклонить предположение о том, что только 70% всех ее потребителей предпочтут новую модификацию напитка старой? Уровень значимости 0,01.

    Решение

    Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная доля точно равна числовому значению.

    Сформулируем нулевую и конкурирующую гипотезы согласно условиям задачи.

    только 70% потребителей предпочтут новую модификацию напитка

    новый напиток предпочтут более 70% потребителей. 

    Критическая область - правосторонняя

    Вычислим наблюдаемое значение статистики K по формуле:



    где относительная частота появления события;

    гипотетическая вероятность появления события;

    гипотетическая вероятность непоявления события;

    объем выборки.

    При заданных значениях:



    По таблице функции Лапласа найдем критическую точку для правосторонней критической области (при гипотезе по уровню значимости :

    откуда

    Так как , следовательно, на данном уровне значимости нет оснований отклонять нулевую гипотезу в пользу конкурирующей. По данным проверки с более чем 99%-ной надежностью компания не может отклонить предположение о том, что только 70 процентов всех ее потребителей предпочтут новую модификацию напитка старой.

    Задача 4. Тема: «Критерий согласия Пирсона»

    С помощью критерия согласия Пирсона на уровне значимости α = 0,05 выяснить, можно ли считать случайную величину X, заданную в виде сгруппированного статистического ряда, нормально распределенной с параметрами и , рассчитанными по выборке.




    [1.2;1.5]

    [1.5;1.8]

    [1.8;2.1]

    [2.1;2.4]

    [2.4;2.7]

    [2.7;3.0)



    2

    4

    11

    8

    5

    3


    Решение

    Для нахождения характеристик выборки от заданного интервального распределения признака X перейдем к дискретному распределению, выбирая в качестве значений признака серединычастичных интервалов. Для удобства дальнейших расчетов заполним таблицу:












    [1.2;1.5]

    1,35

    2

    2,7

    1,1942

    [1.5;1.8]

    1,65

    4

    6,6

    0,8939

    [1.8;2.1]

    1,95

    11

    21,45

    0,3282

    [2.1;2.4]

    2,25

    8

    18

    0,1296

    [2.4;2.7]

    2,55

    5

    12,75

    0,9128

    [2.7;3.0)

    2,85

    3

    8,55

    1,5868






    33

    70,05

    5,0455


    Выборочная средняя

    Выборочная исправленная дисперсия:

    Выборочное исправленное с.к.о:

    Сформулируем основную и альтернативную гипотезы.

    случайная величина X подчиняется нормальному закону с параметрами    истинные значения параметров не известны, используем их наилучшие оценки, рассчитанные по выборке.

     случайная величина X не подчиняется нормальному закону с данными параметрами.

    Используя данные интервального ряда и вычисленные значения , по формуле где начало и конец го интервала, функция Лапласа, найдем слагаемые статистики Пирсона. Начало первого и конец последнего интервалов примем























    1,5

    2



    -1,5683

    -0,5

    -0,4416

    0,0584

    1,9275

    0,0027

    1,5

    1,8

    4

    -1,5683

    -0,8128

    -0,4416

    -0,2918

    0,1498

    4,9424

    0,1797

    1,8

    2,1

    11

    -0,8128

    -0,0572

    -0,2918

    -0,0228

    0,2690

    8,8770

    0,5077

    2,1

    2,4

    8

    -0,0572

    0,6983

    -0,0228

    0,2575

    0,2803

    9,2506

    0,1691

    2,4

    2,7

    5

    0,6983

    1,4538

    0,2575

    0,4270

    0,1695

    5,5935

    0,0630

    2,7



    3

    1,4538



    0,4270

    0,5

    0,0730

    2,4090

    0,1450







    33







     

     

     

    33

    1,0672



    Число степеней свободы: где количество параметров, оцененных по выборке

    Для уровня значимости и находим критическое значение Так то гипотезу о нормальном распределении Х принимаем.
    Задача 5. Тема: «Ранговая корреляция».

    По заданной таблице рангов найти выборочный коэффициент ранговой корреляции Спирмена и проверить значимость полученного результата при α = 0.05.

    Десять спортсменов-бегунов проранжированы по двум признакам: X — рост спортсмена, Y — скорость бега.

    Ранг 1

    5

    6

    10

    7

    9

    4

    3

    1

    8

    2

    Ранг 2

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10


    Решение

    Составим матрицу рангов и найдем сумму квадратов разностей рангов 








    5

    1

    16

    6

    2

    16

    10

    3

    49

    7

    4

    9

    9

    5

    16

    4

    6

    4

    3

    7

    16

    1

    8

    49

    8

    9

    1

    2

    10

    64

    55

    55

    240


    Вычислим значение коэффициента Спирмена по формуле 



    По шкале Чеддока связь между ростом спортсмена и скоростью бега умеренная и обратная

    Для проверки значимости найденного значения , выдвинем следующие статистические гипотезы:





    Вычислим наблюдаемое значение статистики:



    критическая точка двусторонней критической области, которую находим по таблице критических точек распределения Стьюдента по уровню значимости и числу степеней свободы



    Так как эмпирическое значение коэффициента корреляции Спирмена меньше критического:



    нулевую гипотезу отвергаем: между ростом спортсмена и скоростью бега не существует значимой ранговой корреляционной связи. Коэффициент ранговой корреляции Спирмена статистически незначим.

    Задача 6. Тема: «Линейная корреляция и регрессия».

    Исследуется связь между общим весом некоторого растения (Y, %) и весом его семян (X, г) на основе выборочных данных.



    20

    25

    28

    35

    80

    40

    45



    20

    50

    60

    80

    35

    90

    100

    Построить диаграмму рассеяния и определить по ней характер зависимости. Рассчитать выборочный коэффициент корреляции Пирсона, проверить его значимость при α = 0.05. Записать уравнение регрессии и дать интерпретацию полученных результатов.

    Решение

    Факторный признак Y — общий вес растения; результирующий признак X — вес его семян. Построим диаграмму рассеяния, изобразив в прямоугольной системе координат точки с координатами, соответствующими каждой паре наблюдений


    По виду диаграммы можно предположить, что существует линейная корреляционная связь между показателями. Оценим тесноту линейной корреляционной зависимости между признаками и составим выборочные уравнения прямой регрессии.

    Для удобства проведем все необходимые предварительные расчеты в таблице.












    20

    40

    400

    1600

    800

    25

    50

    625

    2500

    1250

    28

    60

    784

    3600

    1680

    30

    70

    900

    4900

    2100

    35

    80

    1225

    6400

    2800

    40

    90

    1600

    8100

    3600

    45

    100

    2025

    10000

    4500

    223

    490

    7559

    37100

    16730

    Рассчитаем числовые характеристики выборки, используя итоговую строку расчетной таблицы и учитывая, что объем выборки .

    Выборочные средние:







    Выборочные дисперсии:





    Выборочные среднеквадратические отклонения:





    Вычислим выборочный коэффициент корреляции по формуле:



    Найдем уравнение линейной регрессии Y на X: , вычислив параметры уравнения по формулам:







    Найдем уравнение линейной регрессии X на Y: , вычислив параметры уравнения по формулам:







    Второй способ. Выборочное уравнение прямой регрессии Y на X и X на Y имеет вид:

    )

    Подставим полученные значения:



    Окончательно получаем, что уравнение прямой регрессии Y на X имеет вид:



    ауравнение прямой регрессии X на Y:



    Коэффициент корреляции близок к единице, поэтому прямые регрессии на графике практически совпадают.



    Коэффициент регрессии показывает среднее изменение результативного показателя X (вес семян) с повышением или понижением величины фактора Y (общий вес растения). В данном примере с увеличением общего веса растения на 1 %, вес семян повышается в среднем на 0,4 г. Коэффициент формально показывает прогнозируемый уровень у, но только в том случае, если находится близко с выборочными значениями. Можно рассматривать коэффициент как меру влияния на вес семян других факторов, не включенных в уравнение регрессии.

    Коэффициент корреляции показывает, что зависимость между весом растения и весом семян прямая и весьма высокая по шкале Чеддока Коэффициент детерминации свидетельствует о том, что 98,5% различий в весе семян объясняется общим весом растения, а остальные 1,5% - влиянием других факторов.

    Так как регрессивный анализ зависимости между признаками проводится по выборочным данным, необходимо проверить значимость выборочного коэффициента корреляции.

    Выдвигаем нулевую гипотезу - величина коэффициента корреляции в генеральной совокупности равна нулю:

    .

    Проверку нулевой гипотезы проводим с помощью критерия t – Стьюдента. Наблюдаемое значение критерия t находим по формуле:



    По таблице Стьюдента с уровнем значимости и степенями свободы , где количество объясняющих переменных, находим критическое значение

    Так как , то полученное значение коэффициента корреляции признается значимым. Нулевая гипотеза отвергается, коэффициент корреляции признается статистически значимым или существенно отличным от нуля в генеральной совокупности. Таким образом, общий вес растения оказывает статистически существенное влияние на вес семян.


    написать администратору сайта