Главная страница

Лекция 8 элементы математической статистики цель лекции


Скачать 0.89 Mb.
НазваниеЛекция 8 элементы математической статистики цель лекции
Дата06.11.2022
Размер0.89 Mb.
Формат файлаppt
Имя файла113174.ppt
ТипЛекция
#772087

Теория вероятностей


УГТУ-УПИ
2008г.


М.А.Вигура, О.А.Кеда, А.Ф.Рыбалко,
Н.М.Рыбалко, А.Б.Соболев


Лекция 8
ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ


Цель лекции:


1. Овладеть соответствующим математическим аппаратом для дальнейшего изучения курса математики, демонстрировать и использовать математические методы в ходе изучения специальных дисциплин для будущей профессиональной деятельности. 2. Ознакомиться с основными понятиями математической статистики, со способами представления данных выборки и с вычислением численных характеристик выборки.


Формируемые компетенции по ФГОС:


ОНК1: способность и готовность использовать фундаментальные математические законы в профессиональной деятельности, применять методы математического анализа и теоретического исследования.
ИК1: способность использовать современные средства вычислительной техники, коммуникаций и связи.
ИК4: готовность работать с информацией из различных источников (сбор, обработка, анализ, систематизация, представление).
СЛК3: способность самостоятельно приобретать новые знания, используя современные образовательные и информационные технологии.

Лекция 8


ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

. Задачи математической статистики


Математическая статистика – раздел математики, изучающий методы сбора и анализа результатов наблюдений массовых случайных явлений с целью выявления существующих закономерностей.


Типичная задача теории вероятности
по известным вероятностям простых случайных событий вычислить вероятность более сложного события. Рассмотрим простую модель – ловля рыбы на удочку. Пусть известна вероятность выловить окуня, скажем, р=0.2 . Какова вероятность события “среди 20 пойманных рыб оказалось 5 окуней”?


Типичная задача математической статистикина основании результатов наблюдений оценить вероятность случайного события или характеристики случайной величины.
В только что упомянутой модели – ловля рыбы – задача статистики может быть сформулирована так: среди 20 пойманных рыб оказалось 5 окуней. Что можно сказать о вероятности поймать окуня и насколько этой оценке можно доверять?


результаты наблюдений (экспериментов)
процесс наблюдений может корректироваться на основании предварительных результатов
(последовательный анализ)


Источники информации


априорная (доопытная) информация о свойствах изучаемого объекта, накопленная к текущему моменту.
Эта информация отражается в статистической модели, выбираемой при решении задачи.


Следует заметить, что степень обоснованности применения априорной информации зависит от компетентности и добросовестности конкретного исследователя и неверные исходные допущения могут существенно исказить результат статистического анализа.

. Частые задачи математической статистики


Предварительная обработка данных упорядочение результатов наблюдения или эксперимента, представление их в обозримом виде.


Оценка неизвестной величины
(вероятности события, функции распределения случайной величины, параметров распределения, степени взаимозависимости двух или нескольких случайных величин и т.п.).


Проверка статистических гипотез
(о виде функции распределения, о вероятности события и т.п.), т.е., установление меры надежности оценки, сделанной на основании опытных данных.


Установление формы и степени связи между случайными величинами.


Современная математическая статистика может быть определена как теория принятия решений в условиях неопределенности.
Она включает в себя также методы определения числа наблюдений, необходимых для достаточно надежной оценки,
до начала исследований (планирование эксперимента)
или в процессе исследований (последовательный анализ), что позволяет уже на этапе сбора информации уменьшить объем собираемых данных без снижения надежности оценок.

Генеральная и выборочная совокупности. Способы отбора


Если нужно изучить, как в совокупности однородных объектов распределен некоторый признак, характеризующий эти объекты, не всегда возможно исследовать каждый объект (объектов может быть слишком много, при проверке объект может быть уничтожен, и т.п.).
В этих случаях отбирают часть объектов и по свойствам отобранных объектов судят о свойствах всех объектов.

Основные определения


Выборкой или выборочной совокупностью называют совокупность случайно отобранных объектов.
Генеральной совокупностью называют исходное множество объектов, из которого производится выборка.
Объем совокупности (выборочной или генеральной) – число элементов данного множества.


Для упрощения вычислений при очень большом объеме генеральной совокупности часто принимают, что ее объем бесконечен. Подобное допущение основано на законе больших чисел, погрешность, им вносимая, практически не сказывается на характеристиках выборки.


Выборка называется повторной, если случайно отобранный для обследования объект возвращается в генеральную совокупность перед отбором следующего объекта.
В противном случае выборка называется бесповторной .


Чтобы по данным выборки можно было судить о всей совокупности, необходимо, чтобы члены выборки представляли ее достаточно правильно.
Такая выборка называется репрезентативной (представительной).


1) случайный отбор элементов совокупности,
2) равновероятность попадания в выборку любого элемента генеральной совокупности,
3) достаточно большой объем выборки


Для того, чтобы выборка была
репрезентативной, необходимы:


Если элементы извлекаются по одному из генеральной совокупности, говорят о простом случайном отборе (может быть повторным и бесповторным).
Если из генеральной совокупности элементы разбиваются на группы, “серии”, серия отбирается случайно и подвергается сплошной проверке, отбор называется серийным.


Типический отбор осуществляется следующим образом: генеральная совокупность делится на “типические” части, из каждой части производится случайный отбор.


Механический отбор осуществляется через регулярные интервалы Для обеспечения репрезентативности при механическом отборе необходим контроль периодичности.


Возможны также произвольные
комбинации способов отбора.

Статистическое распределение выборки

статистическим распределением выборки или статистическим рядом


Называется перечень вариант и соответствующих им частот
(или относительных частот)

пример


При 100 подбрасываниях игральной кости на верхней грани единица выпала 22 раза, двойка -16 , тройка - 13, четверка -24 , пятерка -12 и, наконец, шестерка – 13 раз. Считая число выпавших очков случайной величиной, построить для нее статистический ряд.


В том случае, если число значений случайной величины X велико, или есть основания полагать, что случайная величина является непрерывной и может принять любое значение из некоторого промежутка, строят интервальный статистический ряд.


Значения вариант группируют по промежуткам (обычно одинаковой длины), в первой строке указывается промежуток, во второй – число наблюдений, попавших в данный промежуток.

интервальный статистический ряд


Значения вариант группируют по промежуткам (обычно одинаковой длины),
в первой строке указывается промежуток, во второй – число наблюдений, попавших в данный промежуток.
Для определения оптимальной длины частичного промежутка можно использовать формулу Стерджеса. Пусть значения случайной величины X располагаются на отрезке , объем выборки – n.
Длина частичного интервала ,
число интервалов (берется ближайшее к целому), первый интервал начинается в точке

пример


Пусть измерен рост 50 случайно выбранных человек с точностью до 1 см (результаты приведены ниже).
175, 179, 170, 163, 159, 171, 170, 152, 168, 172, 160, 167, 165, 167, 156, 170, 181, 153, 163, 167, 179, 172, 170, 186, 180, 187, 178, 175, 168, 168, 171, 173, 178, 170, 183, 181, 180, 160, 165, 158, 173, 160, 167, 172, 180, 169, 168, 170, 188, 176.


Рост является непрерывной случайной величиной, но в силу ограниченной точности измерений любые значения этой величины будут принадлежать некоторому дискретному множеству.
Значения роста в выборке изменяются от 152 см до 188 см, т.е., принимают 37 значений, объем выборки – 50 человек.
Нахождение статистических характеристик данной выборки в таком виде представляет заметные вычислительные трудности.

Упорядочим данные выборки по возрастанию (ранжируем выборку):


152, 153, 156, 158, 159, 160, 160, 160, 163, 163, 165, 165, 167, 167, 167, 167, 168, 168, 168, 168, 169, 170, 170, 170, 170, 170, 170, 171, 171, 172, 172, 172, 173, 173, 175, 175, 176, 178, 178, 179, 179, 180, 180, 180, 181, 181, 183, 186, 187, 188.

Построим интервальный статистический ряд.

Полигон и гистограмма


Для наглядности часто используют графические изображения статистических рядов:
для дискретного ряда - полигон,
для интервального ряда - гистограмму.

Полигон частот (относительных частот)

Гистограмма частот (относительных частот)

Эмпирическая функция распределения


Эмпирической функцией распределения (функцией распределения выборки) называется
относительная частота события где – число вариант, меньших x , n –
объем выборки.


Теоретической функцией распределения
называется функция распределения F(x)
случайной величины X, вычисленная по генеральной совокупности, т.е.,
вероятность события {X

При возрастании объема
выборки различия между
и уменьшаются.

теорема (Гливенко)


При неограниченном возрастании
объема выборки эмпирическая функция распределения сходится по
вероятности к теоретической функции распределения

пример


Построим эмпирическую функцию распределения для ранее рассмотренного примера (подбрасывание кости). Распределение приведено ниже.

Построим эмпирическую функцию распределения

Числовые характеристики статистического распределения выборки


Пусть имеется генеральная совокупность объема N, из которой сделана выборка объема n. Статистический ряд, в котором присутствуют значения случайной величины X и относительные частоты их появления, можно рассматривать как закон распределения новой случайной величины XВ (исходную величину переобозначим как ХГ). Очевидно, законы распределения этих величин в какой-то мере близки, но не совпадают.

Замечание


Каждой числовой характеристике случайной величины ХГ соответствует ее выборочный аналог – характеристика случайной величины .
При возрастании объема выборки числовые характеристики будут сходиться по вероятности к соответствующим характеристикам ХГ.


Выборочное среднее – среднее арифметическое значений выборки


Выборочное среднее – среднее арифметическое значений выборки


Выборочная мода – наиболее вероятное значение в выборке (варианта с наибольшей частотой).
Выборочная медиана – значение случайной величины, приходящееся на середину вариационного ряда. Если объем выборки четен, n=2m, то, если нечетен, n=2m+1, то
.


Выборочная дисперсия – среднее значение квадрата отклонения


Эта формула может быть преобразована к виду


Выборочное среднее квадратическое отклонение
Исправленная выборочная дисперсия
Исправленное выборочное среднее квадратическое отклонение


Генеральное среднее – среднее арифметическое значений признака X генеральной совокупности:


Генеральная дисперсия – среднее по генеральной совокупности значение квадрата отклонения


Генеральное среднее квадратическое отклонение (стандартное отклонение )


В результате студент должен:


владеть основными понятиями математической статистики; уметь преобразовывать выборочные данные к виду, удобному для дальнейшей обработки; уметь вычислять численные характеристики выборки.


Перечень источников,
список дополнительной литературы по теме.


Сборник задач по математике: Учеб. пособие для втузов : В 4 ч. Ч. 4: Теория вероятностей. Математическая статистика / Э. А. Вуколов, А. В. Ефимов, В. Н. Земсков, А. С. Поспелов; Под общ. ред. А. В. Ефимова, А. С. Поспелова. - 3-е изд., перераб. и доп. - М.: Физматлит, 2004. - 432 с.: ил.; 21 см. - Библиогр.: с. 431 (16 назв.). - ISBN 5-94052-037-5.
Чудесенко, Валерий Федорович. Сборник заданий по специальным курсам высшей математики (типовые расчеты): Учеб. пособие для вузов / В. Ф. Чудесенко. - 2-е изд., перераб. - М.: Высшая школа, 1999. - 126 с. - ISBN 5-06-003065-2.
Гмурман, Владимир Ефимович. Руководство к решению задач по теории вероятностей и математической статистике: Учеб. пособие для вузов. - 5-е изд., стер. - М.: Высш. шк., 1999. - 400 с. - ISBN 5-06-003465-8.
Вентцель, Елена Сергеевна. Задачи и упражнения по теории вероятностей: учеб. пособие для студентов втузов / Е. С. Вентцель, Л. А. Овчаров. - 5-е изд., испр. - М.: Академия, 2004. - 448 с.: ил.; 21 см. - (Высшее образование). - Библиогр.: с. 240 (12 назв.). - ISBN 5-7695-1054-4.
Агапов, Георгий Иванович. Задачник по теории вероятностей: Учеб. пособие для втузов. - 2-е изд., доп. - М.: Высш.шк., 1994. - 112с. - ISBN 5-06-002664-7.



написать администратору сайта