Шпаргалки к экзамену по теории вероятностей и статистике. шпоры ответы на вопросы к экзамену по твимс2. 1. Предмет теории вероятностей. Понятие случайного события
Скачать 0.9 Mb.
|
28. Корреляционный момент. Коэффициент корреляции. Свойства ковариации и коэффициента корреляции. Коэффициентом ковариации называется выражение: cov(X,Y)=M[(X-MX)(Y-MY)]=M[XY-XMY-YMX+MX•MY]=MXY-2MX•MY+MX•MY=MXY-MX•MY Если случайные величины XY независимы, то их коэффициент ковариации равен нулю, обратное в общем случае неверно. Коэффициентом корреляции случайных величин X и Y называется число: X*=(X-MX)/σx Y*=(Y-MY)/σy D(X±Y)= DX±cov(XY)+DY Следствие: Если X и Y независимы, то коэффициент ковариации равен 0 и следовательно D(X±Y)=DX±DY Свойства коэффициента корреляции 1. -1≤pxy≤1 2. Если |pxy|=1, то с вероятность 1 X и Y связаны линейно. То есть, если коэффициент корреляции |pxy|=1, то результаты опыта лежат на прямой В общем случае Y можно представить в виде y=ax+b+z DZ=σy2(1-pxy)2 Коэффициент корреляции является мерой близости линейной связи между случайными величинами X и Y: чем ближе коэффициент корреляции по модулю к 1, тем более тесно результаты конкретного испытания над X и Y соотносятся с прямой ax+b. Свойства ковариации Править Ковариация симметрична: . В силу линейности математического ожидания, ковариация может быть записана как . Пусть случайные величины, а их две произвольные линейные комбинации. Тогда . В частности ковариация (в отличие от коэффициента корреляции) не инварианта относительно смены масштаба, что не всегда удобно в приложениях. Ковариация случайной величины с собой равна дисперсии: . Если независимые случайные величины, то . Обратное, вообще говоря, неверно. Неравенство Коши — Буняковского: . 31. Теоремы Маркова и Бернулли. 32. Математическая статистика. Основные понятия. Математическая статистика занимается установлением закономерностей, которым подчинены массовые случайные явления, на основе обработки статистических данных, полученных в результате наблюдений. Двумя основными задачами математической статистики являются: - определение способов сбора и группировки этих статистических данных; - разработка методов анализа полученных данных в зависимости от целей исследования, к которым относятся: а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости от других случайных величин и т.д.; б) проверка статистических гипотез о виде неизвестного распределения или о значениях параметров известного распределения. Для решения этих задач необходимо выбрать из большой совокупности однородных объектов ограниченное количество объектов, по результатам изучения которых можно сделать прогноз относительно исследуемого признака этих объектов. Определим основные понятия математической статистики. Генеральная совокупность – все множество имеющихся объектов. Выборка – набор объектов, случайно отобранных из генеральной совокупности. Объем генеральной совокупности N и объем выборки n – число объектов в рассматривае-мой совокупности. Виды выборки: Повторная – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность; Бесповторная – отобранный объект в генеральную совокупность не возвращается. Пусть интересующая нас случайная величина Х принимает в выборке значение х1 п1 раз, х2 – п2 раз, …, хк – пк раз, причем где п – объем выборки. Тогда наблюдаемые значения случайной величины х1, х2,…, хк называют вариантами, а п1, п2,…, пк – частотами. Если разделить каждую частоту на объем выборки, то получим относительные частоты Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, а перечень вариант и соответствующих им частот или относительных частот – стати-стическим рядом:
Если исследуется некоторый непрерывный признак, то вариационный ряд может состоять из очень большого количества чисел. В этом случае удобнее использовать группированную выборку. Для ее получения интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько равных частичных интервалов длиной h, а затем находят для каждого частичного интервала ni – сумму частот вариант, попавших в i-й интервал. Составленная по этим результатам таблица называется группированным статистическим рядом:
33. Генеральная совокупность и выборка. Характеристики выборки. Способы отбора. Генеральная совокупность – все множество имеющихся объектов. Выборка – набор объектов, случайно отобранных из генеральной совокупности. В матем статистике понятие генеральной совокупности трактуется как совокупность всех мыслимых наблюдений, которые могли бы быть произведены при данном реальном комплексе условий. Иначе, совокупность объектов, из которых произведена выборка.ё ё Выборочная совокупность-совокупность случайно отобранных объектов. Выборочный метод обследования, или как его часто называют, выборка, применяется, прежде всего, в тех случаях, когда сплошное наблюдение вообще невозможно. Виды выборки: вероятностные и невероятностные. Вероятностная выборка: 1. Простая вероятностная выборка: - простая повторная выборка. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. - простая бесповторная выборка. 2. Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. 3. Серийная вероятностная выборка. 4. Районированные выборки 5. «Удобная» выборка Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки. Невероятностные выборка (отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям- доступности, типичности, равного представительства и т.д.: 1.Квотная выборка- выборка строится как модель , которая воспроизводит структуру генеральной совокупности в виде квот изучаемых признаков. 2. Метод снежного кома. 3. Стихийная выборка. Способы отбора: 1.Рандомизация или случайный отбор, используется для создания случайных выборок. 2.Попарный отбор- стратегия построения групп выборки, при котором составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. 3.Многоступенчатый способ построения выборки. При многоступенчатом отборе выборка строится в несколько этапов, причём на каждой стадии меняется единица отбора. 4..Многосфазный способ построения выборки.- является разновидностью многоступенчатого способа, заключается в том, что из сформированной выборки большего объёма производится новая выборка меньшего объёма, при этом, единица отбора остаётся одной и той же. 5.Комбинированный способ построения выборки- соединение в многоступенчатой выборке различных приёмов отбора. 35. Эмпирическая функция распределения. 36. Полигон и гистограмма. Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x1, n1), (x2, n2),…, (xk, nk), где xi откладываются на оси абсцисс, а ni – на оси ординат. Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот Рис. 1. Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x1, n1), (x2, n2),…, (xk, nk), где xi откладываются на оси абсцисс, а ni – на оси ординат. Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот (рис.1). По аналогии с функцией распределения случайной величины можно задать некоторую функцию, относительную частоту события X < x. Определение 15.1. Выборочной (эмпирической) функцией распределения называют функцию F*(x), определяющую для каждого значения х относительную частоту события X < x. Таким образом, , (15.1) где пх – число вариант, меньших х, п – объем выборки. Замечание. В отличие от эмпирической функции распределения, найденной опытным путем, функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения. F(x) определяет вероятность события X < x, а F*(x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F*(x) стремится по вероятности к F(x). Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F(x), а именно: 0 ≤ F*(x) ≤ 1. F*(x) – неубывающая функция. Если х1 – наименьшая варианта, то F*(x) = 0 при х≤ х1; если хк – наибольшая варианта, то F*(x) = 1 при х > хк . Для непрерывного признака графической иллюстрацией служит гистограмма, то есть ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотами – отрезки длиной ni /h (гистограмма частот) или wi /h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором – единице 37. Статистические оценки параметров распределения. 38. Выборочная средняя и выборочная дисперсия. Выборочным средним называется среднее арифметическое значений случайной величины, принимаемых в выборке: , (16.1) где xi – варианты, ni - частоты. Замечание. Выборочное среднее служит для оценки математического ожидания исследуемой случайной величины. В дальнейшем будет рассмотрен вопрос, насколько точной является такая оценка. Определение 16.2. Выборочной дисперсией называется , (16.2) а выборочным средним квадратическим отклонением – (16.3) Так же, как в теории случайных величин, можно доказать, что справедлива следующая формула для вычисления выборочной дисперсии: . 39. Точечная и интервальная оценки. Доверительный интервал. Методики нахождения точечных оценок. Интервальное оценивание — один из видов статистического оценивания, предполагающий построение интервала, в котором с некоторой вероятностью находится истинное значение оцениваемого параметра. Доверительный интервал и доверительная вероятность используется в математической статистике точности и надежности полученной оценки a* неизвестного параметра a. 40. Метод статистических гипотез. Определение 19.1. Статистической гипотезой называют гипотезу о виде неизвестного распределения генеральной совокупности или о параметрах известных распределений. Определение 19.2. Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирую-щей (альтернативной) называют гипотезу Н1, которая противоречит нулевой. Определение 19.3. Простой называют гипотезу, содержащую только одно предположение, сложной – гипотезу, состоящую из конечного или бесконечного числа простых гипотез. В результате проверки правильности выдвинутой нулевой гипотезы ( такая проверка называется статистической, так как производится с применением методов математичес-кой статистики) возможны ошибки двух видов: ошибка первого рода, состоящая в том, что будет отвергнута правильная нулевая гипотеза, и ошибка второго рода, заключаю-щаяся в том, что будет принята неверная гипотеза. Замечание. Какая из ошибок является на практике более опасной, зависит от конкретной задачи. Например, если проверяется правильность выбора метода лечения больного, то ошибка первого рода означает отказ от правильной методики, что может замедлить лече-ние, а ошибка второго рода (применение неправильной методики) чревата ухудшением состояния больного и является более опасной. |