Тема занятия. Независимые испытания.
Цельзанятия. Закрепить навык применения схемы испытаний Бернулли и нахождение наиболее вероятного числа успехов в схеме Бернулли.
В результате освоения темы обучающийся должен:
Знать: определение схемы испытаний Бернулли.
Уметь: производить вычисления по схеме Бернулли.
Владеть:
- способностью осуществлять поиск, критический анализ и синтез информации, применять системный подход для решения поставленных задач (УК-1)
Актуальность темы. Формула Бернулли используется в различных экономических расчетах.
Теоретическая часть.
Пусть производится n независимых испытаний, в каждом из которых событие
А может либо произойти (успех), либо не произойти (неудача). Будем считать, что вероятность события А в каждом испытании одна и та же, а именно равна р.
Следовательно, вероятность ненаступления события А в каждом испытании также постоянна и равна q=1–p. Такая последовательность испытаний называется схемой Бернулли.
В качестве таких испытаний можно рассматривать, например, производство изделий на определенном оборудовании при постоянстве технологических и организационных условий, в этом случае изготовление годного изделия — успех, бракованного — неудача. Эта ситуация соответствует схеме Бернулли, если считать, что процесс изготовления одного изделия не зависит от того, были годными или бракованными предыдущие изделия.
Другим примером является стрельба по мишени. Здесь попадание — успех, промах — неудача.
Поставим своей задачей вычислить вероятность того, что при n испытаниях событие А осуществится ровно k раз и, следовательно, не осуществится n—k раз, т.е. будет k успехов и n—k неудач.
Искомую вероятность обозначим
)
(k
P
n
. Например, символ
)
3
(
5
P
означает вероятность того, что в пяти испытаниях событие появится ровно 3 раза и, следовательно, не наступит 2 раза.
Последовательность п независимых испытаний можно рассматривать как сложное событие, являющееся произведением п независимых событий.
Следовательно, вероятность того, что в п испытаниях событие А наступит k раз и не наступит n—k раз, по теореме умножения вероятностей независимых событий, равна
33
knkqp
Таких сложных событий может быть столько, сколько можно составить сочетаний из
п элементов по
k элементов, т.е.
knCТак как эти сложные события несовместны, то по теореме сложения вероятностей несовместных событий, искомая вероятность равна сумме вероятностей всех возможных сложных событий. Поскольку же
вероятности всех этих сложных событий одинаковы, то искомая вероятность (появление
k раз события
А в
п испытаниях) равна вероятности одного сложного события, умноженной на их число
knkknnqpCkP
)
(
или
knknqpknknkP
)!
(
!
!
)
(
Полученную формулу называют
формулой Бернулли.
Пример 1. Вероятность того, что расход электроэнергии на продолжении одних суток не превысит установленной нормы, равна
75
,
0
p. Найти вероятность того, что в течение 4 суток из ближайших 6 суток расход электроэнергии не превысит нормы.
Решение. Вероятность нормального расхода электроэнергии на продолжении каждых из 6 суток постоянна и равна
75
,
0
p. Следовательно, вероятность перерасхода электроэнергии в каждые сутки также постоянна и равна
25
,
0 75
,
0 1
1
pqИскомая вероятность по формуле Бернулли равна
0,297 4096 1215
)
25
,
0
(
)
75
,
0
(
2 1
5 6
)
4
(
2 4
2 4
2 6
2 4
4 6
6
qpCqpCPВ ряде задач представляет интерес наивероятнейшее число успехов, т.е. такое число успехов, вероятность которого самая большая среди вероятностей.
Так как при увеличении
k вероятности сначала возрастают, а затем, с определенного момента, начинают убывать, то для
ˆ
m имеют место соотношения
ˆ
ˆ
( )
(
1)
nnP mP m
и
ˆ
ˆ
( )
(
1)
nnP mP m
Используя формулу и соотношение
1
qp, получаем соответственно неравенства
ˆ
ˆ
(
1)
n mpmq
и
ˆ
ˆ
(
1)
(
)
mqn m p
Окончательно получаем, что лежит в интервале единичной длины:
ˆ
np qmnpp
ˆ
mˆ
m
34
Однако, стоит заметить, что использование формулы Бернулли при больших значениях п достаточно трудно, так как формула требует выполнения действий над громадными числами.
Например, если
50
n
,
30
k
,
,
1
,
0
p
, то для отыскания вероятности надо вычислить выражение
20 30 50
)
9
,
0
(
)
1
,
0
(
!
20
!
30
!
50
)
30
(
P
, где
57 10 30414093
!
50
;
25 10 26525286
!
30
;
11 10 24329020
!
20
Вопросы и задания.
1. Схема испытаний Бернулли.
2. Формула Бернулли.
3. Наиболее вероятное число успехов в схеме Бернулли.
Задание 1. Монета бросается пять раз. Найти вероятность того, что орел выпадет 2 раза.
Задание 2. В семье 5 детей. Найти вероятность того, что среди них 2 мальчика, если вероятность рождения мальчика равна 0,51.
Вероятность обнаружения опечатки на странице книги равна 0,01. Найти вероятность того, что в 500-страничной книге не будет обнаружено опечаток
(обнаружение опечаток на различных страницах считать независимыми событиями).
Задание 3. Вероятность изготовления детали высшего сорта равна 0.4.
Найти вероятность того, что из 260 деталей половина будет высшего сорта.
Задание 4. Вероятность изготовления изделия высшего качества равна 0,8.
Найти вероятность того, что среди взятых 60 изделий 30 окажутся высшего качества.
Локальная теорема Лапласа.Если вероятность р появления события А в
каждом испытании постоянна и отлична от нуля и единицы, то вероятность
того, что событие А появится в п испытаниях ровно k раз, приближенно
равна (тем точнее, чем больше п) значению функции
)
(
1 2
1 1
2 2
x
npq
e
npq
y
x
при
npq
np
k
x
Имеются таблицы, в которых помещены значения функции
2 2
2 1
)
(
x
e
x
При этом следует учитывать, что
)
(
)
(
x
x
, так как функция
)
(x
четная.
Следовательно, вероятность того, что событие А появится в п независимых испытаниях ровно k раз, приближенно равна
)
(
1
)
(
x
npq
k
P
n
,
)
30
(
50
P
)
(k
P
n
35 где
npq
np
k
x
Пример 1. Найти вероятность того, что событие А наступит ровно 80 раз в 400 испытаниях, если вероятность появления этого события в каждом испытании равна 0,2.
Решение. По условию
400
n
;
80
k
;
2
,
0
p
;
8
,
0
q
Воспользуемся формулой
(4.7):
)
(
8 1
)
(
8
,
0 2
,
0 400 1
)
80
(
400
x
x
P
Вычислим определяемое данными задачи значение х:
0 8
2
,
0 400 80
npq
np
k
x
По таблице находим
3989
,
0
)
0
(
Искомая вероятность равна
04986
,
0 3989
,
0 8
1
)
80
(
400
P
Пусть теперь требуется вычислить вероятность
)
,
(
2 1
k
k
P
n
того, что событие А появится в п испытаниях не менее
1
k
и не более
2
k
раз (для краткости будем говорить «от
1
k
до
2
k
раз»). Эта задача решается с помощью следующей теоремы.
Интегральная теорема Лапласа.Если вероятность р наступления события А
в каждом испытании постоянна и отлична от нуля и единицы, то
вероятность
)
,
(
2 1
k
k
P
n
того, что событие А появится в п испытаниях от
1
k
до
2
k
раз, приближенно равна определенному интегралу
2 1
2 2
2 1
2 1
)
,
(
x
x
z
n
dz
e
k
k
P
,
где
npq
np
k
x
1 1
и
npq
np
k
x
2 2
.
При решении задач, требующих применения интегральной теоремы Лапласа, пользуются специальной таблицей для интеграла
x
z
dz
e
x
0 2
2 2
1
)
(
. В таблице даны значения функции
)
(x
для
0
x
, а для
0
x
воспользуемся нечетностью функции
)
(x
, т.е.
)
(
)
(
x
x
. Функцию
)
(x
часто называют функцией Лапласа.
Итак, вероятность того, что событие А появится в п независимых испытаниях от до раз, равна
)
(
)
(
)
,
(
1 2
2 1
x
x
k
k
P
n
,
1
k
2
k
36 где
npq
np
k
x
1 1
и
npq
np
k
x
2 2
Пример 2. Вероятность того, что организация не прошла проверку налоговой инспекции, равна
2
,
0
p
. Найти вероятность того, что среди 400 случайно отобранных организаций не прошедших проверку окажется от 70 до 100 организаций.
Решение. По условию
400
n
;
70 1
k
;
100 2
k
;
2
,
0
p
;
8
,
0
q
Воспользуемся формулой (4.9):
)
(
)
(
)
100
,
70
(
1 2
400
x
x
P
Вычислим нижний и верхний пределы интегрирования:
25
,
1 8
,
0 2
,
0 400 2
,
0 400 70 1
1
npq
np
k
x
;
5
,
2 8
,
0 2
,
0 400 2
,
0 400 100 2
2
npq
np
k
x
Таким образом, имеем
)
25
,
1
(
)
5
,
2
(
)
25
,
1
(
)
5
,
2
(
)
100
,
70
(
400
P
По таблице значений функции
)
(x
находим
4938
,
0
)
5
,
2
(
;
3944
,
0
)
25
,
1
(
Искомая вероятность равна
8882
,
0 3944
,
0 4938
,
0
)
100
,
70
(
400
P
Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А равна р. Для определения вероятности k появлений события в этих испытаниях используют формулу Бернулли. Если же
п велико, то пользуются локальной теоремой Лапласа. Однако она дает большую погрешность, если вероятность события мала (p 0,1).
Если сделать допущение, что произведение
np
при
n
сохраняет постоянное значение, а именно
np
, то вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно k раз, находится по следующей формуле:
(k)
!
k
n
P
e
k
Эта формула выражает закон распределения Пуассона вероятностей массовых
(п велико) и маловероятных (р мало) событий. Имеются специальные таблицы для распределения Пуассона.
Пример 3. Завод отправил на базу 5000 качественных изделий. Вероятность того, что в пути изделие повредится, равно 0,0002. Найти вероятность того, что на базу прибудут 3 поврежденных изделия.
Решение. По условию
5000,
0, 0002,
3
n
p
k
. Найдем
:
5000 0, 0002 1
np
Искомая вероятность по формуле (5.2) равна:
37 3
1 5000 1
1
(3)
0, 06 3!
6
Pee
Рекомендуемые источники информации
(№ источника)
Основная
Дополнительная
Методическая
Интернет-ресурсы
1 1
1,2 1,2
Практическое занятие 8. Тема занятия. Статистические исследования зависимостей.
Цельзанятия.Закрепить навык проведения статистических исследований зависимостей.
В результате освоения темы обучающийся должен: Знать: сущность статистических исследований зависимостей.
Уметь: находить выборочный коэффициент корреляции.
Владеть:- способностью осуществлять поиск, критический анализ и синтез информации, применять системный подход для решения поставленных задач (УК-1)
Актуальность темы. Статистические исследования используются в экономических расчетах.
Теоретическая часть. Корреляционный анализ и регрессионный анализ являются смежными разделами математической статистики и предназначены для изучения по выборочным данным статистической зависимости случайных величин. Две случайные величины могут быть связаны либо функциональной зависимостью, либо статистической зависимостью, либо быть независимыми.
Если каждому возможному значению случайной величины
X соответствует одно возможное значение случайной величины
, то
Yназывается
функцией случайного аргументаX:
)
(
XY
, а зависимость между случайными величинами
X и
Y называется
функциональной зависимостью.
Строгая функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, причем среди них
могут быть и общие для обеих величин, т.е. такие факторы, которые воздействуют как на
X, так и на
Y. В этом случае возникает статистическая зависимость.
Статистической называется зависимость, при которой изменение одной из величин влечет изменение распределения другой.
Частным случаем статистической зависимости является корреляционная зависимость.
Если статистическая зависимость проявляется в том, что при изменении одной
Y
38 из рассматриваемых случайных величин изменяется среднее значение другой случайной величины, то такая статистическая зависимость называется
корреляционной.
Приведем пример случайной величины
Y
, которая не связана с величиной
X
функционально, а связана корреляционно. Пусть
Y
— урожай зерна,
X
— количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, т.е.
Y
не является функцией от
X
. Это объясняется влиянием случайных факторов, таких, как осадки, температура воздуха и др. С другой стороны, средний урожай является функцией от количества удобрений, т.е.
Y
связан с
X
корреляционной зависимостью.
Условным средним
x
y
называется среднее арифметическое наблюдавшихся значений
Y
, соответствующих
x
X
. Например, если при
2 1
x
величина
Y
приняла значения
5 1
y
,
6 2
y
,
10 3
y
, то условное среднее равно
7 3
)
10 6
5
(
1
x
y
Условным
средним
y
x
называется среднее арифметическое наблюдавшихся значений
X
, соответствующих
y
Y
Как видно из определения, условное среднее является функцией от
; обозначив эту функцию через
)
( x
f
, получим уравнение
)
( x
f
y
x
Это уравнение называется выборочным уравнением регрессии
Y
на
X
; функция
)
( x
f
называется выборочной регрессией
Y
на
X
, а ее график —
выборочной линией регрессии
Y
на
X
Аналогично уравнение
)
( y
x
y
называется выборочным уравнением регрессии
X
на
Y
; функция
)
( y
называется выборочной регрессией
X
на
Y
, а ее график — выборочной линией
регрессии
X
на
Y
В связи с вышеизложенным возникают две задачи теории корреляции.
Первая — нахождение по данным наблюдений параметров функций
)
( x
f
и
)
( y
при условии, что известен их вид. Вторая — оценка силы (тесноты) связи между случайными величинами
X
и
Y
и установление наличия корреляционной зависимости между этими величинами.
Пусть изучается система количественных признаков
)
,
(
Y
X
. В результате независимых опытов получены пар чисел
)
,
(
1 1
y
x
,
)
,
(
2 2
y
x
, ... ,
)
,
(
n
n
y
x
Найдем по данным наблюдений выборочное уравнение прямой линии регрессии. Для определенности будем искать уравнение
x
y
x
n
n
39
b
x
k
y
x
регрессии
Y
на
X
Поскольку различные значения
x
признака
X
и соответствующие им значения признака
Y
наблюдались по одному разу, то группировать данные нет необходимости. Также нет надобности использовать понятие условной средней, поэтому уравнение (14.3) можно записать следующим образом:
b
x
k
y
Угловой коэффициент прямой линии регрессии
Y
на
X
называется
выборочным коэффициентом регрессии
Y
на
X
и обозначается через
Следовательно, искомое выборочное уравнение прямой линии регрессии
Y
на следует искать в виде
yx
y
x b
Нужно найти такие параметры
yx
и
b
,
, при которых точки
)
,
(
1 1
y
x
,
)
,
(
2 2
y
x
, ... ,
)
,
(
n
n
y
x
,
построенные по данным наблюдений, на плоскости лежали как можно ближе к прямой. использовании этого метода сумма квадратов отклонений
i
i
y
Y
(
n
i
,
,
2
,
1
), где
i
Y
— вычисленная по уравнению (14.5) ордината, соответствующая наблюдаемому значению
i
x
, а
i
y
— наблюдаемая ордината, соответствующая
, должна быть минимальной. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция этих параметров:
n
i
i
i
y
Y
b
F
1 2
)
(
)
,
(
или
n
i
i
i
y
b
x
b
F
1 2
)
(
)
,
(
Для отыскания минимума приравняем нулю соответствующие частные производные:
0
)
(
2 0
)
(
2 1
1
n
i
i
i
n
i
i
i
i
y
b
x
b
F
x
y
b
x
F
Решив эту систему двух линейных уравнений относительно
и
b
, найдем искомые параметры:
y
yx
X
xOy
i
x
40
2 1
1 2
1 1
1
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
i
yx
x
x
n
y
x
y
x
n
;
2 1
1 2
1 1
1 1
2
n
i
i
n
i
i
n
i
i
i
n
i
i
n
i
i
n
i
i
x
x
n
y
x
x
y
x
b
Аналогично можно найти выборочное уравнение прямой линии регрессии
X
на
Y
:
c
y
x
xy
y
, где
xy
— выборочный коэффициент регрессии
X
на
Y
Пример 1. Найти выборочное уравнение прямой линии регрессии
Y
на
X
по данным
5
n
наблюдений:
Т а б л и ц а 1.
1,00 1,50 3,00 4,50 5,00 1,25 1,40 1,50 1,75 2,25
Составим следующую расчетную таблицу 2.
Найдем искомые параметры из соотношений (14.9) и (14.10):
202
,
0 15 5
,
57 5
15
,
8 15 975
,
26 5
2
yx
;
024
,
1 15 5
,
57 5
975
,
26 15 15
,
8 5
,
57 2
b
Напишем искомое уравнение прямой линии регрессии на
:
024
,
1 202
,
0
x
y
Т а б л и ц а 2.
1,00 1,25 1,00 1,250 1,50 1,40 2,25 2,100 3,00 1,50 9,00 4,500 4,50 1,75 20,25 7,875 5,00 2,25 25,00 11,250
=15
=8,15
=57,50
=26,975
При большом числе наблюдений одно и тоже значение
x
может встретится
x
n
раз, одно и тоже значение
y
—
y
n
раз, одна и та же пара чисел
)
,
(
y
x
может наблюдаться
xy
n
раз. Поэтому данные наблюдений следует
i
x
i
y
Y
X
i
x
i
y
2
i
x
i
i
y
x
n
i
i
x
1
n
i
i
y
1
n
i
i
x
1 2
n
i
i
i
y
x
1
41 группировать, для этого подсчитываются частоты
,
,
. Все сгруппированные данные записываются в виде таблицы (например, таблица 3), которая называется корреляционной.
Т а б л и ц а 3.
10 20 30 40 0,4 5
—
7 14 26 0,6
—
2 6
4 12 0,8 3
19
—
—
22 8
21 13 18
В первой строке корреляционной таблицы указаны наблюдаемые значения (10; 20; 30; 40) признака
, а в первом столбце — наблюдаемые значения (0,4; 0,6; 0,8) признака . На пересечении строк и столбцов находятся частоты наблюдаемых пар значений признаков.
В последнем столбце записаны суммы частот строк, а в последней строке
— суммы частот столбцов. В клетке, расположенной в нижнем правом углу таблицы, помещена сумма всех частот, т.е. общее число всех наблюдений .
Очевидно, что
n
n
n
y
x
Теперь определим параметры выборочного уравнения прямой линии регрессии на в случае, когда получено большое число данных
(практически для удовлетворительной оценки искомых параметров должно быть хотя бы 50 наблюдений), среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы.
Из системы (14.8) можно получить следующую систему:
n
i
i
n
i
i
yx
n
i
i
i
n
i
i
n
i
i
yx
y
nb
x
y
x
x
b
x
1 1
1 1
1 2
Для простоты приняв обозначения
n
i
i
x
x
1
,
n
i
i
y
y
1
,
n
i
i
x
x
1 2
2
,
n
i
i
i
y
x
xy
1
и воспользовавшись соотношениями
n
x
x
,
n
y
y
,
x
n
y
n
xy
n
Y
X
y
n
x
n
60
n
X
Y
xy
n
n
Y
X
42
n
x
x
2 2
,
xy
n
xy
xy
(в предположении, что пара чисел
)
,
(
y
x
наблюдалась
xy
n
раз), получаем
y
b
x
xy
n
b
x
n
x
n
yx
xy
yx
2
Второе уравнение системы (14.13) преобразуем к виду
yx
x
y
b
и подставив правую часть этого равенства в уравнение
b
x
y
yx
x
, получим следующее соотношение
)
(
x
x
y
y
yx
x
найдем из системы выборочный коэффициент регрессии
yx
:
2 2
2
)
(
x
xy
xy
yx
n
y
x
n
xy
n
x
x
n
y
x
n
xy
n
Умножим обе части этого равенства на дробь
y
x
:
y
x
xy
y
x
yx
n
y
x
n
xy
n
Обозначим правую часть равенства (14.15) через
В
r
:
y
x
xy
В
n
y
x
n
xy
n
r
Тогда получаем
x
y
В
yx
r
Окончательно получим выборочное уравнение прямой линии регрессии
Y
на
X
вида
)
(
x
x
r
y
y
x
y
В
x
Аналогично можно найти выборочное уравнение прямой линии регрессии на :
)
(
y
y
r
x
x
y
x
В
y
Вопросы и задания.
1. Метод наименьших квадратов.
X
Y
43 2. Корреляционная таблица.
3. Выборочное уравнение прямой линии регрессии.
Задание 1. Найти выборочное уравнение прямой линии регрессии на по данным, приведённым в следующей таблице:
20 25 30 35 40 16 4
6
-
-
-
10 26
-
8 10
-
-
18 36
-
-
32 3
9 44 46
-
-
4 12 6
22 56
-
-
-
1 5
0 4
14 46 16 20
Задание 2. Найти выборочное уравнение регрессии
2
x
y
Ax
Bx
C
по данным, приведённым в следующей корреляционной таблице:
2 3
5 25 20
-
-
20 45
-
30 1
31 110
-
1 48 49 20 31 49
Вопросы и задания.
1. Задачи корреляционного и регрессионного анализа.
2. Какая зависимостьназывается статистической.
3. Выборочный коэффициент регрессии.
4. Выборочное уравнение регрессии.
Рекомендуемые источники информации
(№ источника)
Основная
Дополнительная
Методическая
Интернет-ресурсы
1 1
1,2 1,2
Практическое занятие 9.
Y
X
Y
X
y
n
x
n
100
n
Y
X
y
n
x
n
100
n