ПЕРВОЕ ВЫСШЕЕ ТЕХНИЧЕСКОЕ УЧЕБНОЕ ЗАВЕДЕНИЕ РОССИИ
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«САНКТ-ПЕТЕРБУРГСКИЙ ГОРНЫЙ УНИВЕРСИТЕТ» ОТЧЕТ
Расчетно-графическое задание №4 Вариант №1
По дисциплине
| Математика
|
| (наименование учебной дисциплины согласно учебному плану)
|
Тема:
| Основы математической статистики
|
|
| Автор: студент гр.
| ГТС-19
|
|
|
| //
|
|
| (подпись)
|
|
| (Ф.И.О.)
|
ПРОВЕРИЛ
|
|
доцент
|
|
| /Лебедев И.А./
|
|
|
| (должность)
|
| (подпись)
| (Ф.И.О.)
|
|
Санкт-Петербург
2021 год
Задание 1:
По двум последним цифрам шифра студента (…ab) определяется вариационный ряд из двадцати значений (с шагом h = 3) и соответствующих частот:
.
Произвести группировку значений и по сгруппированному вариационному ряду построить эмпирическую функцию распределения и гистограмму. Данные:
ab=1+30(2-1)=31
a=3
b=1
Решение:
Подставим данные.
| 1
| 2
| 3
| 4
| 5
| 6
| 7
| 8
| 9
| 10
| x
| 2
| 5
| 8
| 11
| 14
| 17
| 20
| 23
| 26
| 29
| m
| 13
| 2
| 11
| 2
| 13
| 4
| 15
| 6
| 17
| 8
|
11
| 12
| 13
| 14
| 15
| 16
| 17
| 18
| 19
| 20
| 32
| 35
| 38
| 41
| 44
| 47
| 50
| 53
| 56
| 59
| 19
| 10
| 21
| 12
| 23
| 14
| 25
| 16
| 27
| 18
| Объем выборки:
n=
n=276
Размах выборки: 57
Вводим интервалы группировки:
(чтобы первое значение x1=2 включалось с запасом),
, , , , , (последнее значение x20=59 включается с запасом). Для сгруппированного вариационного ряда значения равны серединам интервалов: , , , , , , а частоты для этих значений (т.е. для интервалов ) получаем, складывая частоты значений , попавшие в соответствующий интервал группировки, причем для значения , попавшего на границу двух интервалов, частота делится между этими интервалами поровну:
Эмпирические вероятности равны:
0,094
0,096
0,139
0,181
0,224
0,266
Отметим, что .
Накопленные вероятности:
За : =0,094; за : =0,19; за : =0,329; за : =0,51; за : =0,734; за : =1
Определяем эмпирические плотности:
Графики
Задание 2:
Сгруппированный вариационный ряд задан серединами интервалов xi и соответствующими частотами mi. Восстановить интервалы и оценить с помощью критерия Пирсона хи-квадрат согласие данных с нормальным распределением при уровне значимости , где b – последняя цифра шифра. Данные:
| 1
| 2
| 3
| 4
| 5
| 6
| xi
| 10
| 20
| 30
| 40
| 50
| 60
| mi
| 5
| 8
| 15
| 11
| 7
| 4
|
b=9
Решение:
a=1-(0,9+0,01)=0,09 Данные интервалы:
;
Введем условную варианту, определив шаг h=10 и выбрав ложный нуль C=30, и найдем и
| 1
| 2
| 3
| 4
| 5
| 6
|
| xi
| 10
| 20
| 30
| 40
| 50
| 60
|
| mi
| 5
| 8
| 15
| 11
| 7
| 4
| 50
| ui=
| -2
| -1
| 0
| 1
| 2
| 3
|
| ui*mi
| -10
| -8
| 0
| 11
| 14
| 12
| 19
|
| 4
| 1
| 0
| 1
| 4
| 9
|
|
*mi
| 20
| 8
| 0
| 11
| 28
| 36
| 103
| По данный таблицы имеем n=50
=>
=10* +30=33,8
=>
= =>
Найдем теоретические частоты для интервала используя формулу вероятности попадания значений в этот интервал (для нормального распределения с параметрами и ):
.
| 5-15
| 15-25
| 25-35
| 35-45
| 45-55
| 55-65
|
| -2,09
| -1,36
| -0,64
| 0,09
| 0,81
| 1,54
|
| -1,36
| -0,64
| 0,09
| 0,81
| 1,54
| 2,26
|
| -0,4817
| -0,4131
| -0,289
| 0,0359
| 0,2910
| 0,4382
|
| -0,4131
| -0,289
| 0,0359
| 0,2910
| 0,4382
| 0,4881
|
| 0,0696
| 0,1241
| 0,3249
| 0,2551
| 0,1372
| 0,0499
|
| 3,48
| 6,205
| 16,248
| 12,755
| 6,86
| 2,495
| Найдем выборочное значение , объединив крайние интервалы для маленьких частот mi.
| 1
| 2
| 3
| 4
| 5
| 6
|
| 5-15
| 15-25
| 25-35
| 35-45
| 45-55
| 55-65
| mi
| 5
| 8
| 15
| 11
| 7
| 4
|
| 4
| 6
| 12
| 13
| 7
| 3
| mi-
| 1
| 2
| 3
| -2
| 0
| 1
| (mi- )2
| 1
| 4
| 9
| 4
| 0
| 1
| (mi- )2/
| 0,25
| 0,67
| 0,75
| 0,31
| 0
| 0,33
|
X2= =2,31
Таким образом, если после объединения число интервалов а число наложенных связей p=3, то число степеней свободы r=k-p=6-3=3. Поэтому по таблице критических значений имеем . Сравнивая найденное значение X2=2,31 с критическим (2,31<6,25), определяем, что рассматриваемые данные можно считать полученными из нормально распределенной совокупности.
Задание 3:
Найти выборочные регрессии, построить их графики и точки условных средних на одном чертеже. Оценить качество связи. Данные:
ab=31
Y
| X
| b
| b+(10-a)
| b+2(10-a)
| b+3(10-a)
| b+4(10-a)
| b+5(10-a)
| a
| 5
| 10-a
|
| 15-b
|
|
| a+10
|
|
| 2b
|
| 20-2b
| 4
| a+20
|
|
|
| 30-a-b
|
|
| a+30
|
| 5
| a
|
|
| b
| a+40
| b
| a+b
|
| 10-b
| 1
|
|
Решение:
Y
| X
| nj
|
| 1
| 8
| 15
| 22
| 29
| 36
|
|
| 3
| 5
| 7
|
| 14
|
|
| 26
| 14,19
| 13
|
|
| 2
|
| 18
| 4
| 24
| 26,77
| 23
|
|
|
| 26
|
|
| 26
| 22
| 33
|
| 5
| 3
|
|
| 1
| 9
| 13,4
| 43
| 1
| 4
|
| 9
| 1
|
| 15
| 17,3
| mj
| 6
| 16
| 5
| 48
| 19
| 5
| n=100
|
|
| 9,67
| 22,375
| 25
| 21,4
| 14,58
| 17
|
|
| Для определения выборочных регрессий перейдем к условным вариантам.
Наибольшая частота, ближайшая к центру таблицы, m43=26 и, следовательно, соответствующие ложные нули C1=x4=30 и C2=y3=23 шаг h1=7 (для xi) и (для yj).
Составим новую таблицу в условных вариантах для расчета характеристик:
vj
| ui
| -3
| -2
| -1
| 0
| 1
| 2
| nj
| vjnj
| vj2nj
| -2
| 5
| 7
|
| 14
|
|
| 26
| -52
| 104
| -1
|
|
| 2
|
| 18
| 4
| 24
| -24
| 24
| 0
|
|
|
| 26
|
|
| 26
| 0
| 0
| 1
|
| 5
| 3
|
|
| 1
| 9
| 9
| 9
| 2
| 1
| 4
|
| 9
| 1
|
| 15
| 30
| 60
| mi
| 6
| 16
| 5
| 48
| 19
| 5
| n=100
|
=
-37
|
=197
| miui
| -18
| -32
| -5
| 0
| 19
| 10
|
=
=-26
|
|
| miui2
| 54
| 64
| 5
| 0
| 19
| 20
|
=162
|
|
|
По данным таблицы получим выборочные характеристики:
=
1,62
=1,97
=7*(-0,26)+30
=10*(-0,37)+23 20,41
= 1,24595=>
= 1,35392=>
10*1,35392 13,5392
Для вычисления найдем средние суммы всех произведений uivjmij:
+(-2)*(-2)*7+(-2)*0*14+(-1)*(-1)*2+
+(-1)*1*18+(-1)*2*4+0*0*26+1*(-2)*5+1*(-1)*3+1*1*2+2*(-3)*1+2*
*(-2)*4+2*0*9+2*1*1]=
Выборочный коэффициент корреляции
=-0,03924
Уравнения выборочных регрессий имеют вид для регрессии Y на X
y- => y-20,41
y=-0,06092x+22,12659
Для регрессии X на Y
x- =>x-28,18 *
x=-0,025277у+28,69591
Обе регрессии проходят через точку средних ( ; )=(28,18; 20,41) и для построения прямых найдем еще по одной точке для каждой прямой.
Для y=-0,164301x+27,28595 это точка (0; 27,28595), для прямой
x=-0,09066у+26,37247 это точка (26,37247;0).
Так как |r*xy|=0,03924 далеко от нуля (угол между прямыми наилучших линейных регрессий близких к нулю), то связь между изучаемыми случайными величинами достаточно сильная, и т.к. далек от единицы, то связь сильно линейная.
График:
|