Решение Представим данные об урожайности зерновых культур в графическом виде Определим среднюю урожайность в каждом из районов области

Название	Решение Представим данные об урожайности зерновых культур в графическом виде Определим среднюю урожайность в каждом из районов области
Дата	27.06.2019
Размер	304 Kb.
Формат файла
Имя файла	stat_obrabotka_dannykh.doc
Тип	Документы #83220

Вариант № 8

Имеются данные о посевной площади, урожайности и валовом сборе в 2-х районах области зерновых культур:

№ совхоза	Первый район		Второй район
№ совхоза	Валовый сбор, ц	Урожайность, ц/га	Урожайность, ц/га	Посевная площадь, га
1	5300	30	31	350
2	6510	25	27	342
3	4320	32	28	368

Представьте информацию графически и определите среднюю урожайность зерновых в каждом из районов области. Укажите виды рассчитанных средних величин.

Решение:

Представим данные об урожайности зерновых культур в графическом виде:

Определим среднюю урожайность в каждом из районов области:

Первый район:

Определим посевную площадь в каждом из совхозов, используя формулу:

№ совхоза	Первый район
	Валовый сбор, ц	Урожайность,	Посевная площадь
	Валовый сбор, ц	ц/га	(га)
1	5300	30
2	6510	25
3	4320	32
Итого	16130		572,1

Второй район:

Определим валовый сбор зерновых в каждом из совхозов, используя формулу:

№ совхоза	Первый район
	Посевная площадь (га)	Урожайность,	Валовый сбор
	Посевная площадь (га)	ц/га	(ц)
1	350	31
2	342	27
3	368	28
Итого	1060		30388

Для выборки запишите эмпирический закон распределения, постройте многоугольник распределения. Найдите точечные оценки для математического ожидания, дисперсии и среднего квадратического отклонения. Найдите модальное и медианное значения для выборки.

4	2	3	4	1
3	2	3	3	3
1	1	2	2	3
4	1	3	3	1
1	2	3	3	1
3	3	3	2	1
1	3	3	2	1
1	3	2	2	3
3	3	1	4	1
3	4	2	4	3

Решение:

Сгруппируем данные для обработки (n=50) и составим таблицу для расчета показателей:

x_i	Кол-во, f_i	x_i * f_i	Накопленная частота, S	\|x - x_ср\|*f	(x - x_ср)²*f	Частота, f_i/n	Накопленная частота, f_i/n
1	13	13	13	18.2	25.48	0.26	0.26
2	10	20	23	4	1.6	0.2	0.46
3	21	63	44	12.6	7.56	0.42	0.88
4	6	24	50	9.6	15.36	0.12	1
Итого	50	120		44.4	50	1

Эмпирический закон распределения функции:

Построим многоугольник распределения:

Для оценки ряда распределения найдем следующие показатели:

Средняя взвешенная

Мода.

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Максимальное значение повторений при x = 3 (f = 21). Следовательно, мода равна 3

Медиана.

Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим x_i, при котором накопленная частота S будет больше ∑f/2 = 26. Это значение x_i = 3. Таким образом, медиана равна 3

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).

Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 2.4 в среднем на 1

Контролер взвесил 35 пакетов сахарного песка:

2,18	3,47	1,96	3,46	2,23
1,78	2,43	3,38	1,29	3,25
2,38	3,18	3,47	1,51	2,55
2,48	2,95	3,47	2,54	2,15
2,71	2,46	3,41	1,27	2,21
3,32	2,37	3,27	3,32	1,52
1,42	1,18	1,39	1,38	2,95

Определить тип исследуемого признака. Построить график эмпирической функции распределения, характеризующей вес пакета сахарного песка. Укажите предупреждающие границы и границы регулирования процесса.

Решение:

Число групп приближенно определяется по формуле Стэрджесса

n = 1 + 3,2log n

n = 1 + 3,2log(35) = 6

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности.

Xmin - минимальное значение группировочного признака.

Таблица группировки

Группы	x_i	Кол-во, f_i	Частота, f_i/n	Накопленная Частота, f_i/n
1.18 - 1.56	1.37	8	0.23	0,23
1.56 - 1.94	1.75	1	0.0286	0,26
1.94 - 2.32	2.13	5	0.14	0,40
2.32 - 2.7	2.51	7	0.2	0,60
2.7 - 3.08	2.89	3	0.0857	0,69
3.08 - 3.46	3.27	11	0.31	1
Итого		35	1

Эмпирический закон распределения функции:

График эмпирической функции распределения:

Выручка в магазине от продажи сахара составила соответственно по месяцам следующие значения (млн руб.):

Месяц	1	2	3	4	5	6	7	8	9	10	11	12
Выручка	0,2	0,5	0,4	0,2	0,4	0,5	0,2	0,2	0,4	0,5	0,41	0,2

Найдите интервальную оценку для математического ожидания и дисперсии при уровне значимости 5%.

Решение:

Составим функцию распределения случайной величины:

Значение

x	0.2	0.5	0.4	0.2	0.4	0.5	0.2	0.2	0.4	0.5	0.41	0.2
p	0.08	0.08	0.08	0.08	0.08	0.08	0.08	0.08	0.08	0.08	0.08	0.08

Математическое ожидание находим по формуле M[x] = ∑x_ip_i.

Математическое ожидание M[X].

M[x] = 0.2*0.08 + 0.5*0.08 + 0.4*0.08 + 0.2*0.08 + 0.4*0.08 + 0.5*0.08 + 0.2*0.08 + 0.2*0.08 + 0.4*0.08 + 0.5*0.08 + 0.41*0.08 + 0.2*0.08 = 0.329

Дисперсию находим по формуле d = ∑x²_ip_i - M[x]².

Дисперсия D[X].

D[X] = 0.2²*0.08 + 0.5²*0.08 + 0.4²*0.08 + 0.2²*0.08 + 0.4²*0.08 + 0.5²*0.08 + 0.2²*0.08 + 0.2²*0.08 + 0.4²*0.08 + 0.5²*0.08 + 0.41²*0.08 + 0.2²*0.08 - 0.329² = 0.0197

Найдите интервальную оценку для математического ожидания и дисперсии при уровне значимости 5%.

Среднеквадратическое отклонение:

Доверительный интервал для генерального среднего.

Поскольку n ≤ 30, то определяем значение t_kp по таблице распределения Стьюдента

По таблице Стьюдента находим:

T_табл (n-1;α/2) = (12;0.025) = 2.201

(0.3425 - 0.0892;0.3425 + 0.0892) = (0.25;0.43)

С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.

Доверительный интервал для дисперсии.

Вероятность выхода за нижнюю границу равна P(χ²_n-1 < h_H) = (1-γ)/2 = (1-0.95)/2 = 0.025. Для количества степеней свободы k = 11 по таблице распределения χ² находим:

χ²(11;0.025) = 21.92005.

Случайная ошибка дисперсии:

Вероятность выхода за верхнюю границу равна P(χ²_n-1 ≥ h_B) = 1 - P(χ²_n-1 < h_H) = 1 - 0.025 = 0.975. Для количества степеней свободы k = 11, по таблице распределения χ² находим:

χ²(11;0.975) = 3.81575.

Случайная ошибка дисперсии:

(0.0197 - 0.00989; 0.0197 + 0.0568)

Таким образом, интервал (0.00981;0.0765) покрывает параметр S² с надежностью γ = 0.95

5) Проведите статистическое исследование на свободную тему. В контрольной работе укажите тему исследования, вопросы, по которым проводилось исследование, полученные выборочные данные, найдите все необходимые точечные оценки для представленной выборки, постройте эмпирическую функцию распределения, характеризующую Ваше исследование, сделайте вывод.
Тема исследования: Анализ возрастной структуры работников автотранспортного цеха предприятия.

Цель исследования: Изучить возрастную структуру работников, дать оценку.

Исходные данные: Имеются данные по 50 водителям цеха:

35	32	22	55	40
21	30	53	47	32
32	20	48	58	34
21	23	31	53	29
58	41	57	43	23
32	32	47	56	22
35	39	27	25	54
28	38	51	47	24
21	49	46	22	29
45	23	44	32	34

Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях – это группировочный признак, интервал группировки и число групп.

Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Определение числа групп.

Число групп приближенно определяется по формуле Стэрджесса

n = 1 + 3,2log n

n = 1 + 3,2log(50) = 6

Решение.

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности.

Xmin - минимальное значение группировочного признака.

Рассчитанные данные сведем в таблицу:

Группы	x_i	Кол-во, f_i	x_i * f_i	Накопленная частота, S	\|x - x_ср\|*f	(x - x_ср)²*f	Частота, f_i/n
20 - 26.33	23.17	12	277.98	12	164.07	2243.35	0.24
26.33 - 32.66	29.5	12	353.94	24	88.11	647	0.24
32.66 - 38.99	35.83	5	179.13	29	5.06	5.13	0.1
38.99 - 45.32	42.16	6	252.93	35	31.9	169.64	0.12
45.32 - 51.65	48.49	7	339.4	42	81.53	949.6	0.14
51.65 - 57.98	54.82	8	438.52	50	143.82	2585.44	0.16
Итого		50	1841.89		514.5	6600.15	1

Построим эмпирическую функцию распределения ряда:

Для оценки ряда распределения найдем следующие показатели:

Средняя взвешенная

Средний возраст сотрудников составляет 37 лет.
Мода.

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
где x₀ – начало модального интервала; h – величина интервала; f₂ –частота, соответствующая модальному интервалу; f₁ – предмодальная частота; f₃ – послемодальная частота.

Выбираем в качестве начала интервала 20, так как именно на этот интервал приходится наибольшее количество.
Наиболее часто встречающееся значение ряда – 26 лет
Медиана.

Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 20 - 26.33, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50% водителей младше 34 лет.
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).

Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 36.84 в среднем на 11.49

Выводы: По результатам статистического исследования определили: средний возраст работников автотранспортного цеха составляет 37 лет, при этом 50% водителей младше 34 лет.

Возраст самого младшего водителя составляет – 20 лет, самого старшего – 58 лет.

Возрастная структура работников оптимальна.