Главная страница

Решение Представим данные об урожайности зерновых культур в графическом виде Определим среднюю урожайность в каждом из районов области


Скачать 304 Kb.
НазваниеРешение Представим данные об урожайности зерновых культур в графическом виде Определим среднюю урожайность в каждом из районов области
Дата27.06.2019
Размер304 Kb.
Формат файлаdoc
Имя файлаstat_obrabotka_dannykh.doc
ТипДокументы
#83220

Вариант № 8

  1. Имеются данные о посевной площади, урожайности и валовом сборе в 2-х районах области зерновых культур:

№ совхоза

Первый район

Второй район

Валовый сбор, ц

Урожайность,

ц/га

Урожайность,

ц/га

Посевная площадь, га

1

5300

30

31

350

2

6510

25

27

342

3

4320

32

28

368

Представьте информацию графически и определите среднюю урожайность зерновых в каждом из районов области. Укажите виды рассчитанных средних величин.

Решение:

Представим данные об урожайности зерновых культур в графическом виде:



Определим среднюю урожайность в каждом из районов области:

Первый район:

Определим посевную площадь в каждом из совхозов, используя формулу:



№ совхоза

Первый район

Валовый сбор, ц

Урожайность,

Посевная площадь

ц/га

(га)

1

5300

30



2

6510

25



3

4320

32



Итого

16130




572,1



Второй район:

Определим валовый сбор зерновых в каждом из совхозов, используя формулу:



№ совхоза

Первый район

Посевная площадь

(га)

Урожайность,

Валовый сбор

ц/га

(ц)

1

350

31



2

342

27



3

368

28



Итого

1060




30388



  1. Для выборки запишите эмпирический закон распределения, постройте многоугольник распределения. Найдите точечные оценки для математического ожидания, дисперсии и среднего квадратического отклонения. Найдите модальное и медианное значения для выборки.

4

2

3

4

1

3

2

3

3

3

1

1

2

2

3

4

1

3

3

1

1

2

3

3

1

3

3

3

2

1

1

3

3

2

1

1

3

2

2

3

3

3

1

4

1

3

4

2

4

3

Решение:

Сгруппируем данные для обработки (n=50) и составим таблицу для расчета показателей:

xi

Кол-во, fi

xi * fi

Накопленная частота, S

|x - xср|*f

(x - xср)2*f

Частота, fi/n

Накопленная частота, fi/n

1

13

13

13

18.2

25.48

0.26

0.26

2

10

20

23

4

1.6

0.2

0.46

3

21

63

44

12.6

7.56

0.42

0.88

4

6

24

50

9.6

15.36

0.12

1

Итого

50

120



44.4

50

1




Эмпирический закон распределения функции:



Построим многоугольник распределения:



Для оценки ряда распределения найдем следующие показатели:

Средняя взвешенная

Мода.

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Максимальное значение повторений при x = 3 (f = 21). Следовательно, мода равна 3

Медиана.

Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 26. Это значение xi = 3. Таким образом, медиана равна 3

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).

Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 2.4 в среднем на 1

  1. Контролер взвесил 35 пакетов сахарного песка:

2,18

3,47

1,96

3,46

2,23

1,78

2,43

3,38

1,29

3,25

2,38

3,18

3,47

1,51

2,55

2,48

2,95

3,47

2,54

2,15

2,71

2,46

3,41

1,27

2,21

3,32

2,37

3,27

3,32

1,52

1,42

1,18

1,39

1,38

2,95

Определить тип исследуемого признака. Построить график эмпирической функции распределения, характеризующей вес пакета сахарного песка. Укажите предупреждающие границы и границы регулирования процесса.

Решение:

Число групп приближенно определяется по формуле Стэрджесса

n = 1 + 3,2log n

n = 1 + 3,2log(35) = 6

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности.

Xmin - минимальное значение группировочного признака.

Таблица группировки

Группы

xi

Кол-во, fi

Частота, fi/n

Накопленная Частота, fi/n

1.18 - 1.56

1.37

8

0.23

0,23

1.56 - 1.94

1.75

1

0.0286

0,26

1.94 - 2.32

2.13

5

0.14

0,40

2.32 - 2.7

2.51

7

0.2

0,60

2.7 - 3.08

2.89

3

0.0857

0,69

3.08 - 3.46

3.27

11

0.31

1

Итого



35

1





Эмпирический закон распределения функции:



График эмпирической функции распределения:





  1. Выручка в магазине от продажи сахара составила соответственно по месяцам следующие значения (млн руб.):

Месяц

1

2

3

4

5

6

7

8

9

10

11

12

Выручка

0,2

0,5

0,4

0,2

0,4

0,5

0,2

0,2

0,4

0,5

0,41

0,2

Найдите интервальную оценку для математического ожидания и дисперсии при уровне значимости 5%.

Решение:

Составим функцию распределения случайной величины:

Значение 

x

0.2

0.5

0.4

0.2

0.4

0.5

0.2

0.2

0.4

0.5

0.41

0.2

p

0.08

0.08

0.08

0.08

0.08

0.08

0.08

0.08

0.08

0.08

0.08

0.08

Математическое ожидание находим по формуле M[x] = ∑xipi.

Математическое ожидание M[X].

M[x] = 0.2*0.08 + 0.5*0.08 + 0.4*0.08 + 0.2*0.08 + 0.4*0.08 + 0.5*0.08 + 0.2*0.08 + 0.2*0.08 + 0.4*0.08 + 0.5*0.08 + 0.41*0.08 + 0.2*0.08 = 0.329

Дисперсию находим по формуле d = ∑x2ipi - M[x]2.

Дисперсия D[X].

D[X] = 0.22*0.08 + 0.52*0.08 + 0.42*0.08 + 0.22*0.08 + 0.42*0.08 + 0.52*0.08 + 0.22*0.08 + 0.22*0.08 + 0.42*0.08 + 0.52*0.08 + 0.412*0.08 + 0.22*0.08 - 0.3292 = 0.0197

Найдите интервальную оценку для математического ожидания и дисперсии при уровне значимости 5%.

Среднеквадратическое отклонение:

Доверительный интервал для генерального среднего.

Поскольку n ≤ 30, то определяем значение tkp по таблице распределения Стьюдента

По таблице Стьюдента находим:

Tтабл (n-1;α/2) = (12;0.025) = 2.201

(0.3425 - 0.0892;0.3425 + 0.0892) = (0.25;0.43)

С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.

Доверительный интервал для дисперсии.

Вероятность выхода за нижнюю границу равна P(χ2n-1 < hH) = (1-γ)/2 = (1-0.95)/2 = 0.025. Для количества степеней свободы k = 11 по таблице распределения χ2 находим:

χ2(11;0.025) = 21.92005.

Случайная ошибка дисперсии:

Вероятность выхода за верхнюю границу равна P(χ2n-1 ≥ hB) = 1 - P(χ2n-1 < hH) = 1 - 0.025 = 0.975. Для количества степеней свободы k = 11, по таблице распределения χ2 находим:

χ2(11;0.975) = 3.81575.

Случайная ошибка дисперсии:

(0.0197 - 0.00989; 0.0197 + 0.0568)

Таким образом, интервал (0.00981;0.0765) покрывает параметр S2 с надежностью γ = 0.95

5) Проведите статистическое исследование на свободную тему. В контрольной работе укажите тему исследования, вопросы, по которым проводилось исследование, полученные выборочные данные, найдите все необходимые точечные оценки для представленной выборки, постройте эмпирическую функцию распределения, характеризующую Ваше исследование, сделайте вывод.
Тема исследования: Анализ возрастной структуры работников автотранспортного цеха предприятия.

Цель исследования: Изучить возрастную структуру работников, дать оценку.

Исходные данные: Имеются данные по 50 водителям цеха:

35

32

22

55

40

21

30

53

47

32

32

20

48

58

34

21

23

31

53

29

58

41

57

43

23

32

32

47

56

22

35

39

27

25

54

28

38

51

47

24

21

49

46

22

29

45

23

44

32

34

Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях – это группировочный признак, интервал группировки и число групп.

Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Определение числа групп.

Число групп приближенно определяется по формуле Стэрджесса

n = 1 + 3,2log n

n = 1 + 3,2log(50) = 6

Решение.

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности.

Xmin - минимальное значение группировочного признака.

Рассчитанные данные сведем в таблицу:

Группы

xi

Кол-во, fi

xi * fi

Накопленная частота, S

|x - xср|*f

(x - xср)2*f

Частота, fi/n

20 - 26.33

23.17

12

277.98

12

164.07

2243.35

0.24

26.33 - 32.66

29.5

12

353.94

24

88.11

647

0.24

32.66 - 38.99

35.83

5

179.13

29

5.06

5.13

0.1

38.99 - 45.32

42.16

6

252.93

35

31.9

169.64

0.12

45.32 - 51.65

48.49

7

339.4

42

81.53

949.6

0.14

51.65 - 57.98

54.82

8

438.52

50

143.82

2585.44

0.16

Итого



50

1841.89



514.5

6600.15

1


Построим эмпирическую функцию распределения ряда:



Для оценки ряда распределения найдем следующие показатели:

Средняя взвешенная

Средний возраст сотрудников составляет 37 лет.
Мода.

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.

Выбираем в качестве начала интервала 20, так как именно на этот интервал приходится наибольшее количество.
Наиболее часто встречающееся значение ряда – 26 лет
Медиана.

Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 20 - 26.33, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50% водителей младше 34 лет.
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).

Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 36.84 в среднем на 11.49

Выводы: По результатам статистического исследования определили: средний возраст работников автотранспортного цеха составляет 37 лет, при этом 50% водителей младше 34 лет.

Возраст самого младшего водителя составляет – 20 лет, самого старшего – 58 лет.

Возрастная структура работников оптимальна.


написать администратору сайта