Решение Представим данные об урожайности зерновых культур в графическом виде Определим среднюю урожайность в каждом из районов области
Скачать 304 Kb.
|
Вариант № 8
Представьте информацию графически и определите среднюю урожайность зерновых в каждом из районов области. Укажите виды рассчитанных средних величин. Решение: Представим данные об урожайности зерновых культур в графическом виде: Определим среднюю урожайность в каждом из районов области: Первый район: Определим посевную площадь в каждом из совхозов, используя формулу:
Второй район: Определим валовый сбор зерновых в каждом из совхозов, используя формулу:
Решение: Сгруппируем данные для обработки (n=50) и составим таблицу для расчета показателей:
Эмпирический закон распределения функции: Построим многоугольник распределения: Для оценки ряда распределения найдем следующие показатели: Средняя взвешенная Мода. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности. Максимальное значение повторений при x = 3 (f = 21). Следовательно, мода равна 3 Медиана. Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 26. Это значение xi = 3. Таким образом, медиана равна 3 Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего). Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия). Среднее квадратическое отклонение (средняя ошибка выборки). Каждое значение ряда отличается от среднего значения 2.4 в среднем на 1
Определить тип исследуемого признака. Построить график эмпирической функции распределения, характеризующей вес пакета сахарного песка. Укажите предупреждающие границы и границы регулирования процесса. Решение: Число групп приближенно определяется по формуле Стэрджесса n = 1 + 3,2log n n = 1 + 3,2log(35) = 6 Ширина интервала составит: Xmax - максимальное значение группировочного признака в совокупности. Xmin - минимальное значение группировочного признака. Таблица группировки
Эмпирический закон распределения функции: График эмпирической функции распределения:
Найдите интервальную оценку для математического ожидания и дисперсии при уровне значимости 5%. Решение: Составим функцию распределения случайной величины: Значение
Математическое ожидание находим по формуле M[x] = ∑xipi. Математическое ожидание M[X]. M[x] = 0.2*0.08 + 0.5*0.08 + 0.4*0.08 + 0.2*0.08 + 0.4*0.08 + 0.5*0.08 + 0.2*0.08 + 0.2*0.08 + 0.4*0.08 + 0.5*0.08 + 0.41*0.08 + 0.2*0.08 = 0.329 Дисперсию находим по формуле d = ∑x2ipi - M[x]2. Дисперсия D[X]. D[X] = 0.22*0.08 + 0.52*0.08 + 0.42*0.08 + 0.22*0.08 + 0.42*0.08 + 0.52*0.08 + 0.22*0.08 + 0.22*0.08 + 0.42*0.08 + 0.52*0.08 + 0.412*0.08 + 0.22*0.08 - 0.3292 = 0.0197 Найдите интервальную оценку для математического ожидания и дисперсии при уровне значимости 5%. Среднеквадратическое отклонение: Доверительный интервал для генерального среднего. Поскольку n ≤ 30, то определяем значение tkp по таблице распределения Стьюдента По таблице Стьюдента находим: Tтабл (n-1;α/2) = (12;0.025) = 2.201 (0.3425 - 0.0892;0.3425 + 0.0892) = (0.25;0.43) С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала. Доверительный интервал для дисперсии. Вероятность выхода за нижнюю границу равна P(χ2n-1 < hH) = (1-γ)/2 = (1-0.95)/2 = 0.025. Для количества степеней свободы k = 11 по таблице распределения χ2 находим: χ2(11;0.025) = 21.92005. Случайная ошибка дисперсии: Вероятность выхода за верхнюю границу равна P(χ2n-1 ≥ hB) = 1 - P(χ2n-1 < hH) = 1 - 0.025 = 0.975. Для количества степеней свободы k = 11, по таблице распределения χ2 находим: χ2(11;0.975) = 3.81575. Случайная ошибка дисперсии: (0.0197 - 0.00989; 0.0197 + 0.0568) Таким образом, интервал (0.00981;0.0765) покрывает параметр S2 с надежностью γ = 0.95 5) Проведите статистическое исследование на свободную тему. В контрольной работе укажите тему исследования, вопросы, по которым проводилось исследование, полученные выборочные данные, найдите все необходимые точечные оценки для представленной выборки, постройте эмпирическую функцию распределения, характеризующую Ваше исследование, сделайте вывод. Тема исследования: Анализ возрастной структуры работников автотранспортного цеха предприятия. Цель исследования: Изучить возрастную структуру работников, дать оценку. Исходные данные: Имеются данные по 50 водителям цеха:
Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Метод группировки основывается на следующих категориях – это группировочный признак, интервал группировки и число групп. Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Определение числа групп. Число групп приближенно определяется по формуле Стэрджесса n = 1 + 3,2log n n = 1 + 3,2log(50) = 6 Решение. Ширина интервала составит: Xmax - максимальное значение группировочного признака в совокупности. Xmin - минимальное значение группировочного признака. Рассчитанные данные сведем в таблицу:
Построим эмпирическую функцию распределения ряда: Для оценки ряда распределения найдем следующие показатели: Средняя взвешенная Средний возраст сотрудников составляет 37 лет. Мода. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности. где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота. Выбираем в качестве начала интервала 20, так как именно на этот интервал приходится наибольшее количество. Наиболее часто встречающееся значение ряда – 26 лет Медиана. Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше. В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 20 - 26.33, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот). Таким образом, 50% водителей младше 34 лет. Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего). Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия). Среднее квадратическое отклонение (средняя ошибка выборки). Каждое значение ряда отличается от среднего значения 36.84 в среднем на 11.49 Выводы: По результатам статистического исследования определили: средний возраст работников автотранспортного цеха составляет 37 лет, при этом 50% водителей младше 34 лет. Возраст самого младшего водителя составляет – 20 лет, самого старшего – 58 лет. Возрастная структура работников оптимальна. |