задание 1. Статистические методы сбора и обработки данных
![]()
|
Выполнить по одному упражнению из каждой темы. СТАТИСТИЧЕСКИЕ МЕТОДЫ СБОРА И ОБРАБОТКИ ДАННЫХ Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ Задача 2.1. На участке месторождения 1000 скважин. Определите минимальный объем случайной бесповторной выборки, которая позволит с вероятностью 0,95 (t=1,96) оценить среднесуточный дебит с предельной ошибкой выборки 1 т/сут. Дисперсия среднесуточного дебита по данным предварительного обследования 34. Решение: Необходимый объем выборки для случая бесповторного отбора равен: ![]() где σ2 – выборочная (или генеральная) дисперсия; n – объем выборочной совокупности; N – объем генеральной совокупности; t – коэффициент доверия, определяемый в зависимости от уровня вероятности; Δ – предельная ошибка выборки; Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА Задача 3.1. По данным о среднегодовой численности населения в странах мира в 2013 г. (млн. чел.): 1) постройте статистический ряд распределения; 2) изобразите результаты группировки в таблице, изобразите ряд распределения с помощью гистограммы и полигона, оцените характер распределения; 2) изобразите результаты группировки в таблице, изобразите ряд распределения с помощью гистограммы, полигона и кумуляты, оцените характер распределения; 3) вычислите характеристики вариационного ряда (размах, среднее значение, моду, медиану, дисперсию, среднее квадратическое отклонение (СКО), коэффициент, вариации, структурные характеристики вариационного ряда (децили и квартили), асимметрию (скос), эксцесс), перечисленные характеристики можно вычислить с помощью встроенных статистических функций в пакете MS Excel. Сформулируйте выводы.
Результаты построения статистического ряда распределения
Частота mi – это число наблюдений значения xi в выборке. Относительная частота (частость) wi– это отношение частоты mi к объему выборки n: ![]() ![]() При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x, называется накопленной частотой: для xi ![]() ![]() Результаты расчета описательных статистик распределения
Средняя взвешенная ![]() ![]() Для расчёта моды в интервальном вариационном ряду сначала определяют модальный интервал (интервал, которому соответствует наибольшая плотность распределения), а затем рассчитывают моду по формуле: ![]() где X0- начало (нижняя граница) модального интервала; h- величина интервала; ![]() ![]() ![]() ![]() Наиболее часто встречающееся значение ряда 14,61 Медиана (Ме) - варианта, находящаяся в середине ряда распределения. Для ее определения достаточно проранжировать все варианты, т.е. расположить их в порядке возрастания или убывания. Для интервального ряда расчет медианы производится по формуле: ![]() где ![]() ![]() ![]() ![]() ![]() Таким образом, 50% единиц совокупности будут меньше по величине 23. Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего). ![]() ![]() Среднее квадратическое отклонение является мерилом надёжности средней. ![]() Коэффициент вариации – отношение среднего квадратического отклонения к средней арифметической. Коэффициент вариации является наиболее распространённым показателем колеблемости, используемым для оценки типичности средних величин. ![]() Коэффициент вариации превышает 33%. Отсюда можно сделать вывод, что совокупность данных неоднородна. Размах вариации R характеризует, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака. ![]() Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3 ![]() ![]() Таким образом, 25% единиц совокупности будут меньше по величине 11,75 Q2 совпадает с медианой, Q2 = 23 ![]() Остальные 25% превосходят значение 34,25. Децили (децентили). Децили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 10% единиц совокупности будут меньше по величине D1; 80% будут заключены между D1 и D9; остальные 10% превосходят D9 ![]() Таким образом, 10% единиц совокупности будут меньше по величине 5 ![]() Остальные 10% превосходят 41. Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. ![]() ![]() Положительная величина указывает на наличие правосторонней асимметрии Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. ![]() Ex > 0 - островершинное распределение |