Расчетная_1. Теория вероятностей и математическая статистика Задание на расчетную работу 1 Основы статистики
![]()
|
Теория вероятностей и математическая статистика Задание на расчетную работу №1 «Основы статистики» 1.Группировка по отдельным значениям признака 1 2.Вычисление числовых характеристик выборки 2 3.Предварительная проверка на нормальность 4 4.Графическое представление выборочного распределения 4 5.Задание 6 6.Пример выполнения 6 Группировка по отдельным значениям признакаПусть ![]() ![]() ![]() называются вариантами. Ряд вариант, расположенных в порядке возрастания их значений называется вариационным рядом. Им пользуются, в основном, при малых ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Последовательность ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Варианты, попадающие на границу интервала, отнесены к левому интервалу (можно отнести их и к правому интервалу, а в том случае, если на границу попадает много вариант, можно их поделить пополам между соседними интервалами). Результат группировки представляют рядом вариант или интервалов вариант, расположенных в порядке их возрастания и рядом соответствующих частот. Под частотой ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Вычисление числовых характеристик выборкиПусть ![]() ![]() ![]() среднее арифметическое (выборочное среднее): ![]() выборочная дисперсия: ![]() стандартное (среднее квадратическое) отклонение является корнем из выборочной дисперсии: ![]() коэффициент вариации: ![]() выборочные начальные и центральные моменты порядка ![]() ![]() ![]() оценка коэффициента асимметрии ![]() ![]() ![]() оценка эксцесса ![]() ![]() выборочная мода ![]() Для дискретного вариационного ряда (дискретная группировка) мода определяется как значение варианты с наибольшей частотой, если выборка достаточно большая. При интервальной группировке выбирается интервал, которому соответствует наибольшая частота. Пусть это k-й интервал ![]() ![]() ![]() ![]() выборочная медиана ![]() Определяется, как значение признака, относительно которого выборка делится на две равные по объему части. Если выборка объема ![]() ![]() При интервальной группировке (интервальный вариационный ряд) сначала находят так называемый медианный интервал ![]() ![]() ![]() где ![]() ![]() Медиану оценивают с помощью следующей интерполяционной формулы: ![]() Предварительная проверка на нормальностьС помощью вычисленных числовых характеристик можно определить, является ли выборочное распределение близким к нормальному закону. Если выборочное распределение близко к нормальному закону (или является таковым), то: 1) в интервалы ![]() ![]() ![]() 2) Оценка эксцесса ![]() ![]() 3) ![]() Графическое представление выборочного распределенияНаиболее распространенными способами графического представления эмпирических данных (выборки) являются гистограмма, полигон частот и эмпирическая функция распределения (накопленные относительные частоты). Пусть ![]() ![]() ![]() ![]() ![]() ![]() ![]() округлив до целого числа. Обычно предполагают, что количество интервалов должно удовлетворять условию ![]() Ширина каждого интервала ![]() ![]() абсолютные частоты ![]() ![]() ![]() ![]() относительные частоты ![]() относительные накопленные частоты ![]() середины интервалов ![]() Все полученные результаты сводятся в таблицу.
При этом ![]() Гистограмма строится следующим образом. На оси абсцисс откладываются интервалы, и на каждом из них строится прямоугольник, площадь которого равна относительной частоте, соответствующей этому интервалу, т.е. высота прямоугольника (ордината) равна ![]() ![]() ![]() ![]() ![]() Полигон частот - ломаная линия, которая получается, если из середины каждого интервала ![]() ![]() ![]() при дискретной группировке. ЗаданиеВыполнить группировку исходных данных своего варианта по значению признака. Вычислить основные числовые характеристики: Выборочное среднее. Выборочную дисперсию. Стандартное отклонение. Коэффициент вариации. Оценка коэффициента асимметрии. Оценка эксцесса. Выборочная мода. Выборочная медиана. Выполнить предварительную проверку на нормальность. Построить гистограмму и полигон частот. Пример выполненияДля выполнения задания будем использовать выборку объемом 15 элементов: ![]() Выполним группировку исходных данных по значению признака. Для этого упорядочим выборку по возрастанию, и, используя формулы =МИН() и =МАКС() найдем минимальное и максимальное значения выборки: ![]() Далее посчитаем частоты, для этого разобьем выборку на пять интервалов одинаковой длины. Для того, чтобы узнать шаг ![]() ![]() ![]() Для подсчета частот построим таблицу: ![]() В этой таблице в шапке указаны границы интервалов, от минимального до максимального значений выборки с шагом ![]() ![]() Для удобства, значения, попавшие в одинаковый интервал, выделены одним цветом. Найдем относительные частоты: ![]() Выполним контроль: сумма частот должна быть равна объему выборки, а сумма относительных частот единице: ![]() Используя формулы, вычислим выборочное среднее: ![]() В диапазоне ячеек B1:P1 находится выборка. Выборочную дисперсию: ![]() Ячейка D8 – это значение выборочного среднего. Среднее квадратическое отклонение: ![]() D9 – ссылка на ячейку, в которой находится значение дисперсии. Далее вычислим коэффициент вариации, разделив среднее квадратическое отклонение на выборочное среднее: ![]() Для расчета значений коэффициентов асимметрии и эксцесса нам потребуются значения центральных моментов второго, третьего и четвертого порядков. Для этого для каждого элемента выборки найдем его разность с выборочным средним: ![]() В ячейке D8 находится выборочное среднее. Затем возведем каждую разность во вторую, в третью и в четвертую степени: ![]() Найдем сумму значений в каждой строке и разделим на объем выборки: ![]() Полученные значения и есть центральные моменты второго, третьего и четвертого порядка: ![]() ![]() Вычислим асимметрию: ![]() Здесь в ячейке Q20 – значение центрального момента третьего порядка, а в ячейке Q19 – значение центрального момента второго порядка. Для оценки эксцесса наберем формулу: ![]() В ячейке Q21 значение центрального момента четвертого порядка. Далее вычислим моду и медиану. Для расчета моды потребуется интервал с максимальной частотой. В нашем случае ![]() ![]() ![]() ![]() ![]() ![]() Наконец, для расчета медианы определим интервал, удовлетворяющий условиям: ![]() то есть, нужно найти такой интервал, в котором сумма частот превышает половину объема выборки. В нашем случае номер такого интервала ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Окончательно получим значения основных числовых характеристик: ![]() Выполним предварительную проверку на нормальность. 1. Рассчитаем границы интервалов ![]() ![]() ![]() ![]() В ячейке D8 находится значение выборочного среднего, в ячейке D10 значение среднего квадратического отклонения. Посчитаем, сколько значений выборки попадает в образованные интервалы: ![]() В последнем столбце указаны процентные соотношения полученных значений от объема выборки. Полученные значения позволяют говорить о том, что по первому критерию выборка является нормальной. 2. Оценка эксцесса ![]() ![]() ![]() ![]() 3. ![]() ![]() Учитывая все три критерия, можно говорить о том, что выборка является нормальной. Наконец, используя средства построения графиков Excel, построим гистограмму и полигон частот:
|