генеральная совокупность. Генеральная совокупность. Генеральная совокупность. Выборочный метод. Графическое и табличное представление данных Опорный конспект
Скачать 69.37 Kb.
|
Генеральная совокупность. Выборочный метод. Графическое и табличное представление данных Опорный конспект Генеральной совокупностью называется совокупность объектов произвольной природы, обладающих признаками, доступными для наблюдения и количественного измерения. Например, в случае социально-экономических исследований это может быть население какого-то города, региона или страны, а измеряемыми признаками – доходы, расходы или объем сбережений отдельно взятого человека. Если какой-то признак имеет качественный характер (например, пол, национальность, социальное положение, род деятельности и т.п.), но принадлежит к конечному множеству вариантов, он может быть также закодирован числом (как это часто делают в анкетах). Объекты, входящие в генеральную совокупность, называются ее элементами, а их общее число N – ее объемом. Однако, получение экспериментальных данных достаточно трудоемкий, дорогой процесс, а в некоторых случаях и просто невозможный. Поэтому из всей генеральной совокупности приходится выбирать только определенную часть объектов, которую называют выборочной совокупностью или выборкой объема n. Предположим, что над случайной величиной производится ряд независимых опытов (наблюдений). В каждом из этих опытов случайная величина принимает определенное значение: . Совокупность этих значении рассматривается как простая выборка. Наблюдаемое значение называют вариантой, а их последовательность, записанную в возрастающем порядке, – вариационным рядом. Для каждой варианты можно указать частоту ее появления, которую обозначают . Также может быть найдена относительная iчастота появления определенной варианты, как отношение частоты к объему выборки: . Сумма всех относительных частот должна быть равна единице. Не трудно заметить, что относительная частота имеет смысл статистической вероятности. Статистическим распределением или статистическим рядом называют соответствие вариант и их частот (табл. 1.1) или относительных частот (табл. 1.2). Таблица 1.1
Таблица 1.2
При большом числе наблюдении статистический ряд перестает быть удобной формой записи статистического материала – он становится громоздким и мало наглядным. Для придания ему большей компактности и наглядности строится так называемый интервальный статистический ряд. В этом случае весь диапазон наблюдаемых значений разделяется на интервалы и подсчитывается количество значений , приходящееся на каждый интервал (табл. 1.3). Таблица 1.3
Длину интервала – h – проще выбирать одинаковой. Практика показывает, что число интервалов рационально выбирать порядка 7-20. Для нахождения длины интервала можно воспользоваться формулой Стерджеса: (1.1) Если в результате вычисления по формуле (1.1) длина интервала получится дробным числом, то выбирают, либо близкое целое число, либо близкую простую дробью. Статистический ряд представляет собой первичную форму записи статистического материала и может быть обработан различными способами. Одним из способов такой обработки является построение эмпирической функции распределения случайной величины. Обозначим через число наблюдений, при которых значения вариант оказываются меньше, чем х. Эмпирической (статистической) функцией распределения называется функция , определяющая для каждого значения х относительную частоту события : . (1.2) Для того, чтобы найти значение эмпирической функции распределения при данном , достаточно подсчитать число опытов, в которых величина приняла значение меньше, чем ,и разделить на общее число произведенных опытов n. Графически статистический ряд можно представить в виде полигона частот или относительных частот. Полигоном частот или относительных частот называют ломаную линию, отрезки которой соединяют точки , соответственно . Полигоны обычно служат для изображения выборки в случае дискретных случайных величин (рис. 1.1): Рис. 1.1 Интервальный статистический ряд часто оформляется графически в виде гистограммы. Гистограммой называется ступенчатая фигура (рис.1.2), состоящая из прямоугольников, основаниями которых служат отрезки, равные длине интервала, а высотами являются относительные частоты, поделенные на длину интервала. Гистограмма обычно служат для изображения выборки в случае непрерывных случайных величин. Площадь гистограммы равна единице. Если на гистограмме соединить середины верхних сторон прямоугольников, то полученная ломаная образует полигон относительных частот. Рис.1.2 Вопросы для самоконтроля 1. Чем занимается математическая статистика? 2. В чем состоит основная задача математической статистики? 3. Что такое генеральная совокупность? 4. Что называется выборочной совокупностью (выборкой)? 5. Что называется объемом совокупности? 6. В чем польза использования выборок? 7. Почему прибегают к выборочному исследованию при контроле качества ампул для инъекций? 8. Результаты переписи населения, проводимой в стране, являются генеральной совокупностью или выборкой? 9. Какая выборка называется повторной (выборка с возвращением)? 10. Какая выборка называется бесповторной (выборка без возвращения)? 11. В чем состоит требование репрезентативности (представительности) выборки? 12. Что называют вариантами выборки? 13. Что называется частотой вариантывыборки? 14. Что называется относительной частотой вариантывыборки? 15. Что называют статистическим распределением выборки? 16. Какой вариационный ряд называется интервальным? 17. Как строится полигон для изображения дискретного вариационного ряда? 18. Как строится гистограмма для представления интервального вариационного ряда? 19.Как построить эмпирическую функцию распределения? 20. Как построить эмпирическую плотность распределения? Образцы решения типовых задач Пример_1.'>Пример 1. 3аписать в виде вариационного ряда выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4. Представить статистическое распределение выборки. Пример 2. Представить выборку в виде интервального статистического ряда: 38 60 41 51 33 42 45 21 53 60 68 52 47 46 49 49 14 57 54 59 77 47 28 48 58 32 42 58 61 30 61 35 47 72 41 45 44 55 30 40 67 65 39 48 43 60 54 42 59 50. Пример 3. Построить эмпирическую функцию распределения по результатам наблюдений, представленных в виде таблицы:
Пример 4.Построить полигон относительных частот для статистического ряда, используя условие примера 1.
Пример 5. Построить полигон относительных частот и гистограмму для интервального статистического ряда, используя условие примера 2. Пример6. Получены данные о числе цветных телевизоров, продаваемых ежегодно в магазине электроники в течение 26 дней: 16, 12, 15, 15, 23, 9, 15, 13, 14, 14, 21, 15, 14, 17, 27, 15, 16, 12, 16, 19, 14,16, 17, 13, 14, 14. Расположите данные в возрастающем порядке (т. е запишите ранжированные варианты). По ранжированным данным составьте дискретный вариационный ряд распределения частот. Составьте дискретный вариационный ряд относительных частот. Составьте интервальный вариационный ряд частот. Постройте полигон дискретного вариационного ряда частот. Постройте гистограмму интервального вариационного ряда частот. |