Главная страница
Навигация по странице:

  • Задачи для самостоятельного решения

  • ыавпвы выапывапы фввывапывпап. Генеральная совокупность, выборка и выборочные аналоги законов распределения и числовых характеристик случайной величины. Определение 1


    Скачать 108.37 Kb.
    НазваниеГенеральная совокупность, выборка и выборочные аналоги законов распределения и числовых характеристик случайной величины. Определение 1
    Анкорыавпвы выапывапы фввывапывпап
    Дата17.01.2022
    Размер108.37 Kb.
    Формат файлаdocx
    Имя файла1eaf9e474c343691b83466b9e341423a9f328e18f95d95e9ee357cec28c.docx
    ТипЗакон
    #333945

    Генеральная совокупность, выборка и выборочные аналоги законов распределения и числовых характеристик случайной величины.
    Определение 7.1. Совокупность, объединяющая все множество возможных объектов, обладающих определенными свойствами, или множество значений результатов наблюдений проводимых в одинаковых условиях над случайной величиной, называется генеральной совокупностью. Эта совокупность может быть конечной или бесконечной.

    Определение 7.2. Выделенная по определенным правилам часть объектов или результатов наблюдений из генеральной совокупности называется выборочной совокупностью или выборкой. Эта совокупность может быть только конечной.

    Число объектовN в генеральной или n в выборочной совокупности (Nn) называется объемом совокупности.

    Применяя методы математической статистики к выборочной совокупности получают выборочные оценки характеристик генеральной совокупности.

    Репрезентативность выборки обеспечивается случайным отбором элементов в выборочную совокупность и тем, что выборка должна содержательно отражать структуру генеральной совокупности.

    Если генеральная совокупность представляет собой совокупность объектов, исследуемые характеристики которых выражаются количественным признаком, тогда наблюдаемый количественный признак генеральной совокупности можно интерпретировать как случайную величину X, принимающую в процессе наблюдения (испытания) случайные значения.

    Расположение выборочных наблюденных значений случайной вели­чины в порядке возрастания называется ранжированием.

    Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантой, а изменение этого значения  варьированием.

    Численность отдельной группы сгруппированного ряда наблюдаемых данных называется частотой или весом варианты. Если i индекс ва­рианты, то  число измеренных значений iварианты.

    Отношение к общей сумме частот всех вариант называется

    относительной частотой варианты и обозначаетсяwi = .

    Определение 7.3. Дискретным вариационным рядомраспределения (распределением частот) называется ранжированная совокупность вариант с соответствующими им частотами или относительными частотами.


    i

    1

    2



    k

    xi

    x1

    x2



    xk

    mi

    m1

    m2



    mk

    pi* = wi

    m1/n

    m2/n



    mk/n

    Определение 7.9. Размахом выборки называется разность между наибольшей и наименьшей вариантой:

    Rв = Xmax- Xmin.

    Если наблюдаемая случайная величина непрерывная или дискретная величина такова, что число ее возможных значений велико, то для построения вариационного ряда используют интервальный ряд распреде­ления. В этом случае весь возможный интервал варьирования разбивают нa конечное число частичных интервалов и подсчитывают частоту по­падания значений величины в каждый частичный интервал.

    Определение 7.4. Интервальным вариационным рядом (интервальным распределением частот)называется упорядоченная последовательность интервалов варьирования случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений случайной величины.

    Существует формула Стерджесса, которая позволяет определить число интервалов

    k = 1 + 3,322·lgN = log2N + 1 ,

    где k - число интервалов, N – число измерений.

    Длину интервала определяют по формуле h = ( xmax – xmin )/k ,

    где xmax, xmin - соответственно, максимальное и минимальное значения измерений непрерывной случайной величины Х. Интервалы составляются с учетом, что левая граница закрытая, а правая открытая, т.е. [xi…xi+1). Частотой интервала считается количество вариант mi находящихся внутри i-го интервала.

    Пример 7.1. В супермаркете проводились наблюдения над числом Xпокупателей, обратившихся в кассу за один час. Наблюдения в течение 30 часов (15 дней в период с 9 до 10 и с 10 до 11 часов) дали следующие результаты:

    70, 75, 100, 120, 75, 60, 100, 120, 70, 60, 65, 100, 65, 100, 70, 75, 60, 100, 100, 120, 70, 75, 70, 120, 65, 70, 75, 70, 100, 100.

    Число Xявляется дискретной случайной величиной, а полученные данные представляют собой выборку из n= 30 наблюдений. Требуется составить ряд распределения частот (вариационный ряд).

    Р е ш е н и е. Вначале составим ранжированный ряд:

    60, 60, 60, 65, 65, 65, 70, 70, 70, 70, 70, 70, 70, 75, 75, 75, 75, 75, 100, 100, 100, 100, 100, 100, 100, 100, 120, 120, 120, 120.

    Получено шесть групп, т.е. шесть различных значений случайной величины (шесть вариант). Для каждой группы подсчитаем частоту значений варианты и соответствующую относительную частоту. Все результаты приведены в табл.7.1, которая и будет представлять вариационный ряд.

    Т а б л и ц а 7.1


    Номер группы

    i

    1

    2

    3

    4

    5

    6

    Число обращений покупателей в кассу



    60

    65

    70

    75

    100

    120

    Частота



    3

    3

    7

    5

    8

    4

    Относительная частота



    3/30

    3/30

    7/30

    5/30

    8/30

    4/30


    Определение 7.5. Ломаная линия, соединяющая точки с координатами (xi,ni) или (xi,wi) называется полигоном частот (относительных частот).

    В качестве примера рассмотрим выборку примера 7.1.

    Статистическое распределение выборки представлено в табл. 7.1, а на рис. 7.1 изображен полигон относительных частот рассматриваемой выборки.



    Рис. 7.1. Полигон относительных частот.
    Пример 7.2. Для определения сроков гарантийного обслуживания проведено исследование величины среднего пробега автомобилей, находящихся в эксплуатации в течение двух лет с момента продажи автомобиля магазином. Получен следующий результат (тыс. км):

    13,0; 25,0; 18,6; 12,1; 10,6; 18,0; 17,3; 29,1; 20,0: 18,3; 21,5; 26,7; 12,2; 14,4; 17,3; 19,1; 12,9; 15,4; 30,1; 16,8; 11,2: 19,9; 25,3; 14,2; 29,6.

    Составить интервальный вариационный ряд.

    Р е ш е н и е. В нашем примере N = 25, тогда число интервалов

    k = 1 + 3,322·1,398 ≈ 5,6.

    Принимаем k = 6. Далее определяем длину интервала

    h = (30,1 – 10,6)/6 = 3,25.

    Для удобства проведения вычислений выбираем шаг h = 3, и округляя минимальное и максимальное значение до целых значение получим интервальный ряд распределения. При этом у нас произошло увеличение числа интервалов до 7 – это допустимо. В математической статистике считается допустимым число интервалов от 5 до 12. Произведя подсчет измерений , которые попадают в полученные интервалы составим интервальный ряд ( см таблицу 7.2.)

    Таблица 7.2. Интервальное распределение выборки.

    i

    1

    2

    3

    4

    5

    6

    7

    xi- xi+1

    10-13

    13-16

    16-19

    19-22

    22-25

    25-28

    28-31

    mi

    5

    4

    6

    4

    0

    3

    3

    Wi=mi/N

    5/25

    4/25

    6/25

    4/25

    0

    3/25

    3/25


    Графически интервальный вариационный ряд представляют в виде гистограммы.

    Определение 7.4. Гистограммой частот или относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются интервалы [xi, xi+1) с шириной , а высоты равны отношению интервальных частот или относительных частот к ширине интервалов: mi/h или wi/h .

    Гистограмма относительных частот для этой выборки показана на рис. 7.2.



    Рис. 7.2. Гистограмма относительных частот

    Гистограмма относительных частот является аналогом функции плотности распределения в теории вероятностей. Суммарная площадь прямоугольников такой гистограммы равна единице. Если в результате выборочного наблюдения за генеральной совокупностью мы получим симметричную гистограмму, то это даст нам право сделать предположение о нормальном распределении генеральной совокупности. В данном примере, очевидно, что это распределение не является нормальным.

    Аналогично введенной ранее функции распределения F(x) в математической статистике вводится понятие эмпирической функции распределения, которую принято обозначать F*(x). Обозначим через число вариант, значения которых меньше, чем x.

    Определение 7.5. Эмпирической функцией распределения F*(x) ( или выборочной функцией распределения) называют функцию, определяющую для каждого значения х относительную частоту события .



     число выборочных значений величины X, меньших х, а п – объёмвыборки. Составим функцию распределения для выборки (табл.7.1):


    График F*(x) приведен на рис. 7.3.



    Рис.7.3. График выборочной функции распределения дискретной случайной величины.

    По данным интервального ряда табл. 7.2 можно построить выборочную функцию распределения непрерывной случайной величины.



    График функции распределения для интервального ряда, приведенного в табл. 7.2 представлен на рис 7.4.


    Рис.7.4. График выборочной функции распределения непрерывной случайной величины.

    В математической статистике показано, что с ростом объема выборки выборочная функция распределения теряет свойства случайности, и она приближается к теоретической функции распределения. Эмпирическая функция распределения является оценкой функции распределения генеральной совокупности.

    Задачи для самостоятельного решения


    1. Построить гистограмму частот и относительных частот по данному распределению выборки




    i



    ni

    1

    61-63

    3

    2

    63-65

    12

    3

    65-68

    15

    4

    68-70

    10

    1. Построить эмпирическую функцию распределения по данным вариационного ряда

      xi

      2

      6

      8

      13

      18

      mi

      5

      10

      15

      17

      3

    2. Зафиксированы 10 моментов прибытия вертолета на горную метеостанцию:

    12.2, 12.5, 13, 12.7, 12.1, 12.4, 12.6, 12.3, 12, 12.8.

    Сгруппируйте выборку по трем интервалам, найдите ее размах, гистограмму относительных частот, эмпирическую функцию распределения и ее график.


    1. Ежедневно в течение 20 дней фиксировалось число договоров страхования, заключенных страховым агентом с клиентами:

    2, 1, 4, 3, 6, 1, 4, 1, 2, 3, 4, 5, 4, 2, 5, 3, 7, 2, 3, 4

    Постройте вариационный ряд, статистическое распределение частот, полигон частот, эмпирическую функцию распределения и ее график.

    5. Дано статистическое распределение частот срока службы одинаковых деталей

    Срок службы (в годах)

    частота

    0-1

    63

    1-2

    23

    2-3

    9

    3-4

    5


    Найдите: гистограмму относительных частот, эмпирическую функцию распределения и ее график.


    Староста группы, пришлите, пожалуйста, мне на почту Savina.OI@rea.ru список студентов, присутствующих на занятии.



    написать администратору сайта