Главная страница
Навигация по странице:

  • Контрольные вопросы

  • Лабораторная работа №2 «Элементарные задачи математической статистики»

  • Краткие теоретические сведения

  • Порядок выполнения работы

  • Лабораторная работа №3 «Числовые характеристики дискретных случайных величин»

  • Задание

  • Лабораторная работа №1 «Моделирование случайных чисел с заданным законом распределения». Лабораторная работа 1 Моделирование случайных чисел с заданным законом распределения


    Скачать 3.56 Mb.
    НазваниеЛабораторная работа 1 Моделирование случайных чисел с заданным законом распределения
    АнкорЛабораторная работа №1 «Моделирование случайных чисел с заданным законом распределения
    Дата11.09.2022
    Размер3.56 Mb.
    Формат файлаpdf
    Имя файлаMU_Matematicheskaya_stastistika_LZNo_1-5_3sem_1-8_4_sem.pdf
    ТипЛабораторная работа
    #670992
    страница2 из 8
    1   2   3   4   5   6   7   8
    Практическая часть
    1.
    Смоделируйте базовую последовательность объемом
    N=1000 мультипликативным конгруэнтным методом.
    2.
    Напишите одну комплексную программу моделирования выборки случайных чисел, оценки математического ожидания и дисперсии для всех ниже перечисленных распределений: a) равномерное на интервале (a, b); b) экспоненциальное с параметром  ; c) нормальное с параметрами  и  , используя метод суммирования или какой-либо один из эвристических методов.
    3.
    Самостоятельно задав параметры распределений, промоделируйте выборки всех вышеуказанных распределений.
    Объем каждой выборки принять N=1000.
    4.
    Вычислите оценки математического ожидания и дисперсии каждой из полученных в п. 2 последовательностей случайных чисел для следующих объемов выборки
    1
    N
    =10,
    2
    N
    =20,
    3
    N
    =50,
    4
    N
    =100 и
    5
    N
    =1000. Сравните полученные оценки с заданными в пп. 2 параметрами. Постройте графики зависимостей оценок от объема выборки. Оцените относительные погрешности для какой-либо одной выборки.
    5.
    Для всех выборок разных распределений, рассчитайте и постройте:
     диаграммы накопленных частот;
     гистограммы распределений.
    6.
    Сравните гистограммы с графиками теоретических распределений. Для сравнения постройте также вышеуказанные гистограммы на одном графике с функциями распределений.
    Варианты лабораторной работы. Параметры распределений
    № вар a b



    1 3
    11 1
    0 1
    2 10 16 5
    0 2
    3 1
    6 1
    0 3
    4 4
    7 2
    0 4
    5 9
    17 4
    0 5
    6 1
    11 1
    0 6
    7 8
    13 4
    1 1

    19 8
    3 9
    1 1
    2 9
    2 7
    1 1
    3 10 9
    14 5
    1 4
    11 6
    11 3
    1 5
    12 3
    7 2
    1 6
    13 7
    12 3
    2 1
    14 5
    12 3
    2 2
    15 7
    13 4
    2 3
    16 3
    12 1
    2 4
    17 2
    12 2
    2 5
    18 4
    13 2
    10 6
    19 4
    8 5
    10 1
    20 10 14 4
    10 2
    21 9
    16 1
    10 3
    22 0
    7 3
    10 4
    23 6
    6 5
    10 5
    24 10 11 3
    10 6
    25 6
    11 4
    5 1
    26 9
    18 2
    5 2
    27 4
    7 1
    5 3
    28 2
    6 2
    5 4
    29 4
    8 5
    5 5
    30 9
    13 4
    5 6
    Пример построения гистограммы и диаграммы накопленных частот в среде MathCad 5.0 для базовой последовательности R.
    Оценки математического ожидания и дисперсии приведены ниже на рисунках.

    20
    Рисунок 1.5 – Количество квантов, на которые разбивается ось OX

    21
    Рисунок 1.6 – Теоретическая функция распределения

    22
    Рисунок 1.7 – Вычисление массива значений для диаграммы накопленных частот

    23
    Рисунок 1.8 – Оценка математического ожидания в зависимости о объема выборки
    Контрольные вопросы
    1.
    Что такое распределение случайной дискретной величины?
    2.
    Что такое дискретная случайная величина? Дайте развернутый ответ.
    3.
    Каков алгоритм получения случайных величин на ЭВМ?
    4.
    Раскройте понятие «методы генерации псевдослучайных чисел с заданным законом распределения».
    5.
    Что такое метод инверсии?
    6.
    Что значит «моделирование случайной величины равномерной на (a, b)»?
    7.
    Что значит «моделирование экспоненциальной случайной величины»?
    8.
    Что значит «моделирование нормальной случайной величины на основе центральной предельной теоремы»?

    24 9.
    Что такое оценка статистических характеристик случайных величин?
    10. Что такое элементарные статистические процедуры?

    25
    Лабораторная работа №2
    «Элементарные задачи математической статистики»
    Цель работы: Рассмотреть возможности MathCAD для решения элементарных задач математической статистики. Научиться использовать возможности MathCAD для ввода и вывода файловых данных. Познакомиться с расчетом основных выборочных характеристик в среде MathCAD. Научиться представлять графически выборку случайных величин в виде гистограмм и полигонов.
    Краткие теоретические сведения
    В большинстве статистических расчетов приходится иметь дело либо со случайными данными, полученными в ходе какого- либо эксперимента (которые выводятся из файла или печатаются непосредственно в документе), либо с результатами генерации случайных чисел.
    Случайной выборкой называется случайный вектор, элементы которого независимы и одинаково распределены. Обычно под
    выборкой подразумевают результаты независимых измерений, которые проводятся в одинаковых условиях.
    Ввод и вывод файлов данных
    Важный компонент ввода-вывода — это ввод-вывод во внешние файлы. Ввод внешних данных в документы Mathcad применяется чаще вывода, поскольку Mathcad имеет гораздо лучшие возможности представления результатов расчетов, чем многие пользовательские программы. Для общения с внешними файлами данных в Mathcad имеется несколько разных способов.
    Самый простой из них — использовать имеющееся семейство встроенных функций.

    READPRN (“file”) - чтение данных в матрицу из текстового файла;

    WRITEPRN (“file”) - запись данных в текстовый файл;

    APPENDPRN (“file”) - дозапись данных в существующий текстовый файл;
     file — путь к файлу.

    26
    Встроенная функция APPENDPRN может применяться и для создания нового файла. Иными словами, если файла с заданным именем не существовало, то он, после применения, будет создан и наполнен теми данными, которые Вами определены в документе.
    Для удобства можно использовать функцию CWD - указания полигона, где необходимо создать файл или где находиться считываемый файл.
    Можно задавать как полный путь к файлу, например, С:\Мои документы, так и относительный, имея в виду, что он будет отсчитываться от папки, в которой находится файл с документом
    Mathcad. В качестве имени файла можно использовать русские буквы.
    Пример 1: Запись данных в файл "da.ta.txt" x:=rpost(N, a,

    ) создание выборки случайных величин распределенных по нормальном закону;
    CWD:= "D:\tmp\" устанавливается текущий рабочий каталог.
    WRITEPRN(data.txt") :=x запись в файл «data»созданной ранее выборки x.
    Моделирование выборок из стандартных распределений
    Mathcad обладает богатой библиотекой встроенных функций, предназначенных для генерации выборок из генеральных совокупностей с наиболее распространенными стандартными распределениями.
    Вставку рассмотренных ранее статистических функций в программы удобно осуществлять с помощью диалогового окна Insert
    Function (Вставка функции).
    Для этого необходимо выполнить следующие действия:
    1.
    Установить курсор на место вставки функции в документе.
    2.
    Вызвать диалоговое окно Insert Function нажатием кнопки f(x) на стандартной панели инструментов или командой меню
    Insert/Function
    (Вставка/Функция), или нажатием клавиш
    +.
    3.
    Выбрать в списке Function Category (Категория функции) выберите одну из категорий статистических функций. Категория
    Probability Density (Плотность вероятности) содержит встроенные функции для плотности вероятности, Категория Probability

    27
    Distribution (Функция распределения) — для вставки функций или квантилей распределения, Категория Random Numbers (Случайные числа) — для вставки функции генерации случайных чисел.
    4.
    Выбрать в списке Function Name (Имя функции) функцию, соответствующую требующемуся закону распределения. При выборе элемента списка в текстовом поле в нижней части окна будет появляться информация о назначении выбранной функции и ее параметрах.
    5.
    Вставить выбранную функцию в документ нажатием кнопки "Ок".
    Функции Mathcad для расчета численных характеристик
    В Mathcad имеется ряд встроенных функций для расчетов числовых статистических характеристик рядов случайных данных.
     mean(x) — выборочное среднее значение, оценка математического ожидания выборки;
     median (x) — выборочная медиана (median) — значение аргумента, которое делит гистограмму плотности вероятностей на две равные части;
     var(x) — выборочная дисперсия выборки (variance);
     stdev(x) — среднеквадратичное (или "стандартное") отклонение выборки (standard deviation);
     max(x), min(x) — максимальное и минимальное значения выборки;
     mode(x) — наиболее часто встречающееся значение выборки.
    Построение гистограмм
    Гистограммой называется график, аппроксимирующий по случайным данным плотность их распределения. При построении гистограммы область значений случайной величины (a, b) разбивается на некоторое количество bin сегментов, а затем подсчитывается процент попадания данных в каждый сегмент. Для построения гистограмм в Mathcad имеется несколько встроенных функций.
    Гистограмма с произвольными сегментами разбиения

    28
     hist,(intvls,x) - вектор частоты попадания данных в интервалы гистограммы;
     intvls - вектор, элементы которого задают сегменты построения гистограммы в порядке возрастания a < i
    vis int
     х - вектор случайных данных.
    Если вектор intvls имеет bin элементов, то и результат hist имеет столько же элементов.
    1.
    Для построения гистограмм созданную случайную величину предварительно необходимо упорядочить. Для этого в
    Mathcad имеется встроенная функция.
    sort(x) - сортировка выборки в порядке возрастания;
    Для того, чтобы построить гистограмму, нужно сначала сгруппировать выборочные данные, записанные в массиве х, и сохранить граничные очки интервалов группировки в векторе intvls,
    размерность которого равна числу интервалов.
    2.
    Сформировать вектор intvls границ интервалов.
    3.
    Определить процент попадания данных в каждый сегмент.
    4.
    Построить гистограмму.
    Пример 2. Построение гистограммы
    N:=1000 x:=binom (N,

    , 0,5) bin:=30; кол-во равных сегментов, на кот. разбивается весь диапазон
    ; определение границы интервала построения гистограммы lower:=floor (min(x)): наибольшее целое число
    )
    x min(

    upper:=ceil (max(x)); наименьшее целое число
    )
    x max(

    bin lower upper
    :
    h


    ; размер сегмента j:=0…bin; счетчик сегментов j
    h lower
    :
    int j



    )
    x
    (int,
    hist h
    N
    1
    :
    f



    ; массив начальных точек каждого сегмента

    29 int:=int+0.5h; от левой границы каждого сегмента к его центру; нормирование гистограммы для удобства отображения на одном графике вместе с плотностью распределения
    В векторе int можно задать произвольные границы сегментов разбиения так, чтобы они имели разную ширину.
    Недостаток упрощенной формы функции hist состоит в том, что необходимо дополнительно определять вектор сегментов построения гистограммы. От этого недостатка свободна функция
    histogram.
    Гистограмма с разбиением на равные сегменты
    histogram (bin, х) — матрица гистограммы размера bin*2, состоящая из столбца сегментов разбиения и столбца частоты попадания в них данных;
     bin — количество сегментов построения гистограммы;
     х — вектор случайных данных.
    Пример 3. Построение гистограммы (упрощенный вариант)
    N:=100; созданы выборки сл. величины х:= exp (N, 1) bin:=30; кол-во равных сегментов, на кот. разбивается весь диапазон f := histogram(bin, х)
    Аргументы у обоих процедур hist() и histogram() одинаковы: первый определяет интервалы для создания гистограммы, а второй - это выборка, на основе которой строится гистограмма. Первый аргумент может быть либо вектором конечных точек интервалов для группировки данных выборки, либо целым числом, задающим число интервалов. В последнем случаи весь диапазон значений в выборке разбивается на равные интервалы.
    Создание графика гистограммы
    Для того чтобы создать график в виде гистограммы необходимо:

    30 1.
    Построить двумерный график, по оси x откладываются границы интегралов, по оси у частота(процент) попадания значения сл. величины в заданные интервалы.
    2.
    Перейти в диалоговом окне Formatting Currently Selected
    Graph (Форматирование) выбранного графика (например, двойным щелчком мыши) в раздел Traces (Графики). Установить в поле Туре
    (Тип) элемент списка bar (столбцы) или solidbar (гистограмма). Тип solidbar специально предназначен для гистограмм.
    3.
    Нажать кнопку ОК.
    Процедура histogram() инициализирует объект (матрицу), содержащий срединные точки интервалов гистограммы (первый столбец) и столбец частот, попадания в заданные интервалы.
    Для построения таких графиков по оси x откладывается столбец срединные точки интервалов (столбец матрицы с нулевым индексом), а по оси у - столбец с частотами распределения данных по интервалам гистограммы (столбец с первым индексом). Индекс столбца вводится с помощью соответствующей пиктограммы п панели Matrix или комбинации клавиш +<6>.
    Полигон частот
    Иная форма графического представления группированных данных - полигон частот. Полигон частот - это ломанная линия, соединяющая точки с координатами (
    i i
    h
    ,
    x
    ), т.е. с абсциссами, равными серединам интервалов группировки, и ординатами, равными соответствующим частотам. Если соединить центры элементарных сегментов гистограммы ломанной линией, то получится график полигона.
    Задание 1. Создайте выборку из 100 случайных величин с нормальным распределением, среднее значение m=0,1*k (k - номер варианта) и стандартное отклонение  =0,5. Запишите данную выборку в файл с произвольным именем. Рассчитайте с помощью встроенных функций
    MathCad числовые статистические характеристики созданной выборки. Постройте гистограмму двумя способами и полигон частот

    31
    Порядок выполнения работы:
    1.
    С помощью встроенной функции из категории Random
    Numbers (Случайные числа) получить заданную выборку.
    2.
    Записать полученную величину в файл с произвольным названием. В отчет вставьте фрагмент этого документа.
    3.
    Упорядочить значения в выборке случайной величины по возрастанию.
    4.
    C помощью стандартных функций Mathcad, получить числовые характеристики: min и max значения выборки, выборочное среднее, выборочную дисперсию, среднеквадратическое отклонение, выборочную медиану.
    5.
    Используя функцию дозаписи, добавить в созданный ранее файл числовые характеристики выборки. Фрагмент вновь созданного файла привести в отчете.
    6.
    Считать полученный файл.
    7.
    Выполните расчет гистограммы с помощью функцию hist
    (int, x) Отобразить на графиках гистограмму и плотность распределения на одном и полигон частот на другом.
    8.
    Выполните расчет гистограммы, используя функцию histogram (int, x).
    9.
    Выведите на экран результаты процедур hist() и histogram(). Сравните их.
    10. Понаблюдайте, как изменится внешний вид гистограммы, если изменить количество интервалов разбиения выборки. Сделать выводы.
    В отчете представить все необходимые фрагменты, сделанные в Mathcad, и требуемые выводы.
    Контрольные вопросы
    1.
    Что такое случайная выборка?
    2.
    Что такое выборка?
    3.
    Как происходит ввод и вывод данных в MathCad?
    4.
    Как в MathCad произвести моделирование выборок из стандартных распределений?
    5.
    Что такое функция MathCad для расчета численных характеристик?
    6.
    Как в MathCad построить гистограммы?

    32 7.
    Что такое гистограмма с произвольным сегментом разбиения?
    8.
    Что такое гистограмма с разбиением на равные сегменты?
    9.
    Приведите алгоритм создания графика гистограммы.
    10. Что такое полигон частот?

    33
    Лабораторная работа №3
    «Числовые характеристики дискретных случайных величин»
    Цель: изучить способы вычисления числовых характеристик случайных величин с использованием пакета MathCad.
    Задание: решить представленную задачу.
    Краткие теоретические сведения
    Математическое ожидание
    Математическим
    ожиданием
    дискретной
    случайной величины называется сумма произведений всех ее возможных значений на вероятности этих значений.
    Если случайная величина принимает значения с разной вероятностью, математическое ожидание вычисляется по формуле




    n
    0
    i i
    i p
    x
    )
    X
    (
    M
    Пример 1. Найти математическое ожидание дискретной случайной величины, закон распределения которой задан таблицей:
    X
    1 2
    3 4
    5
    P
    0,15 0,25 0,3 0,2 0,1
    Зададим векторы
    T
    T
    0.1)
    0.2 0.3 0.25
    (0.15
    :
    p
    5)
    4 3
    2 1
    (
    :
    x


    Найдем математическое ожидание
    85 2
    M
    p x
    :
    M
    )
    x
    (
    last
    0
    i i
    i





    Если случайная величина принимает ряд значений с равной вероятностью, то математическое ожидание определяется как

    34 среднее арифметическое значение некоторого количественного признака выборки.
    В MathCad среднее значение выборки можно подсчитать с помощью функции mean(x).
    Пример 2. При измерении величины силы тока были получены следующие значения: 0,45; 0,49; 0,44; 0,42; 0,48; 0,41; 0,44; 0,56; 0,47;
    0,45; 0,52; 0,43. Вычислить выборочное среднее
    0.463
    mean(X)
    0.43)
    0.52 0.45 0.47 0.56 0.41 0.48 0.42 0.44 0.49 45 0
    (
    :
    X


    При обработке экспериментальных данных среднее значение выборки считается равным значению параметра. Это утверждение верно только в том случае, если выборка является генеральной, т.е. содержит все возможные значения измеряемой величины. В реальной ситуации с генеральными совокупностями работать невозможно, а всегда приходится делать из них некоторые небольшие выборки. В зависимости от условий отбора и объема выборки она может передавать особенности генеральной совокупности с различной точностью. При этом такие характеристики, как среднее значение и дисперсия, приобретают случайный характер. Исследование особенностей поведения такого рода величин – очень сложная и важная статистическая задача.
    Дисперсия и среднеквадратичное отклонение
    В статистике дисперсией называется среднее арифметическое квадратов отклонений случайной величины от ее среднего значения:
    N
    )
    x x
    (
    D
    N
    1
    i
    2
    i




    В общем случае дисперсия является характеристикой степени рассеяния значений выборки по сравнению с ее средней величиной.
    В MathCad простая выборочная дисперсия вычисляется с помощью функции var(x). Кроме того, существует и функция Var(x), которая определяет исправленную дисперсию, котрая на практике

    35 используется для несмещенной оценки генеральной дисперсии при малом объеме выборки:
    1
    N
    )
    x x
    (
    s
    N
    1
    i
    2
    i
    2





    На практике используют не саму дисперсию, а квадратный корень из нее, который называется среднеквадратичным отклонением. В MathCad существуют две функции для вычисления этого параметра: stdev(x) – выборочное стандартное отклонение и
    Stdev(x) – исправленное среднеквадратичное отклонение.
    Пример 3. Подбрасывается игральный кубик. Случайная величина Х – количество выпавших очков. Найти дисперсию и среднеквадратичное отклонение случайной величины Х.
    1.708
    stdev(X)
    917 2
    )
    X
    var(
    6)
    5 4
    3 2
    1
    (
    :
    X
    T



    Аналогичные результаты получаются и при использовании формул:
    1.708.
    917 2
    D
    ,
    ))
    X
    (
    mean
    X
    (
    )
    X
    (
    length
    1
    :
    ))
    X
    (
    mean
    X
    (
    )
    X
    (
    length
    1
    :
    D
    )
    X
    (
    last
    0
    i
    2
    i
    )
    X
    (
    last
    0
    i
    2
    i













    Мода и медиана
    Модой в статистике называют варианту, которая встречается в выборке наиболее часто. В MathCad подсчитать моду выборки можно с помощью встроенной функции mode(x). В случае, если все варианты встречаются в выборке с одинаковой частотой, система выдаст сообщение: No value occurs more then any others (ни одна величина не встречается чаще, чем все остальные).

    36
    Медианой называется варианта, которая делит вариационный ряд (рассортированную выборку) на две части, равные по количеству вариант. То есть если количество элементов выборки нечетное и равно2k+1, то медианой будет являться (k+1)-й элемент.
    В случае четного количества вариант медиана определяется как среднее арифметическое между k-м и (k+1) элементами выборки. В
    MathCad медиана вычисляется с помощью встроенной функции median(x).
    Пример 4. Вычисление моды и медианы
    X:=(1 1 0 8 3 7) mode(X)=1 median(X)=4
    Статистические функции работают не только с векторами - столбцами, но и с векторами - строками.
    Размах варьирования
    Важная характеристика рассеяния вариационного ряда - размах варьирования может быть просто вычислена в MathСad с помощью двух специальных матричных функций: mах(х) - находит максимальное значение в выборке, min(x) - функция находит минимальную величину в выборке. Используя описанные функции, размах варьирования можно задать как
    R=max(x)-min(x).
    Пример 5. Вычисление размаха варьирования. Для задания вектора выборки воспользуемся генератором случайных чисел, распределенных по показательному закону:
    X:=rexp(1000,4)
    Max(X)=2.892 5
    10 58 1
    )
    X
    min(



    R=max(X)-min(X)=2.892.
    Наибольший общий делитель и наименьшее общее кратное
    Для решения некоторых задач в статистике бывает необходимым определить, на какое максимальное целое число

    37 делятся без остатка все величины в выборке. В MathСad очень просто вычислить такое число. Для этого необходимо воспользоваться встроенной функцией gcd(x) (от англ. Greatest common divisor - наибольший общий делитель).
    Схожей с описанной является задача поиска наименьшего числа, которое делится без остатка на все значения элементов выборки. В MathСad ее можно решить с помощью встроенной функции lcm(x) (сокращение от Least common multiple – наименьшее общее кратное).
    Пример 6. Найти наибольший общий делитель и наименьшее общее кратное.
    64
    lcm(X)
    2
    gcd(X)
    64)
    32 16 8
    4 2
    (
    :
    X



    1   2   3   4   5   6   7   8


    написать администратору сайта