Теория вероятностей и математическая статистика. Закон распределения случайной величины. Математическое ожидание 28 Дисперсия случайной величины 32

Название	Закон распределения случайной величины. Математическое ожидание 28 Дисперсия случайной величины 32
Анкор	Теория вероятностей и математическая статистика.docx
Дата	01.12.2017
Размер	361.49 Kb.
Формат файла
Имя файла	Теория вероятностей и математическая статистика.docx
Тип	Закон #10596
страница	9 из 12

1 ... 4 5 6 7 8 9 10 11 12

Графическое представление вариационных рядов

Для более наглядного представления временных рядов используют следующие виды графиков.

1. Полигон распределения представляет собой график частот. Это ломаная линия, абсциссы вершин которой соответствуют вариантам, а ординаты – частотам. Обычно его используют для дискретных вариационных рядов. На рисунке 17 представлен полигон распределения для вариационного ряда, приведенного в таблице 5.

2. Кумулята представляет собой график накопленных частот (ее еще называют кумулятивной кривой). На рисунке 17 представлена кумулята для того же самого ряда.

Рисунок 17 – Полигон распределения и кумулята

3. График эмпирической функции распределения представляет собой график накопленных относительных частот, т.е. относительных частот того, что признак принял значение, меньшее заданного. Для примера из таблицы 5 он представлен на рисунке 18 (рекомендуется сравнить с графиком функции распределения, которая рассматривалась при изучении теории вероятностей).

4. Гистограмма распределения представляет собой фигуру, составленную из прямоугольников, каждый из которых соответствует интервалу сгруппированного ряда, а их высота равна соответствующим частотам. Для примера из таблицы 4 гистограмма распределения представлена на рисунке 19.

Для сгруппированного ряда можно также построить полигон распределения (соединив отрезками середины верхних оснований прямоугольников гистограммы) и кумуляту (см. рисунок 19).

Рисунок 18 – Эмпирическая функция распределения

Рисунок 19 – Кумулята, полигон и гистограмма распределения для сгруппированного вариационного ряда

Показатели вариации

Средние вариационного ряда

Основным показателем вариации называется среднее арифметическое вариационного ряда

, которое рассчитывается по формуле:

,

где n – общее число наблюдений;

m – число вариант;

n_i – частота варианты х_i;

w_i – относительная частота варианты х_i.

Например, для таблицы 5 среднее арифметическое

= (2*3 + 3* 25 + 4*39 + 5*33) = 4,02 (балла).

Свойства этой средней величины аналогичны свойствам математического ожидания.

Кроме того, если вариационный ряд разбит на несколько групп, то среднее арифметическое всего ряда можно рассчитать, как среднее арифметическое групповых средних:

,

где n – общее число наблюдений;

k – число групп;

- среднее арифметическое i-й группы;

n_i – число наблюдений в i-й группе.

Например, если среди ста студентов, оценки которых приведены в таблице 5, присутствуют студенты двух различных специальностей, то можно разбить этот вариационный ряд на две группы (см. таблицы 7 и 8). По данным второго и третьего столбцов этих таблиц можно рассчитать средний балл для студентов специальности № 1 (он составил 4,12 балла) и средний балл для студентов специальности № 2 (он составил 3,875 балла). Теперь для расчета общей средней можно воспользоваться вышеприведенной формулой:
(4,12*60 + 3,875*40) /100 = 4,02 (балла), - что совпадает с полученным ранее результатом.
Если всех студентов, данные о которых приведены в таблице 5, выстроить в ряд по возрастанию полученного ими балла, то из этих ста человек в середине стояли бы студенты под номерами 50 и 51 от начала ряда. Оба эти студента получили оценку 4, так как накопленная частота для оценки 3 составляет 28, а для оценки 4 она составляет 67 (все студенты под номерами с 29-го по 67-й включительно получили оценку 4).

То значение варианты, которое соответствует середине вариационного ряда, называется медианой и обозначается Me. Если число наблюдений – нечетное, то медианный номер равен (n + 1)/2; а если четное – то медианных номеров два: n/2 и ((n/2) +1), а сама медиана рассчитывается, как среднее арифметическое этих двух вариант.

В примере из таблицы 5 медианные номера 50 и 51, а Me = (4 + 4)/2 =
= 4 (балла).
Та варианта, которая встречается в вариационном ряду чаще всего, называется модой (мода – это то значение признака, которое встречается у большинства наблюдений) и обозначается Mo.

В таблице 5 Mo = 4 (балла), так как этой варианте соответствует наибольшая частота 39.

Для интервального вариационного ряда используется несколько более сложная методика расчета рассмотренных средних, которую здесь рассматривать не будем.
В вышеприведенном примере Мо = Ме = 4  4,02 =

. Это отнюдь не всегда бывает так. Например, если рассчитать средние по данным таблицы 6, то можно получить

= 3,81  4, Me = 3, Mo = 5. Т.е. при том, что большинство студентов получили 5 (42 человека), в середине ряда оказались студенты с оценкой 3, а средний балл составил чуть меньше 4.

Таблица 6 – Дискретный вариационный ряд

№	Балл	Число студентов	Накопленная частота
1	2	10	10
2	3	41	51
3	4	7	58
4	5	42	100
		100

Оценки разброса

Для оценки разброса значений вариационного ряда используются показатели размаха, отклонений и коэффициента вариации.

Размах вариации представляет собой разность между наибольшим и наименьшим значениями вариант.

Например, для таблицы 4 размах R составил R = 5 – 2,5 = 2,5 (балла). Для таблиц 5 и 6 R = 5 – 2 = 3 (балла).

Среднее линейное отклонение представляет собой среднее арифметическое модулей отклонений вариант от своего среднего арифметического; рассчитывается по формуле:

Для примера из таблицы 5 d = (|2 – 4,02|*3 + |3 – 4,02|*25 +
+ |4 – 4,02|*39 + |5 – 4,02|*33)/100 = 0,6468 (балла), т.е. в среднем оценка студента отличается от среднего балла примерно на 0,6 балла.
Отметим, что если в этой формуле убрать знак модуля, то отклонения в разные стороны компенсируют друг друга, и результат окажется равным нулю (по соответствующему свойству среднего арифметического, аналогичного свойству математического ожидания).
Если вместо взятия по модулю возвести отклонение в квадрат, получим дисперсию вариационного ряда

.

Для примера из таблицы 5

= 0,6996. Единицы измерения этой величины (баллы в квадрате) не имеют смысла, поэтому из нее извлекают корень квадратный и получают среднеквадратическое отклонение. В том же примере

(балла). Столько составляет корень квадратный из среднего квадрата отклонения оценки каждого студента от среднего балла.
Свойства дисперсии для вариационного ряда аналогичны свойствам дисперсии в теории вероятностей. Для ее расчета можно вывести аналогичную формулу:

.
Кроме того, если ряд состоит из нескольких отдельных групп наблюдений (пусть их число равно k), то его дисперсию можно рассчитать по следующей формуле:

где

– средняя внутригрупповая дисперсия;

– дисперсия i-й группы;

- межгрупповая дисперсия.

Чтобы проиллюстрировать это правило, вернемся к примеру, в котором данные из таблицы 5 разбиты на две (k = 2) группы и представлены в таблицах 7 и 8.

Таблица 7– Оценки для специальности № 1

№	Балл (х)	Число студентов	х²
1	2	1	4
2	3	15	9
3	4	20	16
4	5	24	25
		n = 60	17,65

Рассчитаем групповую дисперсию для таблицы 7 по формуле

= 17,65 – 4,12² = 0,7.

Таблица 8– Оценки для специальности № 2

№	Балл (х)	Число студентов	х²
1	2	2	4
2	3	10	9
3	4	19	16
4	5	9	25
		n = 40	15,675

Рассчитаем групповую дисперсию для таблицы 8 по формуле

= 15,675 – 3,875² = 0,66.

Сведем расчеты в таблицу 9:

Таблица 8– Оценки для двух специальностей

Специальность	Число студентов	Средний балл	Дисперсия
№ 1	60	4,12	0,7
№ 2	40	3,875	0,66
		n = 40	15,675

Тогда межгрупповая дисперсия составит

((4,12 – 4,02)²*60 + (3,875 – 4,02)²*40)/100 = 0,01

Средняя внутригрупповых дисперсий составит

= (0,7*60 + 0,66*40)/100 = 0,68

Дисперсия всего вариационного ряда составит

= 0,68 +
+ 0,01 = 0,69, что приблизительно совпадает с полученным ранее результатом. Незначительное расхождение объясняется погрешностью округления (при расчетах с помощью электронной таблицы совпадение получается точным).

1 ... 4 5 6 7 8 9 10 11 12