стати. Тесты для самоконтроля, контрольные работы по
Скачать 1.08 Mb.
|
Распределение рабочих по возрасту Возраст, лет (х) 20-30 30-40 40-50 Итого Количество рабочих, чел. (f) 10 18 2 30 Частость (w) 0,33 0,6 0,07 1,0 Накопленная частота, чел. (S) 10 28 30 - 4.4. Показатели центра распределения К показателям центра распределения относятся: средняя арифметическая, мода и медиана. Для дискретного и интервального рядов распределения средняя арифметическая определяется по формулам: 46 f f x x , f f x x , где х – варианты значений признака; x - середина соответствующего интервала значения признака f - частота повторения данного варианта. Пример расчета среднего уровня для дискретного ряда распределения приведен в примере 7 (стр. 27), для интервального - в примере 8 (стр. 28). Медиана (Ме) соответствует значению признака, стоящему в середине ранжированного ряда. Мода (Мо) – наиболее часто встречающееся значение признака. Подробно структурные средние величины рассмотрены в параграфе 3,4; пример расчета медианы для дискретного ряда приведен в примере 11 (стр. 30), для интервального ряда – в примере 12 (стр. 32). Расчет моды для интервального ряда представлен в примере 12 (стр. 32), для дискретного ряда – в примере 10 (стр. 29). 4.5. Сопоставимость рядов распределения Для проведения сравнительного анализа двух и более рядов распределения, в которых значения факторного признака представлены неравными интервалами или интервалами значений, имеющими разрывы, необходимо на первом этапе привести ряды к сопоставимому виду. Сопоставимость рядов распределения характеризуется равными интервалами значений факторного признака и отсутствием разрывов в цепи данных (например, представлены интервалы данных о возрасте: 20-24; 24- 30; 34-38, здесь, во-первых, не равные интервалы, во-вторых – есть разрыв: отсутствуют данные о возрасте 30-34 года). Для приведения ряда к сопоставимому виду необходимо рассчитать абсолютную или относительную плотности распределения. Если частота повторения представлена абсолютными величинами (число рабочих, число студентов), то рассчитывается абсолютная плотность распределения. Абсолютная плотность распределения – это количество рабочих (студентов и т.д., т.е. величина частоты повторения) приходящихся на единицу шага интервала. Определяется она по формуле: i f p , где f - частота повторения данного интервала в совокупности; i - размер (шаг) интервала. Если частота повторения представлена относительными величинами (удельный вес банков, доля рабочих), то рассчитывается относительная плотность распределения. Относительная плотность распределения: i w p , где w - частость отдельной группы. 47 Пример 19. Приведите ряды к сопоставимому виду, используя данные таблицы 26. Таблица 26. Успеваемость студентов двух групп Группа 1 Группа 2 Успеваемость, % Число студентов, чел. Успеваемость, % Число студентов, чел. 60-70 4 50-60 2 70-90 10 60-80 10 90-100 6 80-90 8 Итого 20 90-100 4 Итого 24 Решение Заданные ряды распределения не сопоставимы, так как интервалы успеваемости в первой группе отличаются от интервалов второй группы. Частота повторения представлена абсолютными показателями – числом студентов, следовательно, будем рассчитывать абсолютную плотность распределения. Перед расчетом плотности, составим итоговую таблицу, где представим факторный признак - «успеваемость» - равными интервалами для обеих групп студентов (табл. 27). В примере лучше взять шаг интервала, равный 10 %, так как минимальное значение факторного признака равно 50 % (табл. 26), а максимальное – 100 %. Шаг интервала при приведении рядов к сопоставимому виду выбираются исследователем самостоятельно. Таким образом, в таблице 26 на данный момент заполнено лишь подлежащее, т.е. первая графа. Таблица 27. Распределение студентов по уровню успеваемости Успеваемость, % Группа 1 Группа 2 50-60 0 2 60-70 4 5 70-80 5 5 80-90 5 8 90-100 6 4 Итого: 20 24 Теперь таблицу 27 надо заполнить, для этого смотрим на данные первой группы: - интервал [50-60] - нет студентов, т.е. 0 человек (заносим в таблицу); - интервал [60-70] – 4 человека (заносим в таблицу); 48 - интервал [70-90] – надо рассчитывать; - интервал [90-100] – 6 человек (заносим в таблицу). Аналогично заполняем известные значения в группе 2: - интервал [50-60] – 2 человека (заносим в таблицу); - интервал [60-80] – шаг интервала 20%, т.е. надо рассчитать плотность; - интервал [80-90] – 8 человек (заносим в таблицу); - интервал [90-100] – 4 человека (заносим в таблицу). Необходимо рассчитать абсолютную плотность распределения в интервале [70-90] в первой группе: 5 0 20 10 i f P Нам в итоговой таблице (табл. 26) неизвестны два интервала: [70-80] и [80-90], оба они входят в интервал [70-90], плотность которого мы рассчитали. Теперь выразим из формулы частоту повторения, получим: i p f , следовательно, частота повторения: - в интервале [70-80] равна: 5 10 5 0 f (чел.) (учтите, что теперь шаг интервала равен 10 %); - в интервале [80-90] равна: 5 10 5 0 f (чел.). Результаты занесем в таблицу 27. Аналогично рассчитаем недостающие частоты в группе 2. Абсолютная плотность распределения в интервале [60-80] (табл. 26) равна: 5 0 20 10 i f P Данный интервал можно разбить на два необходимых нам интервала: [60-80]=[60-70]+[70-80]. Рассчитаем частоту повторения в каждом из этих интервалов: 1) в интервале [60-70] - 5 10 5 0 f (чел.); 2) в интервале [70-80] - 5 10 5 0 f (чел.). Занесем полученные значения частот в таблицу 26. Теперь данные по двум группам сопоставимы, можно проводить анализ успеваемости в них. 4.6. Показатели формы распределения и графическое изображение вариационного ряда Первым этапом изучения вариационного ряда является его графическое изображение. Дискретный и интервальный вариационные ряды чаще всего изображаются в виде полигона распределения частот. Графики строятся в прямоугольной системе координат. Выделяют два основных вида кривых распределения: 1) многовершинные кривые (рис. 9) свидетельствуют о ненормальности распределения, следовательно, анализ таких рядов продолжается только после перегруппировки данных; 2) одновершинные кривые свидетельствуют о нормальности распределения. 49 Эталоном ряда распределения является кривая нормального распределения, представленная на рисунке 10. Рис. 9. Многовершинная Рис. 10. Кривая нормального кривая распределения распределения Среди одновершинных кривых распределения выделяют ассиметричные и симметричные кривые. Ассиметричные кривые распределения в свою очередь делятся на два вида: кривые с правосторонней асимметрией (рис. 11) и кривые с левосторонней асимметрией (рис. 12). Рис. 11. Правосторонняя Рис. 12. Левосторонняя асимметрия асимметрия x x f f S A <0 S A >0 0 k E x x f f 0 S A 50 Способы определения показателя асимметрии и оценка его существенности 1. Анализ степени асимметрии проводится на основе определения относительного показателя асимметрии, предложенного английским статистиком К. Пирсоном: x S Mo x A или x S Me x A , где x - среднее значение признака; Mo - модальное значение признака; Me – медианное значение признака; x - среднее квадратическое отклонение факторного признака. Показатель асимметрии может принимать как положительные, так и отрицательные значения. Принято считать, что асимметрия считается значительной, если S A >0,5. Незначительной асимметрия признается, если S A <0,25. Если же значение показателя асимметрии находится в интервале 0,25≤ S A ≤0,5, то асимметрия считается умеренной. 2. Другой способ расчета показателя асимметрии предложил шведский математик Линдберг: 50 П A S , где П – удельный вес (процент) значений признака, превышающих величину средней арифметической; 50 – константа, которая характеризует процент вариант, превосходящих среднюю арифметическую ряда нормального распределения. 3. Наиболее часто применяется показатель асимметрии, определяемый через центральный момент третьего порядка: 3 3 S A , где 3 - центральный момент третьего порядка, определяется по формуле: f f x x 3 3 ) ( Среднее квадратическое отклонение определяется по формулам: n x x 2 ) ( ; f f x x 2 ) ( Оценка существенности показателя асимметрии производится на основе средней квадратической ошибки: ) 3 ( ) 1 ( ) 1 ( 6 n n n S A , где n – число наблюдений. Асимметрия является существенной и распределение признака- фактора в генеральной совокупности несимметрично, если S A S A >3, если же 51 дробь меньше 3, то асимметрия является несущественной, ее наличие объясняется влиянием случайных величин. Симметричные кривые распределения встречаются двух видов: островершинные (рис. 13) и плосковершинные (рис. 14). При анализе симметричных рядов распределения определяется показатель островершинности (эксцесса): 3 4 4 k E , где 4 - центральный момент четвертого порядка: f f x x 4 4 ) ( Положительное значение показателя эксцесса свидетельствует об островершинности кривой распределения, отрицательное значение – о плосковершинности кривой. Для приближенного определения показателя эксцесса используют формулу Линдберга: 29 38 П E k , где П – удельный вес (процент) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в обе стороны от величины средней); 38,29 – процент количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения, в общем количестве вариант ряда нормального распределения. Рис. 13. Островершинное Рис. 14. Плосковершинное распределение распределение Распределение может считаться нормальным, если показатель эксцесса не превышает среднеквадратической ошибки эксцесса, которая определяется по формуле: ) 5 ( ) 3 ( ) 1 ( ) 3 ( ) 2 ( 24 2 n n n n n n k E ) 5 ( ) 3 ( ) 1 ( ) 3 ( ) 2 ( 24 2 n n n n n n k E x x f f k E <0 k E >0 52 Пример 20. Используя построенный вариационный ряд в примере 17 (табл.24), определите показатели формы распределения, графически представьте ряд распределения. Таблица 28. Распределение рабочих цеха по уровню квалификации. Разряд (х) 2 3 4 5 Итого Количество рабочих, чел. (f) 3 8 13 5 29 Частость (w) 0,1 0,28 0,45 0,17 1,0 Накопленная частота, чел. (S) 3 11 24 29 - Решение Определим показатель асимметрии: 3 3 S A , f f x x 3 3 ) ( Для расчета необходимо найти среднее значение признака: 7 3 29 107 5 13 8 3 5 5 13 4 8 3 3 2 f f x x Центральный момент третьего порядка составляет: 21 0 29 06 6 5 13 8 3 5 ) 7 3 5 ( 13 ) 7 3 4 ( 8 ) 7 3 3 ( 3 ) 7 3 2 ( 3 3 3 3 3 Рис. 15. Линия распределения рабочих цеха по разряду При определении показателя асимметрии используется среднее квадратическое отклонение, определим его: 14 12 10 8 6 4 2 f , чел. х 0 1 2 3 4 5 6 53 f f x x 2 ) ( 88 0 29 21 22 5 13 8 3 5 ) 7 3 5 ( 13 ) 7 3 4 ( 8 ) 7 3 3 ( 3 ) 7 3 2 ( 2 2 2 2 Значение показателя асимметрии равно: 3 0 68 0 21 0 3 3 S A Полученное значение показателя асимметрии свидетельствует об умеренной левосторонней асимметрии. Рассчитаем показатель эксцесса по формулам: 3 4 4 k E , f f x x 4 4 ) ( Центральный момент четвертого порядка равен: 43 1 29 36 41 5 13 8 3 5 ) 7 3 5 ( 13 ) 7 3 4 ( 8 ) 7 3 3 ( 3 ) 7 3 2 ( 4 4 4 4 4 61 0 3 39 2 3 ) 88 0 ( 43 1 3 4 4 4 k E Полученная величина показателя эксцесса свидетельствует о плосковершинном распределении. Графически заданный вариационный ряд представлен на рисунке 15. Пример 21. Используя данные примера 18 (табл. 25), определите показатели формы распределения, графически представьте заданный ряд. Решение Для определения показателей формы распределения, составим вспомогательную таблицу (табл. 29). Таблица 29. Распределение рабочих по возрасту Данные Рассчитанные показатели Возраст, лет (х) Количество рабочих, чел. (f) ) ( x x f x x 2 ) ( f x x 3 ) ( f x x 4 ) ( 20-30 10 -7,3 532,9 -3890,2 28398,2 30-40 18 2,7 131,2 354,3 956,6 40-50 2 12,7 322,6 4096,8 52028,9 Итого 30 - 986,7 560,9 81383,7 На первом этапе определим средний возраст рабочих: 3 32 30 2 45 18 35 10 25 f f x x (лет). Производим расчет элементов формул и заносим их в таблицу 27, учитывая, что x - середина соответствующего интервала. 54 Рис. 16. Линия распределения рабочих по возрасту Центральный момент третьего порядка составляет: f f x x 3 3 ) ( 7 18 30 9 560 ; среднее квадратическое отклонение равно: 7 5 30 7 986 ) ( 2 f f x x ; рассчитаем величину показателя асимметрии: 1 0 2 185 7 18 ) 7 5 ( 7 18 3 3 3 S A Полученная величина показателя асимметрии свидетельствует о незначительной правосторонней асимметрии ( S A >0 и S A <0,25) . Так как асимметрия незначительна, то целесообразно рассчитать показатель эксцесса: 8 2712 30 7 81383 ) ( 4 4 f f x x ; 43 0 3 57 2 3 6 1055 8 2712 3 ) 7 5 ( 8 2712 3 4 4 4 k E Полученная величина показателя эксцесса свидетельствует о плосковершинном распределении ( 43 0 k E <0). Графически заданный вариационный ряд представлен на рисунке 16. При значительной или умеренной асимметрии показатель эксцесса не определяется, так как о симметричности кривой распределения не может 18 16 14 12 10 8 6 4 2 f , чел. х , лет 0 10 20 30 40 50 60 |