Статистика учебник. Тарновская ли. Статистика учебное пособие
Скачать 3.85 Mb.
|
Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. продается максимальное количество товаров того или иного вида. Мода употребляется для характеристики некоторых типичных размеров общественных явлений, которые не могут быть выражены при помощи средних показателей. Могут быть распределения, где все варианты встречаются одинаково часто, в этом случае моды нет. В других случаях не одна, а две варианты могут иметь наибольшие частоты, тогда будут две моды и распределение будет бимодальным; при большем числе вариант с наибольшими частотами мультимодальным, что характеризует неоднородность совокупности. В интервальном ряду моду определяют по формуле ) ( ) ( Мо 1 1 1 Мо Мо Мо Мо Мо Мо Мо + − − − + − − + = f f f f f f h x , (4.10) где Мо x – нижняя граница модального интервала Мо f – частота модального интервала 1 Мо − f – частота предмодального интервала 1 Мо + f – частота интервала, следующего за модальным h – величина интервала. Пример. Распределение предприятий по численности промышленно- производственного персонала характеризуется следующими данными, приведенными в табл. 4.2. Рассчитать моду. Таблица 4.2 Группы предприятий по числу рабочих, чел. Число предприятий, Сумма накопленных частот 100–200 1 1 200–300 3 4 300–400 7 11 400–500 30 41 500–600 19 60 600–700 15 75 700–800 5 80 Итого 80 По формуле (4.17) рассчитаем моду Мо x =400, Мо f =30, 1 Мо − f =7, 1 Мо + f =19, h =100; Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. 467,6 19) (30 7) (30 7 30 100 400 Мо = − + − − + = чел. В интервальном ряду с неравными интервалами применяется плотность распределения (частное отделения частоты на величину принятого интервала. Медианой в статистике называется значение признака у единицы, которая расположена в середине упорядоченного ряда, а в вариационном ряду медианой будет величина признака, которая делит ряд пополам по сумме накопленных частот. Поданным интервального вариационного ряда медиана определяется последующей формуле Мe Мe Мe 1 1 1 2 1 Me f f f h x n i n i i ∑ ∑ = = − − + = , (4.11) где Me – медиана М – нижняя граница медианного интервала ∑ = n i i f 1 – сумма накопленных частот ∑ = − n i f 1 М – сумма накопленных частот, предшествующих медианному интервалу М – частота медианного интервала h – величина медианного интервала. Медиана обладает следующим свойством сумма отклонений членов ряда от медианы есть величина наименьшая. Благодаря этому свойству медиану используют при планировании размещения пунктов по заготовке сельскохозяйственной продукции (мясокомбинаты, элеваторы) стем, чтобы сумма расстояний была минимальной при размещении оборудования общего пользования на предприятии. Вначале определяется медианный интервал по сумме накопленных частот, превышающих половину всех значений частот. Для вышеприведенной задачи (см. табл. 4.2) медианным интервалом будет 400–500. Рассчитаем медиану 496,66 96,66 400 30 11 40 100 Средняя, мода, медиана в анализе характера распределения дают возможность логического контроля расчетов. При симметричном распределении членов ряда, те. когда частоты равномерно возрастают, а потом убывают, средняя, мода и медиана равны между собой. При асимметричном Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. распределении медиана расположена в середине, а средняя и мода – по краям. Чем больше расхождение между модой и средней арифметической, тем больше асимметрично распределение. Для умеренно асимметричных рядов характерно следующее соотношение Моду и медиану в интервальном ряду можно определить графически. Мода определяется по гистограмме распределения. Выбирается самый высокий прямоугольник, который является модальным. Затем правую вершину прямоугольника соединяют с правой вершиной предшествующего прямоугольника, а левую вершину – с левой вершиной последующего прямоугольника. Из точки пересечения восстанавливается перпендикуляр до абсциссы – это значение будет модой. Медиана рассчитывается по ку- муляте. Для ее определения из точки на шкале накопленных частот, соответствующей, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Для характеристики структуры применяются квартили и децили. Квартили делят ранжированную совокупность по сумме накопленных частот на четыре равные части. Различают квартиль нижний (Q 1 ), отделяющий часть совокупности с наименьшими значениями признака, и квартиль верхний (Q 4 ), отсекающий 1/4 часть с наибольшими значениями признака. Для дискретного ряда квартили рассчитываются следующим образом находится L=1/4R, которая используется для определения квартилей. Например, для ранжированного ряда 5, 13, 17, 32, 37, 49, 52 эта величина равна. Тогда ( ) [ ] ( ) [ ] 49,52. 5,13; ; ; 4 1 max max 4 min Для расчета квартилей по интервальному вариационному ряду используются формулы ∑ ∑ = − = − − − + = n i Q Q n i Q i Q S f S f h x Q 1 1 1 1 1 1 1 1 1 4 1 ; (4.12) Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ∑ ∑ = − = − − − + = n i Q Q n i Q i Q S f S f h x Q 1 1 4 4 1 1 4 4 4 4 3 , (4.13) где 1 Q x – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25 %); 4 Q x – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75 %); h – величина интервалов 1 1 − Q S – сумма накопленных частот интервала, предшествующего интервалу, содержащему нижний квартиль 1 4 − Q S – тоже для верхнего квартиля 1 Q f – частота интервала, содержащего нижний квартиль 4 Q f – тоже для верхнего квартиля. Кроме квартилей, в вариационных рядах распределения могут определяться децили – варианты, делящие ранжированный ряд по сумме накопленных частот на десять равных частей. Первый дециль (d 1 ) делит совокупность в отношении 1/10 к 9/10, второй дециль (d 2 ) – в соотношении 2/10 кит. д. Вычисляются они по той же схеме, что и медиана, и квартили. Значения признака, делящие ряд на сто частей, называются процен- тилями. Эта характеристика используется редко [1, 2– 8]. Тесты Тестовые задания включают 10 теоретических утверждений, для каждого из которых предлагается четыре варианта ответа (правильными могут быть один или два. Выберите правильный вариант ответа. 1. Чтобы получить относительный показатель динамики с переменной базой сравнения для го периода, необходимо а) перемножить относительные показатели динамики с постоянной базой сравнения за й и (i – 1) периоды б) разделить относительный показатель динамики с постоянной базой сравнения за й период на аналогичный показатель за период (i – 1); в) разделить относительный показатель динамики с постоянной базой сравнения за й период на аналогичный показатель за период (i + 1); г) разделить текущий показательна базовый. Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. 2. Относительный показатель реализации предприятием плана производства продукции составил 107 %, при этом объем производства по сравнению с предшествующим периодом вырос на 5 %. Что предусматривалось планом а) снижение объема производства б) рост объема производства в) невозможно ответить г) не предусматривалось ни снижения, ни роста объема производства. В каких случаях взвешенные и невзвешенные средние равны между собой а) при отсутствии весов б) при равенстве весов в) при отсутствии или равенстве весов г) невозможно ответить 4. В каких случаях используется средняя гармоническая а) когда неизвестен числитель исходного соотношения б) когда неизвестен знаменатель исходного соотношении в) невозможно ответить г) когда известен и числитель, и знаменатель соотношения 5. Изменится ли средняя величина, если все частоты уменьшить на некоторую постоянную величину а) изменится б) не изменится в) уменьшится г) увеличится 6. Значение признака статистической совокупности, имеющего наибольшую частоту встречаемости, называется а) средней арифметической взвешенной б) средней геометрической взвешенной в) модой г) медианой. 7. Медианой в статистике называется значение признака а) в середине упорядоченного ряда по сумме накопленных частот б) отделяющее 25 % совокупности с наименьшими значениями по сумме накопленных частот в) наиболее часто встречающееся в совокупности г) отделяющее 25 % совокупности с наибольшими значениями по сумме накопленных частот. 8. Средняя геометрическая применяется для расчетов а) средних темпов за определенный период Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. б) средних величин в виде квадратных функций в) средних величин в форме обратных показателей г) средних величин совокупности, представленных индивидуальными значениями. 9. Средняя гармоническая применяется, когда а) индивидуальные значения выражены в обратной функции б) индивидуальные значения выражены в форме обратных показателей в) индивидуальные значения имеют различную частоту г) индивидуальные значения выражены степенной функцией. 10. Относительный показатель интенсивности характеризует а) степень распространения изучаемого процесса в среде б) соотношение одноименных абсолютных показателей, характеризующих разные объекты в) соотношение структурных частей изучаемого проекта г) соотношение текущих показателей и базисных. Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ГЛАВА 5. ОСНОВНЫЕ ПОКАЗАТЕЛИ ВАРИАЦИИ 5.1. Абсолютные показатели вариации Колеблемость, многообразие, изменяемость величины признака у единиц совокупности называются вариацией. Вариация существует в пространстве и во времени. Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям. Под вариацией во времени подразумевают изменение значений признака в различные периоды времени. Задача изучения вариации признаков состоит в том, чтобы 1) определить меру вариации, те. количественно измерить (рассчитать показатель вариации 2) выяснить причины, которые вызвали вариацию признаков. Разложить общий объем вариации по источникам. Измерение вариации имеет как практическое, таки теоретическое значение при ее помощи характеризуется однородность, планомерность многих процессов (если в работе предприятия большая вариация, то это ведет к неполному использованию производственных мощностей, к браку, срыву работы смежников, так называемой штурмовщине. Очень важны показатели вариации при характеристике выполнения договорных обязательств по отдельным предприятиям. Для измерения размера вариации в статистике используется система абсолютных и относительных показателей. К абсолютным показателям относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Самым простым является размах вариации – это разность между максимальными минимальным значениями признака (R = x max – x min ). Основным недостатком этого показателя является то, что он определяется двумя крайними значениями, в то время как вариация признака складывается из всех его значений. Часто размах вариации имеет важное смысловое значение. Им определяются пределы, в которых могут колебаться размеры тех или иных параметров деталей при контроле качества продукции, при анализе устойчивости режима производственного процесса. Назаре статистической науки было предложено брать в качестве меры вариации среднее абсолютное значение отклонений от средней величины значений признака, не принимая во внимание их знаки. Такая мера вариации получила название среднего линейного отклонения Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. n x x d n i i ∑ = − = 1 . (5.1) Для вариационного ряда ∑ ∑ = = ⋅ − = n i i i n i i f f x x d 1 1 . (5.2) Среднее линейное отклонение представляет средние показатели, полученные из отклонений индивидуальных значений признака от их среднего размера. Но нельзя построить меру вариации, игнорируя основное свойство отклонений как величин, принимающих и положительные и отрицательные значения. Отсюда основной мерой вариации является дисперсия и среднее квадратическое отклонение. Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней величины. В зависимости от исходных данных дисперсия может вычисляться по средней арифметической простой) или взвешенной ∑ ∑ = = ⋅ − = σ n i i n i i i f f x x 1 1 2 2 ) ( . (5.4) Среднее квадратическое отклонение – показатель степени однородности изучаемой совокупности. Поэтому он может быть использован для оценки надежности средней арифметической. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии n x x n i i ∑ = − = σ 1 2 ) ( ; (5.5) для вариационного ряда Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ∑ ∑ = = ⋅ − = σ n i i n i i i f f x x 1 1 2 ) ( . (5.6) Среднее квадратическое отклонение σ выражается в тех же единицах измерения, что и исходные значения x i . Среднее квадратическое отклонение это обобщающая характеристика размеров вариации признака в совокупности. Техника вычисления дисперсии сложна, а при больших значениях вариант и частот может быть громоздкой. Расчеты можно упростить, используя свойства дисперсии. Используя эти свойства и применяя способ моментов, можно достаточно быстро исчислить дисперсию. Этим способом удобно пользоваться, когда значения признака заданы в виде рядов распределения с равными интервалами 2 1 1 2 2 ) ( A x h f f h A x n i i n i i i x − − ⋅ ⋅ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = σ ∑ ∑ = = , (5.7) где h – величина интервала А – условный нуль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой. В статистике используют условные моменты m 1 , m 2 , m 3 и центральные моменты ММ, необходимые для расчета дисперсии и среднего квадра- тического отклонения. Величину m 1 называют моментом первого порядка ∑ ∑ = = ⋅ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = n i i n i i i f f h A x m 1 1 1 . (5.8) Величину m 2 называют моментом второго порядка ∑ ∑ = = ⋅ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = n i i n i i i f f h A x m 1 1 2 2 . (5.9) Величину m 3 называют моментом третьего порядка Тарновская ЛИ. Статистика учебное пособие. – Томск Изд-во ТПУ, 2008. – 248 с. ∑ ∑ = = ⋅ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = n i i n i i i f f h A x m 1 1 3 3 . (5.10) Используются центральные моменты 2 M , 3 M : 2 1 2 М (5.11) ( ) 2 2 1 3 3 2 m M m m M + ⋅ − = . 5.12) Учитывая это, формулы дисперсии и среднего квадратического отклонения можно записать так ( ) 2 1 2 2 2 σ m m h − = ; (5.13) 2 1 2 σ m m h − = . (5.14) Пример. По данным о времени горения электроламп, приведенным в табл. 4.1, рассчитать дисперсию по способу моментов. Решение По формуле (5.7) рассчитаем дисперсию ( ) 48400. 1300 1340 200 400 500 σ 2 Исчислим дисперсию по формуле (5.14) через условные моменты для приведенного примера 2 2 2 2 2 500 80 σ 200 48400; 400 400 500 80 σ σ 200 220. 400 Альтернативными признаками называются признаки, которыми обладают одни единицы совокупности и не обладают другие. Наличие признака обозначим единицей, отсутствие – нулем. Долю вариантов, обладающих данным признаком, обозначим p, а не обладающих им – q. Так как p + q = 1, то дисперсия альтернативного признака pq = σ 2 n m p = , где n – число наблюдений m – число единиц совокупности, обладающих данным признаком [1, 3–7]. |