курс лекций по статистике. 5fan_ru_Статистика. Курс лекций. Лекция 2 Сводка и группировка материалов статистического наблюдения Тема 2 Статистическая совокупность и её характеристики Лекция 3 Абсолютные, относительные и средние величины
Скачать 1.46 Mb.
|
Вопросы для самопроверки:Дайте определение статистической сводке. Что такое сводка и группировка и чем они отличаются друг от друга? Как вы понимаете статистическую группировку? Охарактеризуйте понятие группировочного признака. Дайте определение и покажите сущность качественного группировочного признака. Что учитывается при определении числа групп? Расскажите о равных и неравных интервалах и дайте их определение. Перечислите задачи и виды группировок. В чем сущность структурных группировок? Дайте определение аналитических группировок и расскажите, для каких целей они применяются. Как оформляются результаты сводки и группировки? Что такое вариационные ряды распределения? Дайте определение статистического подлежащего и статистического сказуемого таблицы. Назовите известные вам виды таблиц. Что такое комбинационные таблицы? Для каких целей они применяются? Дайте классификацию статистических графиков. Литература Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 3, 7 С.26-33; С.58-71 Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.1 пп.1.4, 1.5. Лекция 3. Тема: «Абсолютные, относительные и средние величины» Повседневная жизнь-это обязательная школа цифр: словарь дебета и кредита, натурального обмена, цен рынка, колеблющихся курсов денег захватывает и подчиняет любое мало-мальски развитое общество. Бродель Ф. План Введение. Абсолютные и относительные статистические величины Понятие абсолютной и относительной величины в статистике Виды и взаимосвязи относительных величин 2. Средние величины 2.1. Понятие средней величины в статистике 2.2 Средняя арифметическая и ее свойства 2.3 Другие виды степенных средних величин 2.4 Мода и медиана 2.5 Квартили и децили
Понятие абсолютной и относительной величины в статистике Результаты статистического наблюдения регистрируются, прежде всего, в форме первичных абсолютных величин. Абсолютная величина отражает уровень развития явления. В отличие от математического понятия абсолютной величины, абсолютные величины в статистике могут быть как положительными, так и отрицательными (убытки, убыль, потери и т.п.). В статистике все абсолютные величины являются именованными, т.е. всегда измеряются в конкретных единицах. Единицы измерения абсолютных показателей: натуральные единицы измерения могут быть простыми (тонны, штуки, метры, литры); составными (сложными), являющимися комбинацией нескольких разноименных величин (грузооборот железнодорожного транспорта выражается в тонно-километрах, производство электроэнергии – в киловатт-часах);. условно-натуральными единицами измерения, когда есть несколько видов продукции, обладающих общими потребительскими свойствами (например, различные виды топлива пересчитываются в условное топливо). стоимостные единицы измерения используются, например, для выражения объема разнородной продукции в стоимостной (денежной) форме – рублях. трудовые единицы измерения (человеко-дни, человеко-часы) учитывают общие затраты труда на предприятии, трудоемкость отдельных операций. С точки зрения конкретного исследования совокупность абсолютных величин можно рассматривать как состоящую из показателей индивидуальных, характеризующих размер признака у отдельных единиц совокупности, и суммарных, характеризующих итоговое значение признака по определенной части совокупности. Поскольку абсолютные показатели – это основа всех форм учета и приемов количественного анализа, то следует разграничивать моментные и интервальные абсолютные величины. Первые показывают фактическое наличие или уровень явления на определенный момент, дату (например, наличие запасов материалов или оборотных средств, величина незавершенного производства, численность проживающих и т.д.). Вторые – итоговый накопленный результат за период в целом (объем произведенной продукции за месяц или год, прирост населения за определенный период, величина валового сбора зерна за год и за пятилетку и т.п.).
Относительные величины в статистике – это обобщающие показатели, которые получают в результате сравнения различных экономических показателей между собой. Относительные величины в статистике представляют собой частное от деления двух статистических величин и характеризуют количественное соотношение между ними. Знаменатель относительной величины называют основанием или базой сравнения. Таким образом, по способу получения относительные показатели – всегда величины производные, определяемые в форме коэффициентов, процентов, промилле, продецимилле и т.п. Нужно всегда помнить, что этим безразмерным по форме показателям может быть, в сущности, приписана конкретная, и иногда довольно сложная, единица измерения. Так, например, относительные показатели естественного движения населения, такие как коэффициенты рождаемости или смертности, исчисляемые в промилле (‰), показывают число родившихся или умерших за год в расчете на 1 000 человек среднегодовой численности; относительная величина эффективности использования рабочего времени – это количество продукции в расчете на один отработанный человеко-час и т.д.
Виды и взаимосвязи относительных величин Относительные величины образуют систему взаимосвязанных статистических показателей. Относительные (величины) показатели динамики (ОПД) используются для характеристики изменения изучаемого явления во времени: . ОПД показывает, во сколько раз текущий уровень превышает предшествующий (базисный), или какую долю от последнего составляет.
Сопоставляя показатели динамики разных явлений, получают еще один вид относительных величин сравнения – коэффициенты опережения (отставания) по темпам роста или прироста. Например, если производительность труда на предприятии возросла на 12%, а фонд оплаты труда увеличился на 7,5 %, то коэффициент опережения производительности труда по темпам роста составит ; а коэффициент опережения по темпам прироста будет равен . Все субъекты финансово–экономической сферы осуществляют перспективное планирование своей деятельности и сравнивают реально достигнутые результаты с ранее намеченными. Для этой цели используются относительные показатели плана (ОПП) и реализации плана (ОПРП): ; . Между относительными показателями плана, реализации плана и динамики существует следующая взаимосвязь: Относительный показатель структуры (ОПС) характеризует состав изучаемых совокупностей, т.е. показывает долю отдельных частей в общем объеме совокупности: . ОПС выражается в долях единицы или в процентах. Рассчитанные величины соответственно называются долями или удельными весами. Относительные показатели координации (ОПК) характеризуют соотношение отдельных частей целого между собой (и применяются для сравнения различных частей совокупности между собой): .
Например, в III квартале 2011 г. внешнеторговый оборот России составил (по данным Банка России) 612,5 млрд. долл. Экспорт за этот период составил 380,4 млрд. долл., импорт - 232,1 млрд. долл. Представьте данные в виде простой статистической таблицы и рассчитайте относительные показатели структуры (удельные веса) и координации. Структура внешнеторгового оборота России в III квартале 2011 г.
Решение 1. Удельные веса экспорта и импорта (или относительные показатели структуры) составляют: 2. Относительный показатель координации равен: , что означает: на каждый миллиард долларов экспорта приходилось 1,64 млрд. долл. экспорта (доля экспорта превышает долю импорта во внешнеторговом обороте РФ в 1,64 раза), или , т.е. на каждый млрд. долл. импорта приходилось 610 тыс. долл. экспорта.
Например, по данным предыдущей задачи получаем: По абсолютным показателям и по относительным показателям (удельным весам): Относительный показатель сравнения (ОПСр) представляет собой соотношение одноименных абсолютных показателей, характеризующих разные объекты (предприятия, фирмы, районы, области, страны и т.п.): ОПСр характеризует сравнительные размеры одноименных абсолютных величин, относящихся к одному и тому же периоду либо моменту времени, но к различным объектам или территориям. Посредством этих показателей сопоставляются мощности различных видов оборудования, производительность труда отдельных рабочих, производство продукции данного вида разными предприятиями, районами, странами. Например, сравним урожайность пшеницы в России (2,15 т/га) и Германии (7,74 т/га) по итогам сельскохозяйственного сезона 2009-2010 гг.: , т.е. урожайность пшеницы в Германии была в 3,6 раза выше, чем урожайность пшеницы в России. Относительные показатели интенсивности (ОПИ) показывают, насколько широко распространено изучаемое явление в той или иной среде: . ОПИ представляют собой отношение абсолютного уровня одного показателя, свойственного изучаемой среде, к другому абсолютному показателю, также присущему данной среде и, как правило, являющемуся для первого показателя факторным признаком. Так, при изучении демографических процессов рассчитываются показатели рождаемости, смертности, естественного прироста и т.д. как отношение числа родившихся (умерших) или величины прироста населения за год к среднегодовой численности населения данной территории в расчете на 1000 чел. Если получаемые значения очень малы, то делают расчет на 10 000 человек. Относительными величинами интенсивности выступают, например, показатели выработки продукции в единицу рабочего времени, затрат на единицу продукции, трудоемкости, эффективности использования производственных фондов и т.д., поскольку их получают сопоставлением разноименных величин, относящихся к одному и тому же явлению и одинаковому периоду или моменту времени. Метод расчета относительных величин интенсивности применяется при определении средних уровней (среднего уровня выработки, средних затрат труда, средней себестоимости изделий, средней цены и т.д.). Поэтому распространено мнение, что относительные величины интенсивности – это один из способов выражения средних величин. Например. В 2010 году население России составило 142,9млн. человек, при этом в России работало 600,18 тыс. врачей. Вычислить показатель, характеризующий обеспеченность населения России врачами. Этот показатель вычисляется как ОПИ и рассчитывается исходя из численности врачей, приходящейся на 10000 человек: . Вопросы для самопроверки Что такое абсолютная величина? Каковы её роль и значение? В каких единицах измеряются абсолютные величины? Дайте понятие относительной величины. На какие виды подразделяются относительные величины? Дайте определения относительным величинам динамики, планирования, выполнения плана, структуры, координации, интенсивности и сравнения. 2.1 Понятие средней величины в статистике Если мой сосед бьет свою жену ежедневно, а я не бью ее никогда, то в свете статистики мы оба бьем ее через день. Джордж Бернард Шоу (о статистике) Если ты имеешь кастрюлю с кипятком, а твой сосед курицу, то в среднем у вас куриный суп. Автор неизвестен Средние величины – это обобщающие показатели, в которых проявляются общие, закономерные черты, свойственные для всей совокупности изучаемого явления. В средних величинах погашаются индивидуальные различия в величине признака, которые возникают по тем или иным причинам у отдельных единиц изучаемой совокупности, и, наоборот, определяется уровень варьирующего признака, типичный для большинства единиц данной совокупности. Основным условием правильного использования средних величин является качественная однородность совокупности, по которой рассчитывается средняя величина. Средняя величина (в статистике) – обобщающий показатель, характеризующий типичный размер или уровень общественных явлений в расчете на единицу совокупности при прочих равных условиях. С помощью метода средних решаются задачи: 1. Характеристики уровня развития явлений. 2. Сравнения двух или нескольких уровней. 3. Изучения взаимосвязей социально - экономических явлений. 4. Анализа размещения социально-экономических явлений в пространстве. Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак. Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон. Существуют различные средние. 2.2. Средняя арифметическая и ее свойства Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений: Простая средняя арифметическая применяется в случаях, когда имеются отдельные значения признака, т.е. данные не сгруппированы. Если данные представлены в виде рядов распределения или группировок, то средняя арифметическая исчисляется иначе: Полученная формула называется средней арифметической взвешенной. Из нее видно, что средняя зависит не только от значений признака, но и от их частот (повторяемости или весов), т.е. от состава совокупности, от ее структуры. Если статистический материал в результате обработки в виде интервальных вариационных рядов с закрытыми или открытыми интервалами, то средняя арифметическая определяется по формуле средней взвешенной: . Но в данном случае за принимается середина интервала (или групповая средняя), – число значений показателя, принадлежащих данному интервалу, – объём выборки (число наблюдений). Основные свойства средней арифметической. 1. Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится. 2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней: 3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних: 4. Если х = с, где с - постоянная величина, то . 5. Сумма отклонений значений признака от средней арифметической равна нулю («нулевое свойство» средней): 2.3 Другие виды (степенных) средних величин Средняя гармоническая величина – это величина обратная средней арифметической из обратных значений признака. Формула для расчета средней гармонической простой будет иметь вид: Формула для расчета средней гармонической взвешенной: Средняя гармоническая может использоваться для расчета средней производительности труда, средней скорости движения тела. Средняя хронологическая применяется для оценки среднего уровня ряда динамики. При наличии информации на моменты времени с равными интервалами между ними используется средняя хронологическая простая: , где n – число моментов (дат) Средняя геометрическая применяется, как правило, для оценки среднего показателя относительных величин (например, средний темп роста). Средняя геометрическая простая определяется по формуле: Средняя квадратическая используется при расчете показателей вариации: простая: взвешенная:
Структурные средние. Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода и медиана. Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой. Например, если совокупность состоит из значений: 2,4,5,4,5,3,2,4,5,5,5,4,4,3,3,2,3,4, то мода равна 4, поскольку значение варианты, равное 4, повторяется чаще других: 6 раз. Для дискретных рядов распределения модой будет значение варианты с наибольшей частотой. Для интервальных рядов распределения с равными интервалами мода определяется по формуле: где - начальное значение интервала, содержащего моду; - величина модального интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным. При этом модальным интервалом называется интервал с наибольшей частотой. Медиана - это варианта, расположенная в середине упорядоченного вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда (упорядоченный ряд - это расположение единиц совокупности в возрастающем или убывающем порядке). Если же сумма накопленных частот против одной из вариант равна точно половине сумме частот, то медиана определяется как средняя арифметическая этой варианты и последующей. Медиана интервального вариационного ряда распределения определяется по формуле где — начальное значение интервала, содержащего медиану; — величина медианного интервала; — сумма частот ряда; — сумма (кумулята) накопленных частот, предшествующих медианному интервалу; — частота медианного интервала. Квартили и децили В системе структурных показателей в качестве показателей последовательного распределения частот используют квантили или градиенты. Некоторые квантили имеет особые наименования: квартили, квинтили, децили и перцентили. Различают порядковые статистики, отсекающие четверти совокупности, которые называются квартили; в первую или нижнюю (отсекающие четверть совокупности снизу), третью или верхнюю (отсекающие четверть сверху). Вторая квартиль является медианой. Далее можно говорить об отсекающих десятые части — децилях и т.д. Определение этих порядковых статистик в вариационном ряду, так же как и определение медианы, начинается с расчета порядкового номера соответствующего варианта, а затем по накопленным частотам определяется интервал, в котором находится соответствующий вариант. Определение величины накопленного варианта внутри интервала тоже абсолютно аналогично нахождению медианы. В интервальном вариационном ряду квартили внутри определенного по накопленным частотам интервала рассчитываются по следующим формулам: нижняя квартиль вычисляется по формуле: , верхняя квартиль , где – нижняя граница квартальных интервалов; — величина интервала; — сумма частот; — накопленная частота интервала, предшествующего нижнему квартилю; — накопленная частота интервала, предшествующего верхнему квартилю; - частота квартального интервала. Формулы для децилей в интервальном вариационном ряду записываются следующим образом: – первая дециль, – вторая дециль и т.д. Вопросы для самопроверки Что такое средние величины? Каковы роль и значение средних показателей? Какие существуют средние величины и как рассчитываются средняя арифметическая простая и взвешенная? Как осуществляется расчет средней арифметической по данным интервального ряда? Перечислите свойства средней арифметической. Для исчисления средних каких показателей используются средняя хронологическая, средняя гармоническая, средняя геометрическая, средняя квадратическая? Как вы понимаете термин «структурные средние»? Приведите примеры структурных средних? В чем сущность моды и как она рассчитывается для вариационного и интервального ряда? Что такое медиана, какими свойствами она обладает и как рассчитывается медиана для интервального ряда? Для каких целей применяются и как рассчитываются квартили и децили? Литература Статистика: учебно-практическое пособие/М.Г. Назаров и др.; под ред. М.Г Назарова. – М.: КНОРУС, 2008.–480 с. Гл. 4, 5 С.34-45 Статистика: Учебник для вузов (+CD)/Под ред. И.И. Елисеевой. – СПб.: Питер, 2010.– 368 с.: ил. – (Серия «Учебник для вузов»). Гл.2 пп.2.1. – 2.3. Лекция 4 «Методы изучения корреляционной связи» Математические модели строятся и используются для трех целей: объяснения; предсказания; управления. Плпн Функциональная зависимость и корреляция. Предпосылки корреляционно - регрессионного анализа МНК и построение уравнения линейной регрессии. Оценка качества построенной модели Решение типовой задачи Функциональная зависимость и корреляция Корреляционной связью называется важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой переменной. В статистике принято различать следующие варианты зависимостей: 1. парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными) 2. частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков. 3. множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование По направлению различают прямую связь, при которой с увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) значений результативного, и обратную связь, при которой значения факторного признака изменяются под воздействием факторного в противоположном направлении. Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты, направления связи и установление аналитической формы связи. Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение результативного признака обусловлено влиянием одного или нескольких факторов, а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Корреляция и регрессия тесно связаны между собой: первая оценивает силу статистической связи, вторая исследует ее форму. Предпосылки корреляционно-регрессионного анализа. 1. Наличие данных по достаточно большой совокупности явлений. Это общее условие всякого статистического исследования. Обычно считается, что число наблюдений должно быть в 5-6 (а лучше – не менее чем в 10 раз) больше числа факторов. Большое число наблюдений позволяет закону больших чисел, действуя в полную силу, обеспечить эффективное взаимопогашение случайных отклонений от закономерного характера связи признаков. 2. Качественная однородность тех единиц, которые подвергаются изучению методами корреляционно-регрессионного анализа. 3. При выполнении вышеуказанных требований далее необходимо провести количественную оценку однородности исследуемой совокупности по комплексу признаков. Одним из возможных вариантов такой оценки является расчет относительных показателей вариации (традиционно широкое применение для этих целей получил коэффициент вариации). 4. При ограничении числа факторов, вводимых в модель, наряду с качественным анализом целесообразно использовать и количественные оценки, позволяющие конкретно охарактеризовать влияние факторов на результативный показатель. Включаемые в исследование факторы должны быть независимы друг от друга, так как наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и дублируют друг друга. 5. Целесообразным является изучение формы распределения исследуемых признаков, т.к. все основные положения теории корреляции разрабатывались применительно к предположению о нормальном характере распределения исследуемых признаков. Это условие связано с применением метода наименьших квадратов (МНК) при расчете параметров корреляции: только при нормальном распределении МНК дает оценку параметров, отвечающую принципам максимального правдоподобия. На практике эта предпосылка выполняется приближенно. Однако при значительном отклонении распределения признаков от нормального закона возникают проблемы с оценкой надежности рассчитанных по выборочным данным коэффициентов корреляции. В соответствии с сущностью корреляционной связи ее изучение имеет две цели: 1. измерение тесноты связи двух или более признаков между собой 2. измерение параметров уравнения, выражающего зависимость средних величин результативного признака от значений одного или нескольких факторных признаков; |