Методические указания по решению типовых задач Учебнометодическое пособие для направления подготовки
Скачать 2.09 Mb.
|
Министерство сельского хозяйства Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего образования «Государственный университет по землеустройству» Кафедра землепользования и кадастров СТАТИСТИКА: методические указания по решению типовых задач Учебно-методическое пособие для направления подготовки 21.03.02. – Землеустройство и кадастры Москва 2019 УДК 519.22 ББК 22.172 Подготовлено и рекомендовано к печати кафедрой землепользования и кадастров Государственного университета по землеустройству (протокол № … от..…….2018г.) Утверждено к изданию ученым советом факультета кадастра недвижимости Государственного университета по землеустройству (протокол №… от……….2018 г.) Под общей редакцией: член-корреспондента Российской академии наук (РАН), д.э.н., профессора Варламова А.А. Автор: к.э.н., доцент Шайкина Е.В. Рецензенты: д.э.н., профессор кафедры Землепользования и кадастров, заслуженный работник высшей школы РФ, профессор Гальченко С.А., д.э.н., профессор кафедры «Землеустройство» ФГБОУ ВО Государственный университет по землеустройству Черкашина Е.В. В учебно-методическое пособие включены методические указания и алгоритмы решения типовых задач по всем основным темам дисциплины «Статистика». Предлагаемые типовые задачи рассчитаны на выработку у студентов умений и навыков: по построению и графическому изображению статистических рядов распределения; исчислению системы характеристик рядов распределения; по статистической оценке достоверности выборочных параметров распределения и проверке статистических гипотез; по применению методов дисперсионного и корреляционно-регрессионного методов анализа, а также по использованию встроенных инструментов статистического анализа MS Excel. Расчет задач выполняется на одном и том же исходном материале и носит сквозной характер, что способствует системному, последовательному освоению методов статистики. Включенные в учебно-методическое пособие типовые задачи рассчитаны как на аудиторное решение, так и на самостоятельную внеаудиторную работу студентов. Пособие может быть использовано бакалаврами, магистрами, аспирантами, а также преподавателями всех факультетов, применяющих методы математической статистики для обработки массовых статистических данных. УДК 519.22 ББК 22.172 Содержание
Модуль 1. Статистические ряды распределения и их характеристики Цель изучения модуля 1: освоение подходов и алгоритмов упорядочения статистической совокупности; расчет и анализ характеристик типичности и вариации изучаемых признаков в различных видах рядов распределений. Вопросы: Статистические совокупности и их виды Признаки статистических совокупностей Упорядочение единиц совокупностей по признакам разных видов в виде рядов распределений Средние величины как характеристики типичности изучаемого признака совокупности Показатели вариации Закон разложения объемов вариации Методические указания Объектом изучения математической статистики являются статистические совокупности – множества единиц каких-либо массовых явлений в обществе и природе, объединенных общим содержанием. Например, группа земельных участков сельскохозяйственного назначения представляет собой статистическую совокупность, так как ее единицы (отдельные земельные участки) имеют общее качество – они предназначены для производства продукции растениеводства и животноводства. Каждая единица совокупности обладает различными свойствами, которые могут быть выражены количественной характеристикой (например, площадь земельного участка, показатели качества почвы, цена участка и т.д.) или качественной характеристикой (тип почвы, административный район, собственность и др.). Все единицы совокупности можно упорядочить по одному или нескольким признакам, то есть построить ряды распределения. Различают следующие виды рядов распределений: а) по качественным признакам (атрибутивные ряды распределения) и б) по количественным признакам (вариационные ряды распределения). По качественным признакам упорядочение единиц может быть проведено по градациям качества (например, распределение земельных участков по типам почв или по административному району). Упорядочение единиц совокупности по количественным признакам (условное обозначение признаков – Х, У, Z…) проводится по возрастанию или убыванию значений количественного признака (например, распределение земельных участков по цене за сотку) и может быть реализовано в виде следующих вариационных рядов: 1) ранжированного ряда, 2) дискретного ряда и 3) интервального ряда распределения. Ранжированным рядом называется распределение единиц совокупности в порядке возрастания ( Х 1 ≤ Х 2 ≤ Х 3 …≤ Х п ) или убывания значений количественного признака ( Х 1 ≥ Х 2 ≥ Х 3 …≥ Х п ). Ранжированный ряд имеет 2 элемента: 1-й - номера единиц совокупности по ранжиру; 2- значения признака в определенном порядке. Ранжированный ряд позволяет увидеть, в каких пределах варьирует изучаемый признак. Дискретным рядом называется ряд распределения единиц совокупности в порядке возрастания или убывания градаций дискретного признака с указанием частот встречаемости этих градаций в совокупности. Элементы дискретного ряда : 1й - градации значений признака в порядке возрастания или убывания ; 2й - число единиц совокупности с данными градациями признака (так называемая «частота встречаемости» или «статистический вес» - ). Интервальным рядом распределения называется ряд распределения единиц по признаку, заключенному в интервалы, с указанием частот встречаемости в каждом интервале. Элементы интервального ряда: 1й - градации значений признака в порядке возрастания или убывания, заключенные в интервалы ; 2й - число единиц совокупности в каждом интервале - . В целях наглядной иллюстрации статистические ряды распределения могут быть изображены в виде графиков. График ранжированного ряда называется огивой Гальтона. Он показывает интенсивность изменения признака в совокупности (равномерное или скачкообразное изменение признака, слабая или высокая интенсивность изменения, наличие или отсутствие резко отличающихся значений). График дискретного ряда распределения называется полигон, для интервального ряда распределения – гистограмма. По данным графиков полигона и гистограммы можно проанализировать равномерность распределения единиц совокупности по изучаемому признаку, наличие наиболее и наименее часто встречающихся значений признака, форму распределений (симметричная или асимметричная, близка к нормальному распределению или сильно отличается от него, и т.п.). По данным дискретного и интервального рядов могут быть определены также накопленные частоты («накопленная частота - S f » - это частота конкретного значения признака, сложенная со всеми частотами предыдущих значений признака). Накопленная частота признака показывает, сколько единиц совокупности имеют значение признака не выше данного (то есть меньше и равно данному значению). По значениям признака и накопленным частотам строят кумулятивный ряд распределения и изображают его в виде графика - кумуляты. Обобщение значений признака по единицам совокупности позволяет получить статистический показатель. Статистический показатель является характеристикой статистической совокупности в целом, в то время как признак – это характеристика отдельной единицы совокупности. К статистическим показателям рядов распределения относятся: 1)средние величины (их называют также показателями центральной тенденции), характеризующие типические черты совокупности; 2)показатели вариации, характеризующие изменчивость признака в совокупности и 3) показатели формы распределений, характеризующие асимметричность (скошенность) и островершинность (плосковершинность) изучаемого распределения относительно нормального распределения. Средние величины могут быть получены на основе всех индивидуальных значений признака («степенные средние» : средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, средняя кубическая - ), или же на основе отдельных значений признака («структурные средние»). К структурным средним относятся: модальное значение признака или мода ( ) – значение признака с наибольшей частотой встречаемости; медианное значение признака или медиана ( ) – значение признака, делящее ранжированный ряд единиц совокупности на две равные по численности группы; квартили Q1, Q2, Q3 - значения признака, которые делят ряд распределения на 4 части, равные по численности единиц. Понятие вариации является основополагающим в статистике. Вариация (колеблемость, изменчивость) – это способность отдельных признаков единиц совокупности менять свои значения при переходе от единицы к единице. Так, например, при переходе от участка к участку мы можем наблюдать изменение таких показателей, как содержание гумуса в почве, изменение площади или цены, и т.д. Показатели вариации могут характеризовать максимальную изменчивость значений признака (размах вариации) и среднюю изменчивость признака в совокупности (среднее линейное отклонение, среднее квадратичное отклонение, дисперсия признака). Именованные показатели (кроме дисперсии), деленные на среднюю величину , позволяют получить относительные показатели вариации (коэффициент осцилляции, коэффициент вариации). Относительные показатели вариации позволяют сравнивать вариацию признаков, выраженных в разных единицах измерения. Коэффициент вариации, кроме того, дает оценку однородности явления с точки зрения изучаемого варьирующего признака: если коэффициент вариации 33%, то совокупность признается однородной. Причиной вариации показателей является одновременное действие целого комплекса факторов. Если ставится задача изучения влияния одного конкретного фактора на величину варьирующего признака, то для этих целей может быть использована теорема сложения (разложения) объемов вариации. Суть теоремы заключается в следующем: если изучаемая совокупность единиц распределена на некоторое число групп, то общий объем вариации признака (Wобщ.) может быть разложен, то есть представлен как сумма двух составных частей: межгруппового объема вариации (Wмгр.) и внутригруппового объема вариации (Wвгр.). Математическая запись теоремы сложения вариации имеет вид: Wобщ= Wмгр.+ Wвгр.. Общий объем вариации представляет собой сумму квадратов отклонений значений признака всех единиц от среднего значения признака по совокупности в целом: .Общая вариация признака обусловлена комплексом причин: влиянием фактора, по которому совокупность была разделена на группы, а также влиянием всех прочих (случайных) факторов. Вариация межгрупповая проявляется в том, что средние значения признака в группах варьируют около общей средней, поэтому объем межгрупповой вариации представляет собой сумму квадратов отклонений групповых средних от общей средней. При этом учитывают число единиц по группам: , где nгр– численность группы. Межгрупповая вариация обусловлена действием фактора, положенного в основание группировки. Внутригрупповая вариация измеряется суммой квадратов отклонений индивидуальных значений признака (по каждой единице совокупности) от групповых средних: . Причиной внутригрупповой вариации является влияние всех прочих факторов, кроме того, по которому проведена группировка. Эмпирическое корреляционное отношение представляет собой корень квадратный из отношения межгрупповой вариации к общей вариации и отражает силу влияния группировочного признака на результативный притзнак. Типовые задачи модуля I Задача 1.1 Построение рядов распределения по одному признаку Условие: в таблице 1.1 представлены данные выборочного наблюдения о рынке строящегося жилья в Санкт-Петербурге: о цене 1 м2 общей площади квартир, о расстоянии до метро и о районе города. Требуется построить и изобразить графически: 1) атрибутивный ряд распределения квартир по району, 2) дискретный ряд распределения квартир по времени пешеходной доступности метро; 3) ранжированный и интервальный ряды распределения квартир по цене за 1 м 2. На основе рядов распределений сделать выводы. |