Лекци статистика. Лекции статистика. Курс лекций по статистике Тема Предмет, метод и задачи статистики Термин
Скачать 1.76 Mb.
|
2.2. План статистического наблюдения Как уже отмечалось выше, планомерность является основой статистического наблюдения, поэтому его проведение должно основываться на детально разработанном плане. План статистического наблюдения состоит из двух частей, первая включает программно-методологические вопросы, а вторая организационные вопросы. Программно-методологическая часть плана включает: определение объекта наблюдения; определение единицы объекта наблюдения; составление программы статического наблюдения; составление программы разработки материалов наблюдения; проектирование формуляра наблюдения; определение времени проведения статистического наблюдения и его критического момента; составление инструкции. При планировании статистического наблюдения необходимо, прежде всего, определить его объект и единицу. Объектом статистического наблюдения называется та совокупность, о которой должны быть собраны нужные сведения. Объектами наблюдения могут быть, например, коммерческие банки, сельхозпроизводители, промышленные предприятия, студенты, население и т. п. Единицей наблюдения называют составной элемент объекта наблюдения, являющийся носителем признаков, подлежащих регистрации. Единицей наблюдения может быть человек, фермерское хозяйство, коммерческий банк. Программа наблюдения — это перечень признаков, подлежащих регистрации при проведении статистического наблюдения. К программе наблюдения предъявляется ряд требований, которым она должна удовлетворять, а именно: а) программа должна включать только существенные признаки, характеризующие изучаемый объект; б) в программу не следует включать второстепенные вопросы, которые могут затруднить работу по сбору информации, а в дальнейшем ее обработку и анализ; в) разрабатывая программу, необходимо стремиться к полноте собираемых сведений; г) в программу наблюдения должны включаться только такие вопросы, на которые действительно можно получить объективные и достаточно точные ответы; д) в программу иногда следует включать вопросы контрольного характера, служащие целям проверки и уточнения собираемых сведений. Вопросы программы могут дополняться статистическим подсказом, т. е. вариантами ответов. Подсказ может быть закрытым или открытым. Закрытый подсказ подразумевает ряд ответов, из которых респондент должен выбрать один или несколько. При открытом подсказе респондент может выбрать один или несколько ответов из предлагаемого перечня или сформулировать на специально выделенном поле формуляра свой собственный ответ. При планировании обследования как правило составляют и программу разработки собранных материалов, которая конкретизирует задачи статистического наблюдения, показывает, какие данные необходимо собирать и в каком виде оформлять результаты их обработки. Для записи ответов на вопросы программы конструируется формуляр наблюдения. Формуляр наблюдения разрабатывается специально для записи ответов на вопросы программы и представляет собой особым образом разграфленный лист (листы) бумаги, в котором содержится перечень вопросов программы, свободные места для записи ответов на них, а также для записи шифров (кодов) ответов. Особое внимание при разработке формуляра следует уделить формулировке вопросов. Они должны быть сформулированы кратко и четко, не должны вызывать разночтения. Помимо вопросов программы формуляр включает в себя титульную и адресную части. В титульной части содержится наименование статистического наблюдения, указывается наименование органа, проводящего наблюдение, кем и когда утвержден этот формуляр, иногда и номер, присвоенный ему в общей системе формуляров наблюдений, осуществляемых данным органом статистики. В адресной части предусматривается запись точного адреса единицы или совокупности единиц наблюдения и ряд других сведений. Однако насколько четко не был бы составлен формуляр, к нему обычно составляется инструкция, которая включает совокупность разъяснений и указаний, главным образом по программе статистического наблюдения. Инструкция может быть представлена в виде отдельного документа (часто — брошюры) или изложена на формуляре наблюдения. Инструкцию следует писать кратко, просто, пояснения и указания должны быть ясными и четкими. При организации статистического наблюдения необходимо решить вопрос о времени проведения данного наблюдения, включая выбор сезона, установления срока (периода) наблюдения, а в некоторых случаях и так называемого критического момента. Период наблюдения — это время, в течение которого осуществляется регистрация признаков у единиц наблюдения по установленной программе. Продолжительность периода наблюдения зависит от многих факторов, среди которых можно выделить: размер и состояние объекта наблюдения, объем и сложность программы наблюдения. Для наиболее подвижных объектов изучения, таких, как население, например, устанавливается критический момент статистического наблюдения. Критическим моментом называется момент времени, по состоянию на который производится регистрация собираемых сведений. На практике критический момент обычно назначается на начало периода наблюдения. В целях успешного проведения наблюдения разрабатываются организационные вопросы плана статистического наблюдения, которые фиксируются в организационном плане. Организационный план предполагает решение следующих вопросов: объект наблюдения (дается его определение, описание, указываются отличительные признаки); цели и задачи наблюдения; орган наблюдения, осуществляющий подготовку и проведение наблюдения; место и сроки наблюдения; подготовительные работы к наблюдению включающие в себя подбор и обучение кадров, составление списков единиц изучаемой совокупности, в некоторых случаях эти работы включают рекламную компанию проводимого наблюдения и т. д.; порядок проведения наблюдения; порядок приема и сдачи материалов наблюдения и представления предварительных и окончательных итогов наблюдения; финансирование и материально-техническое обеспечение работ. 2.3. Точность статистического наблюдения Под точностью в статистике понимают степень соответствия данных, полученных в результате статистического наблюдения, реальным их значениям. Возникающие расхождения между данными статистического наблюдения и реальными значениями признака называются ошибками. Ошибки определяются как разность или как отношение между этими значениями. Как правило, ошибки возникают в результате следующих причин: ошибки при регистрации, ошибки при измерении. Следует отметить, что ошибки наблюдения наиболее опасны, поскольку их достаточно тяжело исправить, и они оказывают огромное влияние на дальнейшие расчеты. В статистике выделяют ошибки регистрации и ошибки репрезентативности. Ошибки регистрации возникают вследствие неправильного установления фактов в процессе наблюдения, или ошибочной их записи, или того и другого вместе. Ошибки регистрации могут иметь место как при сплошном, так и при несплошном наблюдении. При несплошном наблюдении возникают так называемые ошибки репрезентативности, или как их еще называют ошибки представительности. Они заключаются в том, что значения признаков по отобранной выборочной совокупности не отражают реально существующей картины. В зависимости от характера ошибки наблюдения бывают случайными и систематическими. Случайные ошибки возникают случайным образом, в результате опечаток, описок, оговорок и т. п. Например, при регистрации регистратор в записи даты рождения вместо 15 июня написал 15 июля. При достаточно большом числе наблюдений благодаря действию закона больших чисел эти ошибки более или менее взаимно погашаются. Систематические ошибки наиболее опасны, поскольку действуют только в одном направлении и приводят к сильному искажению данных. Наиболее показательной систематической ошибкой являются ошибки при переписи населения, которые заключаются в том, что населению свойственно округлять свой возраст на цифры оканчивающиеся на 5 или 0. К этому же виду ошибок можно отнести сокрытие реальных размеров финансовых результатов производственно-хозяйственной деятельности экономическими субъектами, стремление респондентов указать заниженное значение своего возраста и т. п. С целью выявления ошибок проводят контроль полученных материалов. С этой целью после проведения наблюдения весь собранный материал проверяют на полноту охвата объекта наблюдением и на качество заполнения формуляров и других документов наблюдения. В последнем случае используют два вида контроля: логический и арифметический. При контроле полноты охвата объекта наблюдения устанавливается, от всех ли единиц совокупности, подлежащих наблюдению, получены данные. Если выявлена неполнота охвата объекта наблюдением, дальнейшие действия зависят от того, представляется возможным восполнение пробелов или нет. Логический контроль состоит в сопоставлении между собой ответов на вопросы формуляра наблюдения и выяснения их логической совместимости. При обнаружении несовместимых ответов пытаются путем дальнейших сопоставлений с ответами на другие вопросы или каким-либо иным путем установить, какой из ответов является неправильным. Арифметический контроль состоит в проверке различных расчетов, результаты которых проведены в формуляре наблюдения, в частности, итогов, вычисления процентов, расчетов средних величин и т. п. 2.4. Контрольный тест 1. Основными принципами статистического наблюдения являются: а) планомерность, массовость, научная организация; б) повторяемость, закономерность, организация; в) планомерность, закономерность, массовость; г) повторяемость, организованность, научное обоснование; 2. Одной из форм статистического наблюдения является: а) отчетность; б) социологический опрос; в) регистрация транспортных средств в ГИБДД; г) выборы президента РФ. 3. По охвату единиц совокупности статистическое наблюдение бывает: а) сплошное; б) непосредственное; в) непрерывное; г) единичное. 4. Критическим моментом статистического наблюдения называется: а) период времени, в течение которого проводится наблюдение; б) момент времени, по состоянию на который проводится наблюдение; в) момент времени, с которого начинается наблюдение; г) момент времени, когда должно окончится наблюдение. 5. План статистического наблюдения включает: а) программно-методологический раздел; б) учебный раздел; в) разработочный; г) подготовительный раздел. 6. Единовременным называется наблюдение: а) проводимое только один раз; б) проводимое время от времени по мере необходимости; в) проводимое только один раз в год; г) проводимое только в течение одного дня. 7. Перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения, называется: а) статистическим формуляром; б) планом наблюдения; в) инструментарием наблюдения; г) программой наблюдения. 8. Объектом статистического наблюдения называется: а) совокупность единиц наблюдения, подлежащих статистическому исследованию; б) первичная ячейка совокупности, от которой должны быть получены сведения в процессе наблюдения; в) совокупность явлений и процессов, реально существующих во времени и пространстве; г) население РФ 9. Ошибки репрезентативности возможны только при: а) сплошном наблюдении; б) выборочном наблюдении; в) единовременном наблюдении; г) периодическом наблюдении. 10. При большом объеме совокупности в определенной степени взаимопогашаются: а) арифметические ошибки наблюдения; б) логические ошибки наблюдения; в) систематические ошибки наблюдения; г) случайные ошибки наблюдения. 2.5. Тренировочные задания
1.2. Требования, предъявляемые к статистическим данным. Формы и виды статистического наблюдения Основной задачей государственной статистики является формирование государственных информационных ресурсов. Это достигается посредством статистического наблюдения. Адекватность отражения важнейших социально-экономических процессов, происходящих в стране, во многом зависит от используемых методов сбора и обработки первичных данных. В настоящее время нет стандартного определения качества данных, принято отмечать два основных требования к материалам статистического наблюдения: достоверность и сопоставимость. Достоверность — это соответствие первичных данных фактическому положению. Исходя из практической потребности, достоверность обычно описывают в терминах ошибок. Для предупреждения ошибок наблюдения выявляют их виды и причины возникновения. Ошибки наблюдения подразделяют на два вида: ошибки регистрации и ошибки репрезентативности. Ошибки регистрации — это погрешности, которые возможны независимо от вида наблюдения. Они бывают случайными и систематическими (тенденциозными). Существуют преднамеренные ошибки, причиной которых становится сознательное искажение данных. Непреднамеренные ошибки, как правило, носят случайный характер, они могут возникнуть в результате низкой квалификации работников. Ошибки репрезентативности присущи только выборочному наблюдению. Причина их возникновения заключается в том, что выборочная совокупность недостаточно точно отображает состав всей изучаемой совокупности. Подробнее о таких ошибках говорится в гл. 5. Сопоставимость статистических данных рассматривается в разных аспектах: сопоставимость в рамках одного наблюдения; сопоставимость данных разных наблюдений; сравнимость с данными прошлых исследований. Причины различий могут быть вызваны организационно-методологическими факторами, влияющими на изменение методики сбора данных, времени регистрации и т.п. В настоящее время устанавливается более широкое понятие качества статистических данных с точки зрения их адаптации к потребностям пользователей. К компонентам такого определения качества, наряду с сопоставимостью и достоверностью, относятся востребованность, доступность, интерпретируемость. Достижение необходимого уровня качества результатов статистической деятельности требует соблюдения научно разработанных методик сбора, обработки и распространения статистических данных (включая соответствие принятым международным стандартам). Статистическое наблюдение — первая стадия статистического исследования, представляющая собой организованный по единой программе сбор данных о социально-экономических явлениях и процессах путем регистрации их существенных признаков с целью получения первичной статистической информации. Различают формы организации и виды статистического наблюдения, источники получения первичных данных и способы сбора данных. К формам организации относятся: отчетность; специально организованное наблюдение. Виды наблюдения делят: — по времени регистрации фактов на непрерывное (текущее), периодическое и единовременное; охвату единиц на сплошное и несплошное. Источниками получения первичных данных являются: непосредственное наблюдение; документальный способ; опрос. К способам сбора данных относятся: экспедиционный; саморегистрация; корреспондентский. Организация статистического наблюдения предполагает решение определенных программно-методологических вопросов: конкретизация цели и формулировка задач статистического исследования; составление программ наблюдения и разработки полученной статистической информации; ограничение обследуемой совокупности (установление ее рамок); создание статистической основы (для выборочного наблюдения — основы выборки), определение ее единицы и единицы наблюдения; выбор метода наблюдения (для выборочного наблюдения — установление оптимального процента отбора); формирование выборочной совокупности; сбор и редактирование первичной информации, включающее логический и арифметический способы контроля, основанные на соотношениях между связанными пунктами вопросника и допустимыми значениями статистических признаков, представленных респондентами. Количественные признаки могут выражаться дискретными или непрерывными величинами, соответственно, и вариационный ряд будет либо дискретным, либо интервальным (непрерывным в пределах интервала). Так, количество детей в семье может выражаться только целыми числами, а вес человека может отличаться от веса другого на сколь угодно малую величину, определяемую точностью измерения. При построении вариационного ряда непрерывного признака невозможно указать абсолютно точное значение варианта, поэтому совокупность распределяется по интервалам его значений. Интервалы можно брать как равные, так и неравные. Для каждого из них указывается частота или частость, т.е. абсолютное или относительное число единиц, у которых значение признака находится внутри данного интервала. Первый и последний интервалы рядов чаше всего берутся открытыми. Использование открытых интервалов удобно, когда в совокупностях встречается незначительное число единиц с очень малыми или очень большими значениями вариантов, резко отличающимися от всех остальных значений. Если построен ряд с равными интервалами, то частоты дают представление о том, как заполнен единицами совокупности тот или иной интервал. При сравнении частот ряда с неравными интервалами для характеристики их заполненности рассчитывают плотность распределения. Средняя плотность в интервале — это частное от деления частоты или частости на величину интервала: в первом случае получается абсолютная, во втором — относительная плотность распределения. Средняя плотность показывает, сколько единиц (или сколько процентов единиц) совокупности приходится на единицу изменения варианта. Для характеристики распределения используют также накопленные частоты. Если вместо абсолютных частот взять частости, то аналогично получим накопленные частости. Накопленная частота (частость) для данного варианта или для верхней границы данного интервала получается суммированием (накапливанием) частот (частостей) всех предшествующих интервалов, включая данный. Накопленная частота показывает, какое число единиц имеет значение признака, не большее данной варианта или верхней границы интервала. Частота, частость, плотность и накопленная частота вариационного ряда — это различные функции от величины варианта. Зависимость частот, иди, точнее, плотностей распределения от величины вариантов в идеальном случае может быть представлена в виде некоторой функции, изображаемой графически кривой определенною вида. Любое реальное распределение можно также изобразить схематически в виде некоторой кривой, воспроизводящей основные особенности данного распределения. В зависимости от вида кривых, изображающих распределение, выделяют несколько основных типов распределений. Прежде всего распределения по виду их графического изображения можно разделить на одновершинные и многовершинные. К одновершинным относятся те, в которых один, обычно центральный, вариант имеет наибольшую частоту (точнее, наибольшую плотность распределения), частоты же остальных вариантов убывают по мере удаления от центрального. Если частоты убывают одинаково и справа и слева от центрального значения, то такие распределения называются симметричными. Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называют асимметричными, выделяя при этом распределения, растянутые вправо и влево. Степень асимметрии может быть различной: от совершенно незначительной до крайней, при которой наибольшая частота относится к одному из крайних значений вариантов — самому большому или, наоборот, наименьшему. Различные виды распределений представлены на рис. 3.1. РИСУНОК НЕ ОТСКАНИРОВАЛСЯ Идеальное симметричное распределение крайне редко встречается на практике. Достаточно близки к нему распределения мужчин и женщин по несу или росту (при достаточно большом количестве людей, включенных в совокупность). Основная масса распределений, с которыми приходится иметь дело экономисту. — это асимметричные распределения с разной степенью асимметрии. Многовершинные распределения - это распределения, в которых несколько центров, т.е. такие, у которых несколько максимумов частот. Многовершинность распределения часто является свидетельством того, что совокупность состоит из неоднородных, с точки зрения изучаемою признака, единиц. Поэтому, убедившись в том. что распределение имеем более чем один максимум частоты, исследователь должен тщательно проверить, можно ли считать однородными единицы совокупности. В практической деятельности очень важно фактическое распределение (структуру совокупности) привести к известному теоретическому. Обычно в экономических расчетах апроксимируют к таким теоретическим распределениям, как: нормальное равномерное показательное распределение Пуассона (для дискретных распределений) Возникает задача проверки соответствия выбранной кривой для представления фактической структуры. т.е. проверки тою, действительно ли различия между теоретической и эмпирической кривой распределения настолько малы, что их можно считать случайными, а не закономерными. Наиболее известный метод проверки соответствия фактического ряда распределения теоретическому — применение критерия согласия Пирсона. Определяем …. Сравниваем Х²расч с Х²табл при заданном уровне значимости и числе степеней свободы. Если Х²расч < Х²табл , можно считать, что фактическое распределение адекватно теоретическому. Например, имеется следующий интервальный ряд распределения рабочих цеха по уровню заработной платы: Уровень заработной платы, руб. Численность рабочих До 200 10 200-250 20 250-300 40 300-350 20 350 и более 10 Итого 100 Предполагая, что распределение рабочих но уровню заработной платы является нормальным, рассчитаем теоретические частоты распределения (табл. 3.1) Расчет теоретических частот распределения
Здесь f (t) — плотность нормального распределения. Для определения используются либо таблицы f (t),. либо непосредственно формула плотности f (t) Рассчитаем х и а метолом моментов, где центральный момент А = 275, а величина интервала i = 50; x¯ = 275 + 50-0 = 275; Ð = 50 √(120/100)-0 =54,77 где а — уровень значимости; v — число степеней свободы; L — число групп; r — число параметров распределения; X²расч < X²табл = распределение является нормальным. Аналитическая (факторная) группировка предназначена для установления тесноты связи между взаимодействующими признаками — факторным и результативным. Она позволяет выявить наличие и направление связи, а также измерить ее тесноту и силу. Методологическими вопросами построения факторной группировки являются выбор группировочного признака, определение числа групп и величины интервала, выбор системы показателей для характеристики групп. Если типологическая группировка, преследующая цель разграничения качественно однородных совокупностей, должна отвечать их объективной качественной природе, то для аналитической группировки, цель которой исследование взаимосвязи признаков, такого объективного критерия нет. Поэтому в качестве группировочного чаше всего принимают факторный признак, выделенный на основе априорного анализа. Интервалы в аналитической группировке берутся преимущественно равные либо равнонаполненные (группы с приблизительно одинаковой частотой). Величина интервала рассчитывается так же, как при построении структурной группировки. Среди показателей групп обязательным является среднее значение результативного показателя по каждой группе. Теснота связи оценивается сравнением вариации этих средних значений с обшей дисперсией результативного показателя. Эмпирический коэффициент детерминации определяется как |