шпоры по статистике. 1. Предмет, задачи и методы исследования статистики как науки
Скачать 0.9 Mb.
|
34.Статистическое моделирование связи методом корреляционного и регрессионного анализа. Задача- определение формы влияния факторного признака на результат. Для её решения применяют методы корреляционного и регрессионного анализа. Корреляционныйанализсводится к установлению и измерению тесноты связи между признаками. Задача регрессионного анализа - выбор типа связи и установление степени влияния факторного признака на результат. По количеству факторов, включенных в рассмотрение, такие модели (уравнения) могут быть однофакторными, т.е. характеризующими связь 2-ух признаков, и многофакторными, когда изменение результативного признака описывают несколькими факторными. Наиболее распространен методпарнойкорреляции, т.е. однофакторный корреляционный и регрессионный анализ. При изучении связи экономических показателей используют уравнениерегрессии, чаще всего: - линейное: ; - гиперболическое: ; - показательное: ; - логарифмическое: , где - теоретическое значение результативного признака, aи b–коэффициент или параметры уравнения регрессии. Особое внимание уделяют линейной зависимости, что связано с ограниченностью вариации факторного признака и возможностью преобразования других уравнений в линейное путем замены переменных. Параметры aи bнаходят методом наименьших квадратов, в основе которого лежит требование минимальности суммы квадратов отклонения эмпирических данных от расчетных: - min. В результате решение системы уравнений: ; ; ; ; . Параметр b–смысл в показателе силы связи, а его знак указывает на направление связи. Для практического использования модели регрессии большое значение имеет адекватность модели, т.е. её соответствие фактическим и статистическим данным. Прежде всего проверяют значимость (существенность) параметров уравнения регрессии, т.е. не являются ли полученные значения параметров результатом действия случайных причин. Поскольку объём совокупных вариантов не превышает 30 единиц, то используем t-критерий Стьюдента, расчетное значение которого для параметра a: ; ; ; , где N–объём выборки. Вычисленные значения и сравнивают с табличным по распределению Стьюдента при числе степеней свободы N-2 и заданному . (табл.) и (табл.) характеризуют мат.возм. значения и носят случайный характер. Поэтому, если рассчетные значения превышают табличные, то практически маловероятно, что найденные значения параметров случайны. Для всей совокупности наблюд. значений рассчитывают среднюю квадратичную ошибку уравнения регрессии: , где m–число параметров в уравнении регрессии. Величину средней квадратичной ошибки уравнения регрессии сопоставляют со средним значением результативного признака: %. Если это отношение не превышает 10-15%, то считают, уравнение регрессии хорошо отображает взаимосвязь факторного и результативного признаков. Кроме того, сравнивают со средним квадратичным отклонением результативного признака: . Если , то использование уравнения регрессии является целесообразным. Величина служит одновременно показателем значимости и полезности регрессионной модели. Множественная линейная регрессия. Парная корреляция может рассматриваться как частный случай связи некоторой зависимой переменной от одной из множества зависимых. Когда требуется охарактеризовать связь всего множества независимых переменных с результативным признаком, говорят о множественной корреляции и множественной регрессии. Простейшей формой такой регрессии является линейная модель: где - коэффициенты регрессии, которые находят, решая систему линейных уравнений; - факторные признаки. При отсутствии теории, объясняющей связь факторного и результативного признаков, можно построить регрессионную модель, т.е. подобрать целое аналитическое выражение для описания этой связи. Это позволит, даже не зная сущности явления, воздействовать на результативный признак, регулируя в нужном направлении факторные. Факторы – теория – результативный признак Факторы – черный ящик – результат Необходимо установить все факторные признаки, оказывающие существенное влияние на результат. Отбор факторных признаков проводят методом экспертных оценок. Эти методы подразделяются на индивидуальныеиколлективные. Проводимая экспертиза представляет собой способ получения как индивидуального, так и коллективного мнения экспертов. В случае индивид. – оценка независима, в случае коллект. – зависима. При независимом получении экспертных оценок совокупность мнений экспертов трактуют как некоторую совокупность случайных оценок истинного состояния предмета обсуждения. Это позволяет при обработке индивид. оценок применять методы математической статистики и находить закон распределения оценки истинного состояния объекта. Наиболее распространенный – метод «мозговой атаки». Группа экспертов проводит дискуссию, в ходе которой каждый эксперт аргументированно обосновывает свою точку зрения. В результате обсуждения достигается некоторая единая компромиссная оценка для всей группы экспертов. При использовании метода «мозговой атаки» происходит возможность получения совокупных равноправных оценок. Метод «мозговой атаки» ориентирован на решение таких задач, которые не имеют монотонно изменяющейся предыстории или аналогов в прошлом. Прогнозирование тенденции изменения организационных форм и методов уравнения и зад. аналог. вида. Существенное место в теории экспертных оценок занимает метод «Дельфа». Он отличается тем, что в ходе экспертизы проводят индивидуальный многократный опрос экспертов. После каждого опроса выявляют такие оценки, которые в большей мере согласуются м/д собой. Тем экспертам, чьи оценки существенно отличаются от мнения большинства, предлагают либо скорректировать свои оценки, либо их аргументированно обосновать. Эта аргументация рассылается остальной группе экспертов, которые теперь могут скорректировать свои ранее сделанные оценки. Эту процедуру продолжают до тех пор, пока не будет достигнуто согласование оценок, либо их стабильное расхождение. Метод «Дельфы» позволяет получать совокупность оценок, чем при проведении индивидуальной экспертизы. Независимо от принятого метода экспертной оценки ей предшествует процедура формирования системы вопросов экспертам и формирование группы экспертов, члены которой должны быть людьми компетентными в соответствующей области знаний, чтобы обеспечить высокое качество оценки экспертами факторных признаков. Коэффициенты линейной модели показывают силу и направление воздействия факторного признака на результативный. Направление – это знак; сила – абсолютная величина. 35.Непараметрические методы оценки тесноты связи. Для применения корреляционного и регрессионного анализа все признаки (факторные и результативные) должны иметь количественное (числовое) выражение. Однако в статистике применяют такие непараметрические методы, с помощью которых устанавливают связь между качественными (атрибутивными) признаками. Область их применения шире, чем у параметрических, но задача анализа ограничивается установлением наличия связи и измерением её тесноты. Представление связей уравнениями (регрессионный анализ) невозможно. Довольно часто приходится анализировать связи м/д альтернативными признаками (взаимоисключающими). Тесноту связи в этом случае оценивают, вычисляя коэффициентассоциации или коэффициентконтингенции. Для его расчета 4-клеточную корреляционную таблицу: aba+b cdc+da+cb+da+b+c+d - коэффициент контингенции; - коэффициент ассоциации. ; . Чем ближе коэффициенты по абсолютной величине к 1, тем сильнее связаны м/д собой изучаемые признаки. Если , то это свидетельствует о наличии связи м/д качественными признаками. Для измерения тесноты зависимости м/д признаками используют ранговыекоэффициентыкорреляции, когда коррелируют не сами значения показателей, а их ранг, т.е. номера мест, зависимых в каждом ряду значений по возрастанию или убыванию. Чаще используют коэффициенты корреляции. - коэффициент корреляции Стермена. - коэффициент корреляции Кендэлла: . Где n–число наблюдений; - разность рангов по переменным xи yдля i–ой единицы совокупности; S–сумма рангов, рассчитываемых по рангам y. Для любого ранга определяют число рангов данного, из которого вычитают число рангов ниже данного и проводят эту операцию для всех единиц наблюдения. Коэффициенты изменяются в пределах . Чем ближе абсолютное значение к 1, тем теснее корреляция. 36. Статистика населения и трудовых ресурсов. Статистика населения является древнейшей отраслью статистики, интерес к которой возрастает. Предметом изучения является население и закономерности его развития.Население–совокупность людей, проживающих на данной территории.Основная цель расчета показателей статистики населения – оценка демографической ситуации, сложившейся на конкретной территории в определённое время и прогноз этой ситуации на будущее. В составпоказателей демографической ситуации входят: динамика численности населения, размещение и динамика естественного движения, миграция, состав и структура населения (по полу, возрасту, уровню образования, этническим группам и по социальному составу), продолжительность жизни и воспроизводство населения. Основным источником данных о численности и составе населения является перепись населения, которую проводят 1 раз в 10 лет. Кроме полной переписи с 1995 года в РФ – микроперепись–выборочное социально – демографическое обследование населения в этот промежуток. Расчёт демографических показателей связан с необходимостью определения среднегодовой численности населения на данной территории. Выбор способа расчёта зависит от исходных данных, но всегда надо помнить, что существует изменение численности населения во времени. 1) - начало периода; - конец периода. - средняя численность населения. 2) Если есть данные равноотстоящего моментного ряда, то средняявеличинапосреднейхронологической: . 3) Средняячисленностьподаннымнеравноотстоящихмоментоввремени, то используют формулу среднеарифметической взвешенной: . 4) Если нужно определить среднее значение численности за длительный период времени, то используют формулу средней логарифмической: . ; (n=0, 1, 2,..) ; ; ; - площадь под кривой. - площадь прямоугольника. . Численность населения не остаётся неизменной. Изменение численности вследствие рождения и смертей называется естественнымдвижением и основные его показатели – показатели рождаемости, смертности, естественного прироста и тесно с ними связанные показатели браков и разводов. Учитываемые прежде всего в абсолютном выражении, эти показатели уровень явления характеризовать не могут, так как зависят от численности населения. Поэтому для характеристики естественного движения и возможности проводить сравнения эти показатели приводят в расчёте на 1 тысячу человек населения, то есть выражают в промилле. Коэффициентрождаемости: ; Где N–количество родившихся в этом году, - средняя численность населения в этом году. Коэффициентсмертности: , гдеM–мёртвые. . В статистике показателем брачности является является коэффициент брачности: , где Б – число заключенных браков. Специальныйкоэффициентбрачности = , где - средняя численность бракоспособного населения. Путём деления численности населения на её площадь получают показательплотности. Среди группировок населения в социальной статистике акцент делают на демографические признаки: пол, возраст, семейное положение, национальность. Распределение по полу позволяет определить численность и долю мужчин и женщин в общей численности населения. В 1995 году из 148,3 млн населения 47% мужчин и 53% женщин. Группировка по полу по регионам зависит от экономической направленности данного региона. Для экономической статистики населения представляет интерес рынок труда, который включает экономически активное население (занятые, безработные). Показатели уровня занятости и безработицы, средней заработной платы являются важнейшими макроэкономическими показателями, характеризующими состояние развития экономики: . К занятымотносят лиц в возрасте от 16 лет и выше, которые в отчётном периоде работали в течение не менее 1 часа в день. Это позволяет рассчитать коэффициентзанятостинаселения: где - численность занятых на данную дату, общая численность. Коэффициентбезработицы: . На конец марта 1995 года 1млн x тысяч. Сегодня в Москве 200 тысяч малых предприятий. Статистика уровня жизни населения. Конечная цель развития любого прогрессивного общества – создание благоприятных условий для долгой здоровой и нормальной в материальном отношении жизни людей. Под уровнемжизни,благосостояниемпонимают обеспеченность населения необходимыми материальными благами и услугами, достаточный уровень их потребления и степень удовлетворения разумных потребностей. 4 уровняжизнинаселения: 1. достаток– состояние, при котором обеспечено всестороннее развитие человека; 2. нормальный – уровень, при котором потребление соответствует научно обоснованным нормам; 3. бедность– потребление на этом уровне обеспечивает сохранение работоспособности и способности воспроизводства (количество работоспособного населения); 4. нищета – состояние, при котором потребление обеспечивает лишь поддержание жизнеспособности человека. Проблема разработки некоего обобщенного показателя уровня жизни населения до сих пор не решена. В ООН разработали индексразвитиячеловеческогопотенциала (ИРЧП), который является составным и включает 3 показателя, отражающие наиболее важные аспекты уровня жизни: 1) ожидаемая продолжительность жизни при рождении: , где x–срок продолжительности жизни, лет, лет. 2) достигнутый уровень образования: , где - индекс грамотности среди взрослых, - индекс совокупной доли учащихся. стремится к 1 и чем ближе он к ней, тем выше степень развития человеческого потенциала в стране (Канада = 0,96, РФ = 0,769). 3) реальный ВВП в расчете на душу населения: , где x–зарплата, = 100$, = 40000$. |