Главная страница

Руководство по подготовке статистических данных об использовании времени для оценки оплачиваемого и неоплачиваемого труда


Скачать 7.71 Mb.
НазваниеРуководство по подготовке статистических данных об использовании времени для оценки оплачиваемого и неоплачиваемого труда
Дата01.11.2022
Размер7.71 Mb.
Формат файлаpdf
Имя файлаseriesf_93r.pdf
ТипРуководство
#766297
страница22 из 54
1   ...   18   19   20   21   22   23   24   25   ...   54
75
Sharot (1986) дает сравнительно простое введение в теорию взвешивания, которое может оказаться полезным для тех, кто незнаком с этим методом. Более полная и узкоспециальная инфор- мация содержится в работе Brick and Kalton (1996).
´

Взвешивание и оценивание в обследованиях использования времени
157
точно как для респондента, так и для этого интервала. Ситуация усложняется, когда респонденты предоставляют данные за более чем один интервал. В этом случае записанные данные должны находиться на уровне «индивид/временной интервал». Таким образом, респондент, опрошенный и отчитавшийся за два дня, будет иметь две записи в файле. У каждой из этих записей будет один оце- ночный вес, но эти веса не могут быть одинаковыми, как станет ясно позднее.
Таким образом, сделанное ранее заявление, что единый вес для каждого интер- вью — это все, что необходимо, — подразумевает, что интервью проводится на уровне «индивид/временной интервал», а не на уровне индивида. Кроме того, как указывалось выше, более чем один вес может потребоваться в том случае, если по результатам обследования подготавливаются статистические данные по более чем одной единице наблюдения (например, человеко-дни, индивиды, домохозяйства).
564. Умение создавать веса, позволяющие получить практически несме- щенные оценки демографических показателей, требует тщательной координа- ции процедур обследования с процедурами статистического анализа. Для взве- шивания необходимо, чтобы вероятности выбора отслеживались по каждой записи, с тем чтобы необходимые для этого данные надлежащим образом счи- тывались и увязывались со сделанными записями. Аналогичным образом, кор- ректировка с учетом фактора неответа требует, чтобы данные из выборочной совокупности или другого источника были увязаны со всеми записями. Для таких корректировок, как постстратификация, важно внимательно подойти к разработке инструментария для сбора данных, с тем чтобы обследование и ис- точник данных для постстратификации были увязаны между собой. Наличие взаимосвязи между операциями и статистическими методами — залог успеха любого обследования.
1.
Базовые веса
565. Стандартная процедура расчета базовых весов в выборочном об- следовании домохозяйств состоит в том, чтобы вывести этот вес как обратную величину вероятности выбора единицы. При многоступенчатых выборках весá создаются на каждой ступени, а затем перемножаются для получения общего веса для единицы выборки.
566. Для примера предположим, что определена выборка ПЕВ, что внутри выбранных ПЕВ определена выборка домохозяйств и что внутри выборки до- мохозяйств определена выборка индивидов. Общий вес для индивида является производным от трех показателей, каждый из которых обратно пропорциона- лен вероятности выбора на соответствующей ступени. Вес для выбранного ин- дивида имеет следующий вид:
w
(hi)j
= w
h
• w
hi
• w
hij
(1)
где w
h
обратная величина вероятности выбора ПЕВ h, w
hi
— обратная вели- чина вероятности выбора домохозяйства i внутри ПЕВ h, а w
hij
вероятность выбора индивида j из домохозяйства i в ПЕВ h.
567. Например, если ПЕВ h отбирается с вероятностью, пропорцио- нальной размеру, который равен 0,10, то ее вес w
h
= 10. Далее предположим, что внутри ПЕВ h имеются 50 домохозяйств и четыре из них выбираются. Вес каждого из этих выбранных домохозяйств в ПЕВ, w
hi
, составляет 12,5 (= 50 : 4).
Если в домохозяйстве для обследования выбирается каждый отвечающий кри- териям индивид, то w
hij
= 1. В этом случае общий вес w
(hi)j
= 125 (= 10 × 12,5 × 1).
Если, с другой стороны, в каждом домохозяйстве выбирается только один ин- дивид, а домохозяйство i насчитывает трех человек, то w
hij
= 3 для выбранного

158
Руководство по подготовке статистических данных об использовании времени
индивида j. В целом, если каждый отвечающий критериям индивид в домохо- зяйстве имеет одну и ту же вероятность выбора, то w
hij будет равняться числу отвечающих критериям индивидов в домохозяйстве, разделенному на число лиц, входящих в выборку.
568. Вес, показанный в уравнении (1), — это типичный вес для обследо- вания домохозяйств, но он не связан напрямую с фактором времени. В обследо- вании использования времени этого веса было бы достаточно, если бы данные по выбранному лицу собирались за весь период обследования. Для того чтобы учесть выборку временных интервалов, необходимо ввести дополнительный весовой коэффициент. Например, предположим, что выбранному индивиду предлагается отчитаться за два конкретных дня в течение года. В этом случае временной весовой коэффициент для подсчета оценок человеко-дней будет равняться 365 дням года, разделенным на два дня, образующих выборку. В це- лом, временной весовой коэффициент w
hijk
— это количество отвечающих кри- териям временных единиц в периоде, разделенное на число этих единиц, по ко- торым опрашивается индивид. Общий вес для оценивания человеко-дней (или любой другой единицы времени) имеет следующий вид:
w
(hi)j
= w
h
• w
hi
• w
hij
•w
hijk
(2)
569. Эта формула для расчета весового значения по фактору времени позволяет осуществлять выборку временных интервалов с использованием раз- ных критериев отбора. Например, если для конкретного индивида выбирается один будний и один выходной день, то эти два интервала имеют разные веса.
Правильным весом, w
hijk
, для буднего дня будет количество будних дней в году, а соответствующим весом для выходного дня, w
hijk
, — количество выходных дней в году. Каждая запись в файле с данными по человеко-дням будет иметь один вес, соответствующий этому дню.
570. Эта формула также позволяет варьировать число выбранных вре- менных интервалов для выбранных индивидов. Например, поскольку значение
w
hijk
является уникальным для выбранного индивида, оно позволяет проводить обследования, при которых одни лица опрашиваются за один день, другие — за два дня, а третьи — за всю неделю.
571. Базовый вес, приведенный в уравнении (2), вполне подходит для расчета оценок человеко-дней. Эта же процедура может использоваться для подсчета оценок по домохозяйствам, но без коэффициента, связанного с опре- делением выборки индивидов внутри домохозяйства.
572. Показанные выше стандартные процедуры взвешивания могут иметь некоторые нежелательные последствия. Веса могут иметь чрезмерную вариативность, обусловленную определением выборки индивидов внутри до- мохозяйства или выборки единиц времени в течение года. Кроме того, полу- ченные оценки могут не иметь ожидаемого распределения по дням недели или сезонам года. Часть этих проблем могут и должны решаться на этапе планиро- вания выборки, но некоторые из них так или иначе придется решать при по- мощи процедуры взвешивания. Далее в настоящем разделе рассматриваются методы решения проблем подобного рода.
2.
Поправки на неответ
573. Вес, приведенный в уравнении (2), подразумевает, что по каждой единице выборки на каждом этапе были собраны полные данные. Очевидно, что речь идет о некоей идеальной ситуации, тогда как на практике почти всегда приходится сталкиваться с неполучением ответов. Например, с выбранным до- мохозяйством не удается установить контакт либо оно отказывается участво-
´
´
´
´

Взвешивание и оценивание в обследованиях использования времени
159
вать в обследовании, и в результате данные об использовании времени этим конкретным домохозяйством не собираются. Существует целый ряд методов кор- ректировки для заполнения пропусков, связанных с неполучением ответов
76
, но здесь рассматриваются только поправки по классам взвешивания. Поправки по классам взвешивания сравнительно легко вносить, и они весьма эффективны в плане решения проблемы неответов от единиц выборки.
а)
Поправки по классам взвешивания
574. Первым шагом при определении поправок по классам взвешивания будет формирование групп или классов единиц выборки, которые, как ожида- ется, будут иметь сходные характеристики с точки зрения вероятности учас- тия в обследовании или применительно к другим ключевым переменным об- следования. Для этого переменные, используемые для формирования классов, должны быть известны по всем выбранным единицам, а не только по единицам, предоставившим ответы. Вторым шагом будет деление показателя суммы весов единиц выборки на сумму весов ответивших единиц в каждом классе. Если все единицы в классе имеют одинаковый вес, то этим показателем будет просто от- ношение числа выбранных единиц выборки к числу ответивших единиц. Этот показатель и есть поправка на неответ, которая применяется ко всем ответив- шим единицам в классе. Неответившим единицам присваивается нулевой вес либо они просто ликвидируются из аналитического файла.
575. Например, предположим, что некоторые домохозяйства не пред- ставили ответов в ходе обследования использования времени, а классами кор- ректировки на неответ являются регионы страны (r = 1, 2, …, R). Уравнение
(2) должно быть видоизменено путем умножения w
hi
, веса выбранного домохо- зяйства i внутри ПЕВ h, на соответствующую региональную поправку на неот- вет, которая рассчитывается следующим образом:
(3)
где в сумму входят все выбранные домохозяйства в регионе r, а δ
i
равняется одному, если единица дает ответ, и нулю в противном случае. Числитель этой дроби представляет собой сумму весов для записей по конкретному региону
(r); знаменатель — сумму весов по той же серии записей, но в сумме учитыва- ются только веса для респондентов. Эта же процедура может использоваться на каждом этапе взвешивания для учета неответа от единиц на этом этапе. Базо- вый вес на этом этапе заменяется значением, полученным путем применения к базовому весу поправки на неответ. Итоговым показателем будет по-прежнему общий вес, как в уравнении (2), однако эти веса представляют собой веса, скор- ректированные на неответ на каждом этапе, и в аналитический файл включа- ются только записи по респондентам. b) Проблемы при расчете поправок на неответ
576. При расчете поправок на неответ возникает ряд проблем, заслужи- вающих особого внимания. Одна из них связана с количеством респондентов в каждом классе; оно должно быть достаточно большим для того, чтобы пока- затель поправки был стабильным. Обычно в каждый класс включается как ми- нимум 20–30 респондентов, но рекомендуется использовать классы с бόльшим числом респондентов. Другим моментом является размер поправки на неответ.
76
Существует множество статей, посвященных корректировке данных выборочных обследова- ний на неполучение ответа. Elliot
(1991) дает введение в данную тему, написанное понятным язы- ком. Bailar, Bailey и Corby (1978),
Chapman, Bailey и Kasprzyk (1986) и Tremblay (1986) освещают прак- тические методы корректировки данных на неполучение ответа, уделяя особое внимание методам корректировки по классам взвешивания.
NR
w
w
hh r
hi
i r
hi i
i r
,







160
Руководство по подготовке статистических данных об использовании времени
Полезное практическое правило гласит, что поправка на неответ для конкрет- ного класса должна не более чем вдвое превышать общую среднюю поправку.
Во избежание этих двух ситуаций классы можно комбинировать или опреде- лять заново. Важное значение имеет также выбор переменной, которая будет использоваться для формирования классов. Зачастую и по респондентам, и по нереспондентам известны только отдельные переменные, так что выбор весьма ограничен. Например, может оказаться невозможным выйти за пределы клас- сов, разделяющих единицы на городские и сельские. При наличии множества переменных для определения классов могут использоваться более сложные ме- тоды, такие, как алгоритмы поиска и логический регрессионный анализ
77
577. План некоторых обследований использования времени предпи- сывает выбранному индивиду заполнить основной вопросник и представить данные об использовании времени по выбранным временным интервалам
(нередко за полный день) в дневнике или каком-либо другом формуляре. При этом возникает опасность того, что некоторые лица отчитаются по основному вопроснику, но не заполнят дневник использования времени. В данном случае поправка по классу взвешивания, w
hij
, для учета отсутствующих данных об ис- пользовании времени способна существенно уменьшить смещение оценки, вы- званное неполучением ответа. Значительное уменьшение смещения возможно, если данные из основного вопросника имеют переменные, которые хорошо коррелируются с использованием времени и могут быть использованы для формирования классов взвешивания. При наличии множества переменных мо- жет оказаться полезным изучение самых важных из них при помощи алгоритма поиска или аналогичного метода, описанного выше.
578. Важное значение имеют классы корректировки на неответ, приме- няемые к лицам, которые были выбраны для обследования за несколько единиц времени (например, дней), но отчитались только по некоторым из этих дней.
Одним из способов является формирование классов будних дней и выходных дней таким образом, чтобы эти классы имели разный корректирующий мно- житель. Логическим продолжением этого метода может быть формирование классов по дням недели и сезонам года, если объемы выборки в каждом из этих классов будут достаточными. Если обследование допускает подмену дней, то при взвешивании эти подмены должны рассматриваться как наблюдаемые ве- личины, с тем чтобы избежать чрезмерной корректировки за пропущенные интервалы. Другой способ — это подстановка в отсутствующие дни данных из других ответов, полученных в домохозяйстве или от того же индивида. По су- ществу, при этом подходе пропущенные дни трактуются как неответ по пункту, а не как неответ от единицы. Преимущества и недостатки заполнения пропу- щенных значений для компенсации такого неответа рассматриваются далее в настоящей главе.
3.
Корректировки, выполняемые методом постстратификации
579. Еще одной стандартной процедурой взвешивания во многих об- следованиях домохозяйств является постстратификация весов с учетом извес- тных демографических показателей. Более полным определением этого типа корректировки является калибровочное оценивание. Калибровка под известные демографические показатели используется для уменьшения смещения оценок, связанного с охватом, частичной компенсации смещения, связанного с неотве- том, которое не устраняется путем взвешивания, и согласования оценок с из- вестными показателями. Она также позволяет сократить ошибку выборки для оценок, хорошо коррелирующихся с известными контрольными показателями.
Постстратификация — это несложный, прямолинейный метод калибровки.
77
Некоторые из этих методов опи- сывают Brick и Kalton (1996).
´

Взвешивание и оценивание в обследованиях использования времени
161
Выравнивание — это метод для распространения этой идеи на два или более измерений. Мы начнем с постстратификации, а затем рассмотрим метод вырав- нивания ввиду его потенциально важной роли в обследованиях использования времени.
а)
Постстратификация
78
580. Во многих странах общую численность населения с разбивкой по возрасту, полу, региону и некоторым другим признакам можно узнать из послед- ней переписи или прогнозов, составленных на основе этой переписи. В качестве простого примера предположим, что известны общие показатели с разбивкой по полу, где N
f
— число женщин и N
m
— число мужчин в стране. Коэффициент постстратификации для женщин имеет следующий вид:
и коэффициент для мужчин:
A
N
w
j
m
m
hi j m
hi j resp



'
( )
( )
( )
( )

5
где w'
(hi)j
— вес с поправкой на неответ для индивида j, δ
f
(j) равняется единице, если респондент j женского пола, и нулю в противном случае. Аналогичным образом, δ
m
(j) равняется единице, если респондент j мужского пола, и нулю в противном случае, а сумма весов в знаменателях охватывает всех ответивших индивидов. Вес с поправкой на неответ для всех ответивших женщин умножа- ется на А
f
для получения постстратифицированного веса, а вес для ответивших мужчин умножается на А
m
. Соображения в отношении минимального числа ответов в каждом классе, размера поправок и методов формирования классов, которые рассматривались в разделе о неответах, актуальны и для разработки классов постстратификации.
581. Контрольные показатели в обследованиях использования времени отличаются от показателей, применяемых в классических обследованиях домо- хозяйств. Если предметом анализа являются человеко-дни, то контрольные по- казатели должны также выражаться в человеко-днях. Например, коэффициент постстратификации для человеко-дней (женщины) имеет следующий вид:
A
N
w
j
f
f
hij k
f
hi k resp




365 6
'
( )
( )
( )
( )

где w'
(hij)k
— вес с поправкой на неответ для индивида j за временной интервал k, значение δ
f
(j) было определено выше, а сумма весов в знаменателе охватывает все человеко-дни, по которым представлены ответы. В числителе данной дроби стоит количество человеко-дней в году для женщин.
b)
Выравнивание
582. Когда демографические показатели имеются по нескольким пере- менным, осуществить полную перекрестную классификацию этих переменных может оказаться невозможным из-за того, что данные могли собираться или
1   ...   18   19   20   21   22   23   24   25   ...   54


написать администратору сайта