Главная страница
Навигация по странице:

  • С. ЗАПОЛНЕНИЕ ПРОПУЩЕННЫХ ЗНАЧЕНИЙ ИЛИ ПОПРАВКИ НА НЕОТВЕТ: ЧТО ЛУЧШЕ 1. Случай «отсутствующих дневниковых дней»

  • Руководство по подготовке статистических данных об использовании времени для оценки оплачиваемого и неоплачиваемого труда


    Скачать 7.71 Mb.
    НазваниеРуководство по подготовке статистических данных об использовании времени для оценки оплачиваемого и неоплачиваемого труда
    Дата01.11.2022
    Размер7.71 Mb.
    Формат файлаpdf
    Имя файлаseriesf_93r.pdf
    ТипРуководство
    #766297
    страница23 из 54
    1   ...   19   20   21   22   23   24   25   26   ...   54
    78
    Литература по корректиров- кам, выполняемым методом постстратификации, носит, как правило, более узкоспециальный характер, чем некоторые работы, упомянутые ранее. Статьи таких авторов, как Deville и Särndal
    (1992) и Lundström и Särndal
    (1999), сложны, но полезны для понимания этого метода. В работе
    Djerf (1997) рассматриваются последствия такой корректиров- ки для некоторых оценок.
    A
    N
    w
    j
    f
    f
    hi j
    f
    hi j resp



    '
    ( )
    ( )
    ( )

    (4)

    162
    Руководство по подготовке статистических данных об использовании времени
    заноситься в таблицы каким-нибудь другим способом. Даже если такая полная классификация и имеется, возможности для использования всех переменных для постстратификации ограничены, поскольку число респондентов в каждом классе, как указывалось выше, должно быть достаточно большим. Неплохой альтернативой для постстратификации является выравнивание, так как оно позволяет задействовать все имеющиеся вспомогательные переменные.
    583. Выравнивание можно рассматривать как многовариантное продол- жение метода постстратификации. Предположим, что существуют три перемен- ные или измерения, по которым имеются контрольные показатели: например, пол, возраст и регион. Веса выравниваются по этим трем измерениям следую- щим образом. Вначале проводится постстратификация весов с поправкой на неответ по признаку пола, как указывалось выше. Вторым шагом будет пост- стратификация полученных весов по возрастным категориям. Третьим шагом будет постстратификация полученных весов по региональным показателям.
    Однократная корректировка всех переменных путем выравнивания означает завершение первой итерации. По завершении первой итерации сумма весов точно соответствует региональным контрольным показателям, но, вероятно, не будет точно соответствовать половозрастным показателям. При повторе- нии этого итеративного процесса несколько раз (например, следующим шагом будет постстратификация весов, полученных путем региональной постстрати- фикации, по контрольным показателям пола) весовые значения обычно сбли- жаются в том смысле, что при дальнейших корректировках они не претерпят значительных изменений. Веса, полученные благодаря этому процессу, — это окончательные выровненные веса, и сумма весов, классифицированных по лю- бой из переменных, используемых при выравнивании, должна примерно соот- ветствовать контрольным показателям.
    584. В процессе выравнивания иногда возникают проблемы, но зачастую их можно избежать путем принятия простых мер предосторожности. Конт- рольные показатели должны быть логически последовательными в том смысле, что в приведенном выше примере суммарное число лиц, распределенных по полу, должно равняться суммарному числу лиц, распределенных по возрасту и региону. Пропущенные значения переменных в выборке, соответствующей контрольным показателям, должны ликвидироваться, возможно, путем запол- нения отсутствующих пунктов. Переменные в обследовании использования времени должны измеряться так же, как они измеряются при расчете контроль- ных показателей. Рекомендуемое минимальное число респондентов в каждом классе для каждой переменной, используемой при выравнивании (например, как женщины, так и мужчины), нередко составляет порядка 40. Иногда одна и та же переменная используется в качестве компонента более чем в одном изме- рении, и в некоторых случаях это может повлечь за собой проблемы. Например, одно измерение выравнивания может иметь классы, образованные путем пере- крестной классификации половой и возрастной категорий, а другое — классы, образованные путем перекрестной классификации половой и региональной категорий. Этот подход может иметь свои преимущества, но он может также осложнить задачу сближения весовых значений.
    585. Если выравнивание до полного сближения осуществить невоз- можно из-за ограниченности вычислительных мощностей, количество итера- ций можно сократить (иногда это называют неполным выравниванием). В этом случае важное значение может иметь порядок действий при выравнивании. На- пример, предположим, что в вышеуказанном примере процесс был остановлен после одной итерации. Сумма весов должна в точности соответствовать реги- ональным контрольным показателям, но не половозрастным. Если один набор

    Взвешивание и оценивание в обследованиях использования времени
    163
    показателей считается более важным, чем другой, то окончательная корректи- ровка должна производиться именно по этой контрольной переменной.
    586. Если можно произвести перекрестную классификацию контроль- ных показателей, то тогда появляется возможность для постстратификации либо выравнивания весов. Если число контрольных переменных крайне огра- ничено, а число респондентов в каждой ячейке полной перекрестной классифи- кации этих переменных достаточно велико, то предпочтительнее использовать метод постстратификации. Если имеется больше переменных либо у перекрес- тной классификации существует множество ячеек с небольшим числом рес- пондентов, то следует отдать предпочтение выравниванию. Даже в тех случаях, когда производится выравнивание, есть возможность улучшить корректировку путем перекрестной классификации некоторых переменных для создания уров- ней в измерении, используемом для выравнивания. Например, предположим, что отмечена существенная разница в использовании времени молодыми муж- чинами и молодыми женщинами. В этом случае создать измерение для выравни- вания с уровнями, определяемыми перекрестной классификацией по возрасту/
    полу, будет лучше, чем использовать при выравнивании отдельные измерения по возрасту и полу.
    587. Особая ценность выравнивания для обследований использования времени объясняется наличием естественных контрольных показателей по временнóму измерению. Например, количество будних и выходных дней в году известно, количество конкретных дней недели известно и количество дней в месяце и времени года также известно. Если веса выражаются в человеко-днях, то все эти переменные могут использоваться при выравнивании. О важности наличия контрольных показателей, выраженных в человеко-днях, говорилось в разделе, посвященном постстратификации.
    588. В качестве примера выравнивания по временнóму измерению пред- положим, что количество будних дней в году — 261, выходных — 104, и мы хотели бы скорректировать свои данные по этим показателям. Если использо- вание времени мужчинами и женщинами неодинаково для будних и выходных дней, то для улучшения оценок следует провести перекрестную классификацию временного измерения и полового. В этом случае измерение «пол/время» имеет четыре уровня: будние дни для женщин (261 N
    f
    ), выходные дни для женщин
    (104 N
    f
    ), будние дни для мужчин (261 N
    m
    ) и выходные дни для мужчин (104 N
    m
    ).
    Аналогичным образом, можно провести перекрестную классификацию воз- растных категорий с числом времен года. Например, если зима длится 90 дней, то первым уровнем будет число зимних дней для молодых людей (90 N
    у
    , где N
    у
    — количество молодых людей в общей численности населения).
    589. Важность выравнивания очевидна, поскольку учет временнóго из- мерения может увеличить число уровней в каждой из стандартных демогра- фических переменных. Такое увеличение числа уровней проблематично при постстратификации, поскольку в каждой ячейке перекрестной классификации существуют ограничения на объем выборки. Даже если для постстратифика- ции имеется крайне мало демографических переменных, следует подумать о применении метода выравнивания для того, чтобы полнее использовать вре- менные переменные. Например, предположим, что единственным известным контрольным показателем для страны является общая численность населения,
    N. Выравнивание по дням недели (значение каждого из семи уровней будет со- ставлять N, умноженное на число дней недели в году) и месяцу года может все же оказаться полезным. В этом случае даже одна итерация в процессе вырав- нивания имеет важное значение с точки зрения учета эти важных временных измерений в оценках.
    ´
    ´

    164
    Руководство по подготовке статистических данных об использовании времени
    590. Как отмечалось выше, план действий в области постстратификации или выравнивания должен быть увязан с планом выборки. Эта взаимосвязь ста- новится еще более насущной в свете необходимости иметь минимальное число респондентов на каждом уровне по всем контрольным переменным. Например, при отсутствии достаточного числа наблюдений по каждому дню недели весá не могут быть выровнены по этому измерению.
    4.
    Поправки на вариативность весов
    591. Если процедуры взвешивания, подобные описанным выше, имеют следствием значительные вариации в весовых значениях, то оценки могут иметь слишком большие ошибки выборки или с большей долей вероятности пострадать из-за малого числа наблюдений. По этим причинам веса, и в час- тности вносимые в них поправки на неответ и постстратификацию, должны оцениваться на каждом этапе, и должны быть изучены методы для уменьшения вариативности.
    592. Дать рекомендации по конкретным процедурам уменьшения вари- ативности весов — задача не из легких. Тем не менее ввиду важности решения этой проблемы в обследованиях использования времени в настоящем разделе даются некоторые указания на этот счет. Кроме того, здесь представлены ме- тоды, которые могут использоваться для определения ситуаций, в которых степень вариации весов может оказаться достаточно большой для того, чтобы потребовать корректировок. а)
    Причины вариативности оценочных весов
    593. Вариации в весах могут возникнуть на любом этапе формирования выборки или оценивания. Лучшей защитой от чрезмерной вариативности яв- ляется применение разумных принципов формирования выборки и эффектив- ных процедур сбора данных. Например, предположим, что число отвечающих критериям индивидов в домохозяйствах значительно варьируется, а планом выборки предусмотрен отбор одного индивида в каждом домохозяйстве. Вес для индивида в домохозяйстве, где имеется пять отвечающих критериям чело- век, будет в пять раз больше веса для индивида, выбранного из домохозяйства, состоящего лишь из одного человека. Выбор двух индивидов в домохозяйствах с бóльшим числом отвечающих критериям лиц может значительно уменьшить вариативность весов. Аналогичным образом, достижение высоких и стабиль- ных показателей числа ответивших из разных типов домохозяйств и индивидов уменьшает вероятность того, что поправки на неответ повлекут за собой боль- шие вариации в весах.
    594. Даже если план и порядок формирования выборки хорошо проду- маны, проблема вариативности весов все же может возникнуть. Часто бывает так, что в силу сочетания ряда факторов значения, полученные в результате кор- ректировки базовых весов на неответ, могут иметь слишком высокую степень вариативности. Снова возьмем ситуацию, когда в домохозяйстве выбирается только один индивид, отметив, что аналогичные проблемы могут возникать и тогда, когда в выборку включается более одного индивида. Весовые значения для индивидов в домохозяйствах со многими отвечающими критериям лицами сравнительно велики, и если показатель неответа для этих домохозяйств выше среднего, то значения, полученные в результате корректировки весов (как об- ратной величины вероятности выбора) на неответ, могут стать причиной того, что веса в этих случаях будут относительно большими.

    Взвешивание и оценивание в обследованиях использования времени
    165
    b)
    Борьба с чрезмерной вариативностью: уменьшение весов
    595. Одним из способов сокращения чрезмерной вариативности весов является уменьшение весовых значений для группы респондентов с макси- мальными весами. Можно подумать и об использовании других методов, но уменьшение — простая процедура, которая непосредственно решает проблему вариативности весов
    79
    . Уменьшение весов подразумевает сокращение весовых значений и, возможно, распределение суммы уменьшенных весов на другие ответившие единицы. В перераспределении весов может и не быть необходи- мости, если в процессе взвешивания будет производиться постстратификация или выравнивание по контрольным показателям. Например, предположим, что веса с поправкой на неответ по всем индивидам, выбранным в домохозяйствах с более чем пятью отвечающими критериям лицами, — самые большие веса, и принимается решение их уменьшить. Веса для индивидов, выбранных в до- мохозяйствах с шестью и более членами, будут уменьшены до оговоренного максимального уровня, и разница между первоначальными и уменьшенными весами может быть перераспределена на индивидов, выбранных в домохозяйс- твах с менее чем пятью членами. Поскольку уменьшение весов приводит к сме- щению оценок, последствия этой процедуры необходимо оценивать в каждом конкретном случае. В данном примере уменьшение весов приведет к заниже- нию оценки среднего размера домохозяйства, и все характеристики, связанные с размером домохозяйства, также окажутся искаженными.
    596. Прежде чем подготовить руководящие указания по уменьшению весов, изучаются эмпирические правила для определения ситуаций, в которых вариативность весов может оказаться достаточно большой для того, чтобы по- требовать их уменьшения. Все эти правила должны применяться внутри клас- сов или слоев выборки. Другими словами, если индивиды выбираются неоди- наково в зависимости от региона, то изучение выпадающих из общей картины весов должно производиться внутри этого региона. Обычным способом явля- ется ограничение сферы исследования весовыми поправками, а не конечными результатами применения весов, хотя этот метод может и не выявить все чрез- мерно большие веса.
    597. Простой метод выявления чрезмерной вариативности весов состоит в графическом представлении весов или весовых поправок. Поскольку наиболь- шую проблему создают большие веса, их уменьшение может потребоваться в тех случаях, если веса для небольшого процента случаев намного больше ве- сов для подавляющего большинства случаев. Например, веса, в три-четыре раза превышающие средний вес, вполне могут быть уменьшены. Такую же инфор- мацию можно получить путем сортировки весов от большего к меньшему. Если имеется несколько случаев, в которых веса намного превышают среднее весо- вое значение, следует подумать об их уменьшении. Другой подход состоит в от- слеживании коэффициента вариативности (КВ) весов на каждом этапе взвеши- вания. Если на каком-либо этапе КВ резко возрастет (скажем, на 20 или более процентов), то необходимо внимательно изучить весовые поправки с целью вы- яснить, не привносятся ли на данном этапе некие факторы, обусловливающие такую дифференциацию. Для подобной оценки может использоваться метод графического представления весов. Если на том или ином этапе взвешивания веса уменьшаются, сопоставление КВ весов до и после уменьшения помогает оценить эффективность этой процедуры. Если КВ весов после уменьшения со- кратился по сравнению с первоначальным КВ менее чем на 10 процентов, про- цедура уменьшения, по-видимому, не слишком эффективна.
    598. Ниже представлены некоторые руководящие указания по уменьше- нию весов. Следует помнить о том, что это всего лишь руководящие указания и что перед использованием процедуры уменьшения необходимо внимательно
    79
    Kish (1992) приводит доводы в пользу изучения проблемы чрезмерной вариативности весов и предлагает некоторые методы для этого. Potter (1990) разбира- ет вопросы уменьшения весов и другие меры, используемые для сокращения вариативности весов.

    166
    Руководство по подготовке статистических данных об использовании времени
    изучить весовые значения для любых конкретных нужд. Указания состоят в следующем:
    веса следует уменьшать только в том случае, если очевидны преиму-
    • щества их уменьшения;
    необходимость уменьшения должна изучаться внутри классов или
    • слоев, имеющих примерно один и тот же коэффициент выборки;
    число случаев уменьшения весов должно быть сведено к минимуму;
    • следует оценить смещение, возникающее в результате уменьшения ве-
    • сов, и изучить возможность перераспределения уменьшенных весов таким образом, чтобы свести его к минимуму.
    599. Изучение вариативности весов в ходе обследований использова- ния времени особенно важно потому, что такое обследование, помимо реше- ния задач формирования выборки и взвешивания, возникающих при стандар- тных обследованиях домохозяйств, предполагает формирование выборки во временнόм измерении. Например, если на этапе выравнивания используется день недели, а активность респондентов в воскресенье значительно ниже, чем в другие дни недели, то выровненные веса могут подвергаться значительным вариациям. В этом случае для целей выравнивания имеет смысл объединить не- которые дни недели между собой, чтобы не допустить появления относительно больших весов. Если большие весовые значения для воскресений встречаются только в нескольких случаях, более эффективным способом может оказаться уменьшение весов. В этом случае веса для воскресений могут быть перераспре- делены на другие воскресенья или другие выходные дни с целью свести к ми- нимуму смещение оценок, возникающее вследствие уменьшения весов, при том понимании, что в выходные время используется по-иному, чем в будние дни.
    С. ЗАПОЛНЕНИЕ ПРОПУЩЕННЫХ ЗНАЧЕНИЙ ИЛИ ПОПРАВКИ
    НА НЕОТВЕТ: ЧТО ЛУЧШЕ?
    1.
    Случай «отсутствующих дневниковых дней»
    600. Другим методом учета отсутствующих данных в обследованиях ис- пользования времени является заполнение пропущенных значений. Наиболее часто оно используется для замены отсутствующих значений по конкретным пунктам, когда выбранный индивид дал ответы на большинство пунктов обсле- дования. Поскольку заполнение предполагает замену отсутствующих значений на уровне пунктов, оно может оказаться более эффективным для уменьшения смещения оценок, связанного с неполучением ответа, чем поправки на неответ, которые применяются на уровне респондентов
    80
    601. Обследования использования времени, в которых выбранным ин- дивидам предлагается отчитаться более чем по одному дню, представляют до- полнительную трудность с точки зрения заполнения пропусков. Например, предположим, что респондент отчитался об использовании времени за один включенный в выборку день, но не отчитался за другой. Одним из вариантов будет заполнение значений за отсутствующий день путем подстановки дан- ных, представленных тем же лицом. Это может показаться привлекательным, поскольку донор
    1   ...   19   20   21   22   23   24   25   26   ...   54


    написать администратору сайта