Главная страница
Навигация по странице:

  • Возможная процедура для применения в случае отсутствия контекстной переменной «место занятия» по указанному в дневнике виду деятельности

  • Е. ЗАПОЛНЕНИЕ ПРОПУЩЕННЫХ ЗНАЧЕНИЙ 1. Общие соображения

  • Руководство по подготовке статистических данных об использовании времени для оценки оплачиваемого и неоплачиваемого труда


    Скачать 7.71 Mb.
    НазваниеРуководство по подготовке статистических данных об использовании времени для оценки оплачиваемого и неоплачиваемого труда
    Дата01.11.2022
    Размер7.71 Mb.
    Формат файлаpdf
    Имя файлаseriesf_93r.pdf
    ТипРуководство
    #766297
    страница20 из 54
    1   ...   16   17   18   19   20   21   22   23   ...   54
    Источник: Australian Bureau of Statistics (1997 a).
    ´
    ´

    Обработка данных обследования использования времени
    145
    f)
    Множественные записи
    514. Респонденты могут указывать в колонке «главный/первичный вид деятельности» два или несколько занятий. Ниже перечисляются основные ва- рианты записи множественных видов деятельности:
    случай 1.

    Занятия, имеющие место в одно и то же время (т. е. одновре- менные виды деятельности);
    случай 2.

    Занятия, следующие одно за другим на протяжении ряда интервалов, причем одно из них является моментальным или почти
    «мгновенным», а другое — намного более продолжительным по срав- нению с первым (например, респондент почистил зубы и лег спать);
    случай 3

    . Последовательные виды деятельности, записанные в один интервал;
    случай 4.

    Два вида деятельности, которые были записаны как одно- временные, но явно являются последовательными.
    515. В случае 1 потребуется определить, какое из занятий является глав- ным, а какое второстепенным, и могут возникать некоторые ситуации, требу- ющие редактирования для обеспечения последовательного применения правил приоритизации при кодировании занятий. Что касается последовательных ви- дов деятельности (случаи 2–4), то каждое из занятий должно рассматриваться как главное, а бюджет времени должен распределяться между занятиями в соот- ветствии с некоторым правилом. В случае 2, если моментальное занятие имело слишком короткую продолжительность, правило может состоять в том, чтобы не кодировать его вообще. В случае 4 не исключена возможность того, что два занятия будут фактически рассматриваться как одно (например, готовила еду и паковала в коробки завтраки на продажу).
    g)
    Второстепенные виды деятельности
    516. Есть две ситуации, в которых может потребоваться редактирование сообщений о второстепенных видах деятельности: когда в качестве второсте- пенной деятельности записывается более одного занятия; и когда о второсте- пенной деятельности не сообщается. Вариации в сообщениях о множественных второстепенных видах деятельности аналогичны тем, которые имеют место для главной деятельности. Таким образом, процедуры редактирования и кодирова- ния будут аналогичны тем, которые рассматривались в предыдущем разделе.
    517. В случае, если сообщается о множественных видах деятельности, важно установить правила приоритизации, при помощи которых будет выби- раться одно или несколько занятий. С учетом того, что многие важные занятия нередко рассматриваются респондентами как второстепенные и не записыва- лись бы вообще, если бы предполагался только сбор данных о главных видах деятельности, необходимо особенно внимательно относиться к такой деятель- ности, как неоплачиваемый труд на дому, уход за детьми, уход за престарелыми и уход за больными и инвалидами.
    518. Если следовать тем же принципам, то в отсутствие информации о второстепенных видах деятельности может возникнуть необходимость в про- верке того, действительно ли деятельность, о которой нередко не сообщается,
    — как правило, уход за детьми или уход за престарелыми, больными или инва- лидами — имела место. Это может быть сделано путем проверки соответствую- щей контекстной и справочной информации (например, «с кем»; состав семьи).
    При наличии признаков неполноты информации необходимо принять решение о том, использовать ли имеющиеся данные для редактирования или заполнения отсутствующих значений либо пометить запись на предмет дальнейшей про- верки.

    146
    Руководство по подготовке статистических данных об использовании времени
    h)
    Контекстуальная информация
    519. Данные по контекстным переменным могут либо отсутствовать вовсе, либо быть несовместимыми с другими записями в дневнике. В случае их отсутствия кодировщик должен подобрать соответствующий код на основе описания занятия или другой информации из дневника, вспомогательных воп- росников или подтверждающих эти сведения дневников членов домохозяйства.
    В таблице 14 изложена процедура, которая может применяться, если контекст- ная переменная «место занятия» по указанному в дневнике занятию отсутс- твует (Australian Bureau of Statistics, 1997 a, p. 11).
    520. В этом примере код «00» представляет собой заранее установлен- ный код для отсутствующих данных по этой контекстной переменной.
    521. Принятие решения о том, следует ли редактировать контекстную переменную или подставлять ее значение, во многом зависит от имеющейся информации и той аналитической цели, которую преследует эта переменная.
    Примером того, каким образом аналитические цели определяют спецификации редактирования и заполнения значений, служат спецификации контекстной переменной «для кого» в австралийском обследовании использования времени
    1997 года. Одна из аналитических целей этого обследования касалась эпизодов добровольного труда и ухода за членами семьи. Таким образом, процедура ре- дактирования была основана на нижеследующих принципах (Australian Bureau of Statistics, 1997 a, p. 10).
    Таблица 14
    Возможная процедура для применения в случае отсутствия контекстной переменной «место занятия» по
    указанному в дневнике виду деятельности
    Шаг 1
    Можно ли логически вывести эту переменную из характера деятельности?
    Если да, кодировать соответствующим образом
    Если нет, перейти к шагу 2
    Шаг 2
    Можно ли логически вывести эту переменную из места занятия, указанного в дневнике перед данным видом деятельности?
    Если да, кодировать соответствующим образом
    Если нет, перейти к шагу 3
    Шаг 3
    Можно ли логически вывести эту переменную из информации во вспомогательных дневниках?
    Если да, кодировать соответствующим образом
    Если нет, перейти к шагу 4
    Шаг 4
    Информация отсутствует. Применить код “00”
    Источник: Australian Bureau of Statistics (1997 a).
    522. Информация, представленная респондентом, может изменяться лишь в том случае, если:
    необходимо понять цель главного вида деятельности; другими сло-
    • вами, если в противном случае добровольный труд или уход за чле- нами семьи не будут признаны таковыми;
    дневник изобилует информацией;
    • цель деятельности может быть истолкована по-иному вследствие того,
    • что информация «для кого» неверна.
    523. В рамках того же обследования был разработан сложный комплекс руководящих принципов для редактирования и кодирования контекстной пе-

    Обработка данных обследования использования времени
    147
    ременной «с кем», предполагающих использование информации из других кон- текстных переменных (например, место занятия) и из дневников других членов домохозяйства (ibid., pp. 14–16).
    i)
    Другие трудные случаи
    524. Необходимо разработать процедуры редактирования для случаев, которые, как ожидается, вызовут затруднения у кодировщиков и редакторов.
    Эти случаи будут зависеть от используемой классификации, аналитической основы обследования, правил приоритизации для определения главных заня- тий и того, как люди обычно отчитываются о своих занятиях. Для того чтобы оценка этих ситуаций была приведена в некую систему, необходимо изучить опыт стран, находящихся в аналогичном положении, и провести методологи- ческие исследования, предварительные проверки, контрольные проверки про- цедур опроса и кодирования занятий. Ниже приводится перечень некоторых возможных случаев:
    занятия, не поддающиеся кодированию;
    • разноречивая информация в дневниках, заполненных членами одного
    • домохозяйства;
    кодирование постоянных занятий, например пассивного ухода за
    • детьми;
    описание занятия, к которому респондент не имел отношения. Напри-
    • мер, приход друзей; уход жены на работу;
    кодирование занятий, связанных с перемещением;
    • кодирование «ожидания»;
    • кодирование кратких по продолжительности занятий, например «при-
    • шел домой»;
    в сообщении не указана цель занятий, которые имеют разные коды в
    • зависимости от цели. Например, плавание может ассоциироваться с физическими упражнениями, спортом, соревнованием или оздорови- тельными занятиями.
    3.
    Сверка записей с другими данными обследования
    525. Как было показано выше, некоторые процедуры редактирования предполагают использование вспомогательных вопросников респондента, а также дневников других членов домохозяйства для заполнения отсутствующих данных в дневниках. И наоборот, личные вопросники могут редактироваться с использованием информации из дневника. Одна из важных процедур пред- полагает проверку логической последовательности данных о трудовой деятель- ности респондента. Например, респондент мог указать в дневнике, что он или она занимались трудовой деятельностью, но в личном вопроснике на вопросы об участии в трудовой деятельности были даны ответы «нет». В данном случае эти две записи должны быть увязаны друг с другом.
    526. Однако помимо соображений, связанных с редактированием, ре- зультаты логической проверки подобного рода могут заложить основу для оценки методов сбора данных об участии в трудовой деятельности. Собственно говоря, в некоторых странах такая оценка и является одной из целей обследова- ния использования времени.

    148
    Руководство по подготовке статистических данных об использовании времени
    Е. ЗАПОЛНЕНИЕ ПРОПУЩЕННЫХ ЗНАЧЕНИЙ
    1.
    Общие соображения
    527. Заполнение пропущенных значений, как уже говорилось в этой главе,
    — это процедура, используемая для решения проблемы отсутствующих, невер- ных или логически непоследовательных ответов, выявленных в ходе редакти- рования. Она осуществляется путем подмены некоторых ответов или отсутс- твующих значений в редактируемом формуляре для того, чтобы выходные данные имели правдоподобный и логически последовательный вид. Некоторые проблемы отсутствия данных устраняются на более раннем этапе обследования путем установления повторного контакта с респондентом или проверки пер- воначальных формуляров. Однако в целом решить все проблемы отсутствия данных на этих ранних этапах невозможно в силу таких причин, как увеличе- ние нагрузки на респондентов, дополнительные расходы и сжатые сроки. В этом случае для устранения оставшихся недостатков в редактировании на этапе об- работки практикуется заполнение пропущенных значений, поскольку весьма желательно получить в итоге полный и логически последовательный файл с за- полненными значениями.
    528. Хотя заполнение пропусков может повысить качество итоговых данных благодаря исправлению отсутствующих, неверных или логически не- последовательных ответов, важное значение имеет выбор подходящей методо- логии заполнения, так как некоторые методы заполнения не позволяют сохра- нить взаимосвязь между переменными или могут внести реальные искажения в распределение выборки.
    529. Процедуры заполнения значений могут быть автоматизирован- ными или компьютеризованными, осуществляться вручную или путем сочета- ния обоих методов. Качественная процедура заполнения сводит к минимуму искажения, возникающие из-за несоблюдения всех желаемых значений, имеет
    контрольный след для целей оценки и обеспечивает внутреннюю последова- тельность подставленных значений. Качественные процедуры заполнения объективны, эффективны, осуществляются в автоматическом режиме и могут быть воспроизведены. В соответствии с принципами Феллеги-Хольта (Statistics
    Canada, 1998 b, p. 38) изменения вносятся в минимальное число полей с целью гарантировать, чтобы итоговая запись прошла все проверки.
    530. Заполнение пропущенных значений особенно эффективно в тех слу- чаях, когда единица выборки дала ответы по другим пунктам, тесно связанным с пунктом, по которому значения отсутствуют, и эти пункты применяются в процедуре заполнения. Необходимо делать пометку всякий раз, когда подстав- ляется некое отсутствующее значение, независимо от выбранной процедуры.
    Эта практика имеет важное значение, поскольку иногда в ходе аналитической работы могут быть выявлены неожиданные взаимосвязи, и при помощи ука- занных пометок можно удостовериться в том, что эти взаимосвязи не являются результатом непродуманной методики заполнения.
    531. В настоящем разделе не ставится цель обобщить обширную лите- ратуру о заполнении пропущенных значений при обследовании выборочных домохозяйств
    68
    . Некоторые типы стратегий заполнения, которые использова- лись в стране в ходе обследований домохозяйств, имеет смысл взять на воо- ружение для заполнения значений в обследованиях использования времени.
    Цель настоящего раздела — сформулировать некоторые простые правила и заострить внимание на методах, которые легко применить и которые могут оказаться полезными на этапе анализа данных в обследованиях использова- ния времени.
    68
    См., к примеру, Организация
    Объединенных Наций (2002 год).
    Kalton и Kasprzyk (1986) дают систематизированный обзор методов заполнения значений и взаимосвязи между ними.

    Обработка данных обследования использования времени
    149 532. Методы заполнения пропущенных значений иногда делят на де- терминистские и стохастические. Детерминистские методы определяют, каким образом следует подставить значение для каждого отсутствующего пункта, не добавляя никакого компонента случайной вариации. Классическим примером детерминистского метода является заполнение по среднему, когда любое от- сутствующее значение заполняется средней величиной для респондентов. Сто- хастические методы заполнения привносят некоторый элемент случайности.
    Одним из примеров стохастического метода является последовательный под- бор. При таком методе единица выборки, заполнившая данный пункт, выби- рается случайно, и значение, данное этим респондентом, подставляется взамен отсутствующего. В обследованиях использования времени обычно предпочи- тают использовать стохастические методы, поскольку они позволяют лучше сохранить распределение, чем методы детерминистские. Например, заполнение по среднему нередко имеет следствием сосредоточение значений у средней ве- личины выборки, что искажает оценку квантилей, а при последовательном под- боре этого не происходит.
    533. Последовательный подбор — популярный стохастический метод заполнения, и существует множество способов его реализации. В способах, описанных в настоящем Руководстве, используются классы заполнения, весьма схожие с классами, используемыми при взвешивании поправок на не- получение ответа (см. главу IX). После того как эти классы будут определены, указанный метод предполагает подстановку взамен отсутствующего пункта значения, данного респондентом из того же класса. «Донором» является за- пись, из которой берется значение, подставляемое взамен отсутствующей записи, называемой «получателем». Для выбора доноров был разработан ряд методов, включая последовательный и случайный методы и иерархический упорядоченный подбор. Важное значение при выборе одного из этих методов имеет способность контролировать число раз, когда конкретный формуляр может использоваться в качестве донора. Многократное использование доно- ров снижает точность оценок.
    534. Для иллюстрации этой процедуры ниже приводится пример после- довательного подбора, который сравнительно легко осуществить на практике.
    Первый шаг — это разделение всех случаев на классы заполнения и их случай- ная сортировка внутри классов. В каждом классе сохраняется небольшое число потенциальных доноров, скажем, три. Когда встречается запись с отсутствую- щим значением, то взамен него подставляется одно из сохраненных значений.
    Если эта запись пригодна для заполнения данного пункта, она заменяет собой ранее сохраненное значение в группе потенциальных доноров и может исполь- зоваться для заполнения других отсутствующих значений. Этот метод замены элементов группы ограничивает число раз, когда запись может использоваться в качестве донора.
    535. Выбор классов заполнения имеет важное значение для качества ста- тистических данных. Общий принцип определения классов гласит, что классы должны создаваться с использованием данных, хорошо коррелирующихся с пе- ременной, которая будет подменяться. Цель состоит в создании классов таким образом, чтобы все случаи внутри класса имели одно и то же распределение.
    Образуемые подобным образом классы также сохраняют взаимосвязь между переменными, используемыми при заполнении. Например, предположим, что время, затрачиваемое женщинами на уход за детьми, — важный статистичес- кий показатель, оцениваемый в ходе обследования, а данные об использовании времени по некоторым выбранным респондентам отсутствуют. Для создания классов заполнения могут использоваться следующие переменные: пол и воз- раст взрослого, наличие в семье детей младшего возраста, трудовая деятель-

    150
    Руководство по подготовке статистических данных об использовании времени
    ность, уровень дохода и география. Переменные класса должны определяться по каждому пункту обследования и должны учитывать конкретные условия в стране. При выборе переменных для классов может оказаться полезным изуче- ние статистических таблиц, которые планируется построить для целей анализа.
    Переменные, используемые для определения строк в таблицах (нередко это по- яснительные переменные), обычно хорошо подходят для создания классов за- полнения. Разумеется, классы должны также выбираться таким образом, чтобы исключить вероятность подстановки невозможных значений. Например, если некоторые пункты предлагается заполнить только женщинам, то пол является той переменной класса, которая должна обязательно включаться, с тем чтобы не допустить подстановки невозможного значения.
    2.
    Процедуры заполнения пропущенных значений в обследованиях
    использования времени
    536. Для изучения некоторых конкретных процедур заполнения значе- ний, которые могут оказаться подходящими в ситуациях, возникающих при обследованиях использования времени, предположим, что обследование ис- пользования времени включает в себя два компонента — основной вопросник и дневник использования времени. Входящие в выборку взрослые вначале за- полняют основной вопросник с такими пунктами, как возраст, пол, семейное положение, место рождения, род занятий, доход, количество членов семьи, ко- личество детей в семье и т. д. Выбранному взрослому предлагается также запол- нить дневник использования времени за один день.
    537. Применительно к пунктам, отсутствующим в основном вопроснике, можно использовать метод последовательного подбора для подстановки от- сутствующих основных переменных, которые, как ожидается, определят строки таблиц, подготавливаемых по результатам обследования. Может быть принято решение о том, чтобы пропущенные значения по другим пунктам основного вопросника не заполнялись.
    538. Если выбранный взрослый не заполняет дневник, вместо подста- новки всех отсутствующих данных об использовании времени рекомендуется использовать взвешивание. Если респондент заполняет большинство пунктов дневника, но оставляет пустыми один-два временных интервала, следует поду- мать о заполнении пропусков. В этом случае может пригодиться метод последо- вательного подбора, и классы могут быть созданы с использованием перемен- ных из основного вопросника, таких, как возраст, пол, семейное положение, род занятий и т. д. Отсутствующие данные могут подменяться данными по другим выбранным взрослым в том же классе, которые заполнили все временные ин- тервалы в дневнике. Поскольку отсутствующие данные о занятиях относятся к конкретному временнόму интервалу, донорами должны служить отмеченные в дневнике занятия из того же интервала. Если для какого-либо конкретного лица отсутствуют данные по нескольким интервалам, необходимо подставить все отсутствующие интервалы для того же лица.
    539. В некоторых ситуациях, когда отсутствуют данные, рекомендуется использовать не заполнение значений, а взвешивание для учета фактора непо- лучения ответа. Два конкретных случая — когда описан только один дневнико- вый день из двух назначенных и когда входящие в выборку члены домохозяйс- тва не представили ответов — разбираются в главе IX.
    ´
    ´

    Обработка данных обследования использования времени
    151
    1   ...   16   17   18   19   20   21   22   23   ...   54


    написать администратору сайта