Руководство по подготовке статистических данных об использовании времени для оценки оплачиваемого и неоплачиваемого труда
Скачать 7.71 Mb.
|
Источник: Australian Bureau of Statistics (1997 a). ´ ´ Обработка данных обследования использования времени 145 f) Множественные записи 514. Респонденты могут указывать в колонке «главный/первичный вид деятельности» два или несколько занятий. Ниже перечисляются основные ва- рианты записи множественных видов деятельности: случай 1. • Занятия, имеющие место в одно и то же время (т. е. одновре- менные виды деятельности); случай 2. • Занятия, следующие одно за другим на протяжении ряда интервалов, причем одно из них является моментальным или почти «мгновенным», а другое — намного более продолжительным по срав- нению с первым (например, респондент почистил зубы и лег спать); случай 3 • . Последовательные виды деятельности, записанные в один интервал; случай 4. • Два вида деятельности, которые были записаны как одно- временные, но явно являются последовательными. 515. В случае 1 потребуется определить, какое из занятий является глав- ным, а какое второстепенным, и могут возникать некоторые ситуации, требу- ющие редактирования для обеспечения последовательного применения правил приоритизации при кодировании занятий. Что касается последовательных ви- дов деятельности (случаи 2–4), то каждое из занятий должно рассматриваться как главное, а бюджет времени должен распределяться между занятиями в соот- ветствии с некоторым правилом. В случае 2, если моментальное занятие имело слишком короткую продолжительность, правило может состоять в том, чтобы не кодировать его вообще. В случае 4 не исключена возможность того, что два занятия будут фактически рассматриваться как одно (например, готовила еду и паковала в коробки завтраки на продажу). g) Второстепенные виды деятельности 516. Есть две ситуации, в которых может потребоваться редактирование сообщений о второстепенных видах деятельности: когда в качестве второсте- пенной деятельности записывается более одного занятия; и когда о второсте- пенной деятельности не сообщается. Вариации в сообщениях о множественных второстепенных видах деятельности аналогичны тем, которые имеют место для главной деятельности. Таким образом, процедуры редактирования и кодирова- ния будут аналогичны тем, которые рассматривались в предыдущем разделе. 517. В случае, если сообщается о множественных видах деятельности, важно установить правила приоритизации, при помощи которых будет выби- раться одно или несколько занятий. С учетом того, что многие важные занятия нередко рассматриваются респондентами как второстепенные и не записыва- лись бы вообще, если бы предполагался только сбор данных о главных видах деятельности, необходимо особенно внимательно относиться к такой деятель- ности, как неоплачиваемый труд на дому, уход за детьми, уход за престарелыми и уход за больными и инвалидами. 518. Если следовать тем же принципам, то в отсутствие информации о второстепенных видах деятельности может возникнуть необходимость в про- верке того, действительно ли деятельность, о которой нередко не сообщается, — как правило, уход за детьми или уход за престарелыми, больными или инва- лидами — имела место. Это может быть сделано путем проверки соответствую- щей контекстной и справочной информации (например, «с кем»; состав семьи). При наличии признаков неполноты информации необходимо принять решение о том, использовать ли имеющиеся данные для редактирования или заполнения отсутствующих значений либо пометить запись на предмет дальнейшей про- верки. 146 Руководство по подготовке статистических данных об использовании времени h) Контекстуальная информация 519. Данные по контекстным переменным могут либо отсутствовать вовсе, либо быть несовместимыми с другими записями в дневнике. В случае их отсутствия кодировщик должен подобрать соответствующий код на основе описания занятия или другой информации из дневника, вспомогательных воп- росников или подтверждающих эти сведения дневников членов домохозяйства. В таблице 14 изложена процедура, которая может применяться, если контекст- ная переменная «место занятия» по указанному в дневнике занятию отсутс- твует (Australian Bureau of Statistics, 1997 a, p. 11). 520. В этом примере код «00» представляет собой заранее установлен- ный код для отсутствующих данных по этой контекстной переменной. 521. Принятие решения о том, следует ли редактировать контекстную переменную или подставлять ее значение, во многом зависит от имеющейся информации и той аналитической цели, которую преследует эта переменная. Примером того, каким образом аналитические цели определяют спецификации редактирования и заполнения значений, служат спецификации контекстной переменной «для кого» в австралийском обследовании использования времени 1997 года. Одна из аналитических целей этого обследования касалась эпизодов добровольного труда и ухода за членами семьи. Таким образом, процедура ре- дактирования была основана на нижеследующих принципах (Australian Bureau of Statistics, 1997 a, p. 10). Таблица 14 Возможная процедура для применения в случае отсутствия контекстной переменной «место занятия» по указанному в дневнике виду деятельности Шаг 1 Можно ли логически вывести эту переменную из характера деятельности? Если да, кодировать соответствующим образом Если нет, перейти к шагу 2 Шаг 2 Можно ли логически вывести эту переменную из места занятия, указанного в дневнике перед данным видом деятельности? Если да, кодировать соответствующим образом Если нет, перейти к шагу 3 Шаг 3 Можно ли логически вывести эту переменную из информации во вспомогательных дневниках? Если да, кодировать соответствующим образом Если нет, перейти к шагу 4 Шаг 4 Информация отсутствует. Применить код “00” Источник: Australian Bureau of Statistics (1997 a). 522. Информация, представленная респондентом, может изменяться лишь в том случае, если: необходимо понять цель главного вида деятельности; другими сло- • вами, если в противном случае добровольный труд или уход за чле- нами семьи не будут признаны таковыми; дневник изобилует информацией; • цель деятельности может быть истолкована по-иному вследствие того, • что информация «для кого» неверна. 523. В рамках того же обследования был разработан сложный комплекс руководящих принципов для редактирования и кодирования контекстной пе- Обработка данных обследования использования времени 147 ременной «с кем», предполагающих использование информации из других кон- текстных переменных (например, место занятия) и из дневников других членов домохозяйства (ibid., pp. 14–16). i) Другие трудные случаи 524. Необходимо разработать процедуры редактирования для случаев, которые, как ожидается, вызовут затруднения у кодировщиков и редакторов. Эти случаи будут зависеть от используемой классификации, аналитической основы обследования, правил приоритизации для определения главных заня- тий и того, как люди обычно отчитываются о своих занятиях. Для того чтобы оценка этих ситуаций была приведена в некую систему, необходимо изучить опыт стран, находящихся в аналогичном положении, и провести методологи- ческие исследования, предварительные проверки, контрольные проверки про- цедур опроса и кодирования занятий. Ниже приводится перечень некоторых возможных случаев: занятия, не поддающиеся кодированию; • разноречивая информация в дневниках, заполненных членами одного • домохозяйства; кодирование постоянных занятий, например пассивного ухода за • детьми; описание занятия, к которому респондент не имел отношения. Напри- • мер, приход друзей; уход жены на работу; кодирование занятий, связанных с перемещением; • кодирование «ожидания»; • кодирование кратких по продолжительности занятий, например «при- • шел домой»; в сообщении не указана цель занятий, которые имеют разные коды в • зависимости от цели. Например, плавание может ассоциироваться с физическими упражнениями, спортом, соревнованием или оздорови- тельными занятиями. 3. Сверка записей с другими данными обследования 525. Как было показано выше, некоторые процедуры редактирования предполагают использование вспомогательных вопросников респондента, а также дневников других членов домохозяйства для заполнения отсутствующих данных в дневниках. И наоборот, личные вопросники могут редактироваться с использованием информации из дневника. Одна из важных процедур пред- полагает проверку логической последовательности данных о трудовой деятель- ности респондента. Например, респондент мог указать в дневнике, что он или она занимались трудовой деятельностью, но в личном вопроснике на вопросы об участии в трудовой деятельности были даны ответы «нет». В данном случае эти две записи должны быть увязаны друг с другом. 526. Однако помимо соображений, связанных с редактированием, ре- зультаты логической проверки подобного рода могут заложить основу для оценки методов сбора данных об участии в трудовой деятельности. Собственно говоря, в некоторых странах такая оценка и является одной из целей обследова- ния использования времени. 148 Руководство по подготовке статистических данных об использовании времени Е. ЗАПОЛНЕНИЕ ПРОПУЩЕННЫХ ЗНАЧЕНИЙ 1. Общие соображения 527. Заполнение пропущенных значений, как уже говорилось в этой главе, — это процедура, используемая для решения проблемы отсутствующих, невер- ных или логически непоследовательных ответов, выявленных в ходе редакти- рования. Она осуществляется путем подмены некоторых ответов или отсутс- твующих значений в редактируемом формуляре для того, чтобы выходные данные имели правдоподобный и логически последовательный вид. Некоторые проблемы отсутствия данных устраняются на более раннем этапе обследования путем установления повторного контакта с респондентом или проверки пер- воначальных формуляров. Однако в целом решить все проблемы отсутствия данных на этих ранних этапах невозможно в силу таких причин, как увеличе- ние нагрузки на респондентов, дополнительные расходы и сжатые сроки. В этом случае для устранения оставшихся недостатков в редактировании на этапе об- работки практикуется заполнение пропущенных значений, поскольку весьма желательно получить в итоге полный и логически последовательный файл с за- полненными значениями. 528. Хотя заполнение пропусков может повысить качество итоговых данных благодаря исправлению отсутствующих, неверных или логически не- последовательных ответов, важное значение имеет выбор подходящей методо- логии заполнения, так как некоторые методы заполнения не позволяют сохра- нить взаимосвязь между переменными или могут внести реальные искажения в распределение выборки. 529. Процедуры заполнения значений могут быть автоматизирован- ными или компьютеризованными, осуществляться вручную или путем сочета- ния обоих методов. Качественная процедура заполнения сводит к минимуму искажения, возникающие из-за несоблюдения всех желаемых значений, имеет контрольный след для целей оценки и обеспечивает внутреннюю последова- тельность подставленных значений. Качественные процедуры заполнения объективны, эффективны, осуществляются в автоматическом режиме и могут быть воспроизведены. В соответствии с принципами Феллеги-Хольта (Statistics Canada, 1998 b, p. 38) изменения вносятся в минимальное число полей с целью гарантировать, чтобы итоговая запись прошла все проверки. 530. Заполнение пропущенных значений особенно эффективно в тех слу- чаях, когда единица выборки дала ответы по другим пунктам, тесно связанным с пунктом, по которому значения отсутствуют, и эти пункты применяются в процедуре заполнения. Необходимо делать пометку всякий раз, когда подстав- ляется некое отсутствующее значение, независимо от выбранной процедуры. Эта практика имеет важное значение, поскольку иногда в ходе аналитической работы могут быть выявлены неожиданные взаимосвязи, и при помощи ука- занных пометок можно удостовериться в том, что эти взаимосвязи не являются результатом непродуманной методики заполнения. 531. В настоящем разделе не ставится цель обобщить обширную лите- ратуру о заполнении пропущенных значений при обследовании выборочных домохозяйств 68 . Некоторые типы стратегий заполнения, которые использова- лись в стране в ходе обследований домохозяйств, имеет смысл взять на воо- ружение для заполнения значений в обследованиях использования времени. Цель настоящего раздела — сформулировать некоторые простые правила и заострить внимание на методах, которые легко применить и которые могут оказаться полезными на этапе анализа данных в обследованиях использова- ния времени. 68 См., к примеру, Организация Объединенных Наций (2002 год). Kalton и Kasprzyk (1986) дают систематизированный обзор методов заполнения значений и взаимосвязи между ними. Обработка данных обследования использования времени 149 532. Методы заполнения пропущенных значений иногда делят на де- терминистские и стохастические. Детерминистские методы определяют, каким образом следует подставить значение для каждого отсутствующего пункта, не добавляя никакого компонента случайной вариации. Классическим примером детерминистского метода является заполнение по среднему, когда любое от- сутствующее значение заполняется средней величиной для респондентов. Сто- хастические методы заполнения привносят некоторый элемент случайности. Одним из примеров стохастического метода является последовательный под- бор. При таком методе единица выборки, заполнившая данный пункт, выби- рается случайно, и значение, данное этим респондентом, подставляется взамен отсутствующего. В обследованиях использования времени обычно предпочи- тают использовать стохастические методы, поскольку они позволяют лучше сохранить распределение, чем методы детерминистские. Например, заполнение по среднему нередко имеет следствием сосредоточение значений у средней ве- личины выборки, что искажает оценку квантилей, а при последовательном под- боре этого не происходит. 533. Последовательный подбор — популярный стохастический метод заполнения, и существует множество способов его реализации. В способах, описанных в настоящем Руководстве, используются классы заполнения, весьма схожие с классами, используемыми при взвешивании поправок на не- получение ответа (см. главу IX). После того как эти классы будут определены, указанный метод предполагает подстановку взамен отсутствующего пункта значения, данного респондентом из того же класса. «Донором» является за- пись, из которой берется значение, подставляемое взамен отсутствующей записи, называемой «получателем». Для выбора доноров был разработан ряд методов, включая последовательный и случайный методы и иерархический упорядоченный подбор. Важное значение при выборе одного из этих методов имеет способность контролировать число раз, когда конкретный формуляр может использоваться в качестве донора. Многократное использование доно- ров снижает точность оценок. 534. Для иллюстрации этой процедуры ниже приводится пример после- довательного подбора, который сравнительно легко осуществить на практике. Первый шаг — это разделение всех случаев на классы заполнения и их случай- ная сортировка внутри классов. В каждом классе сохраняется небольшое число потенциальных доноров, скажем, три. Когда встречается запись с отсутствую- щим значением, то взамен него подставляется одно из сохраненных значений. Если эта запись пригодна для заполнения данного пункта, она заменяет собой ранее сохраненное значение в группе потенциальных доноров и может исполь- зоваться для заполнения других отсутствующих значений. Этот метод замены элементов группы ограничивает число раз, когда запись может использоваться в качестве донора. 535. Выбор классов заполнения имеет важное значение для качества ста- тистических данных. Общий принцип определения классов гласит, что классы должны создаваться с использованием данных, хорошо коррелирующихся с пе- ременной, которая будет подменяться. Цель состоит в создании классов таким образом, чтобы все случаи внутри класса имели одно и то же распределение. Образуемые подобным образом классы также сохраняют взаимосвязь между переменными, используемыми при заполнении. Например, предположим, что время, затрачиваемое женщинами на уход за детьми, — важный статистичес- кий показатель, оцениваемый в ходе обследования, а данные об использовании времени по некоторым выбранным респондентам отсутствуют. Для создания классов заполнения могут использоваться следующие переменные: пол и воз- раст взрослого, наличие в семье детей младшего возраста, трудовая деятель- 150 Руководство по подготовке статистических данных об использовании времени ность, уровень дохода и география. Переменные класса должны определяться по каждому пункту обследования и должны учитывать конкретные условия в стране. При выборе переменных для классов может оказаться полезным изуче- ние статистических таблиц, которые планируется построить для целей анализа. Переменные, используемые для определения строк в таблицах (нередко это по- яснительные переменные), обычно хорошо подходят для создания классов за- полнения. Разумеется, классы должны также выбираться таким образом, чтобы исключить вероятность подстановки невозможных значений. Например, если некоторые пункты предлагается заполнить только женщинам, то пол является той переменной класса, которая должна обязательно включаться, с тем чтобы не допустить подстановки невозможного значения. 2. Процедуры заполнения пропущенных значений в обследованиях использования времени 536. Для изучения некоторых конкретных процедур заполнения значе- ний, которые могут оказаться подходящими в ситуациях, возникающих при обследованиях использования времени, предположим, что обследование ис- пользования времени включает в себя два компонента — основной вопросник и дневник использования времени. Входящие в выборку взрослые вначале за- полняют основной вопросник с такими пунктами, как возраст, пол, семейное положение, место рождения, род занятий, доход, количество членов семьи, ко- личество детей в семье и т. д. Выбранному взрослому предлагается также запол- нить дневник использования времени за один день. 537. Применительно к пунктам, отсутствующим в основном вопроснике, можно использовать метод последовательного подбора для подстановки от- сутствующих основных переменных, которые, как ожидается, определят строки таблиц, подготавливаемых по результатам обследования. Может быть принято решение о том, чтобы пропущенные значения по другим пунктам основного вопросника не заполнялись. 538. Если выбранный взрослый не заполняет дневник, вместо подста- новки всех отсутствующих данных об использовании времени рекомендуется использовать взвешивание. Если респондент заполняет большинство пунктов дневника, но оставляет пустыми один-два временных интервала, следует поду- мать о заполнении пропусков. В этом случае может пригодиться метод последо- вательного подбора, и классы могут быть созданы с использованием перемен- ных из основного вопросника, таких, как возраст, пол, семейное положение, род занятий и т. д. Отсутствующие данные могут подменяться данными по другим выбранным взрослым в том же классе, которые заполнили все временные ин- тервалы в дневнике. Поскольку отсутствующие данные о занятиях относятся к конкретному временнόму интервалу, донорами должны служить отмеченные в дневнике занятия из того же интервала. Если для какого-либо конкретного лица отсутствуют данные по нескольким интервалам, необходимо подставить все отсутствующие интервалы для того же лица. 539. В некоторых ситуациях, когда отсутствуют данные, рекомендуется использовать не заполнение значений, а взвешивание для учета фактора непо- лучения ответа. Два конкретных случая — когда описан только один дневнико- вый день из двух назначенных и когда входящие в выборку члены домохозяйс- тва не представили ответов — разбираются в главе IX. ´ ´ |