Главная страница
Навигация по странице:

  • Выборочный метод: определение и истоки

  • Типы вероятностных выборок и их реализация

  • основой выборки.

  • простую случайную, систематическую, стратифицированную, кластерную и многоступенчатую.

  • невалидными.

  • Девятко И. Методы социологического исследования. Логика социологического исследования методология и логика социологического исследования. Возможно ли объективное и научное социальное знание


    Скачать 1.69 Mb.
    НазваниеЛогика социологического исследования методология и логика социологического исследования. Возможно ли объективное и научное социальное знание
    АнкорДевятко И. Методы социологического исследования.doc
    Дата20.03.2018
    Размер1.69 Mb.
    Формат файлаdoc
    Имя файлаДевятко И. Методы социологического исследования.doc
    ТипДокументы
    #16933
    КатегорияСоциология. Политология
    страница14 из 18
    1   ...   10   11   12   13   14   15   16   17   18
    ГЛАВА 7. ПОСТРОЕНИЕ ВЫБОРКИ СОЦИОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ

    Выборочный метод: определение и истоки

    Задача построения выборки возникает всякий раз, когда необходимо собрать информацию о некоторой группе или большой совокупности людей. Выборку в той или иной форме используют в ориентированных на «жесткие» статис­тические методы опросах, в исследованиях политических и культурных элит и даже при отборе «случаев» для включенного наблюдения и качественного анализа.

    Статистические (или квазистатистические) обследования населения и ресур­сов, судя по всему, зародились одновременно с первыми формами централизо­ванной социальной и политической организации: развитые аграрные общества и древние города-государства нуждались в такой информации и использовали ее при решении разнообразнейших управленческих задач — от фискальной политики до строительства общественных бань. Эти обследования иногда при­нимали форму сплошных переписей населения. (Об одной такой переписи, имевшей, правда, самые печальные последствия, рассказывает нам книга про­рока Самуила: когда царь Давид (X в. до н. э.) осуществил перепись населения древнего Израиля, в стране разразилась страшная эпидемия (2 Цар. 24). Однако значительно чаще приходилось довольствоваться сведениями о какой-то части совокупности: об урожайности судили по пробному обмолоту, о партии това­ра — по образцу, а о прихожанах — по их духовному наставнику.

    Выборка это подмножество заданной совокупности (популяции), позволяю­щее делать более или менее точные выводы относительно совокупности в це­лом. Зачем нужно строить выборки? Прежде всего, из практических соображе­ний, так как выборка экономит силы и средства исследователей. Проведение полномасштабной переписи или сплошного опроса населения требует значи­тельных финансовых и трудовых затрат, которые к тому же могут пропасть впу­стую в случае, если в разработке методики исследования были допущены прин­ципиальные просчеты.

    Другая причина заинтересованности в выборках связана с тем, что выборочная процедура представляет собой удобную и экономичную форму индуктивного вывода1. Третья причина заключается в том, что эта процедура реализует фун­даментальный принцип рандомизации, т. е. случайного отбора (от англ. random — случайный, выбранный наугад).

    Представление о том, что отбор наблюдений должен носить случайный, непре­думышленный характер, в общем соответствует нашему интуитивному знанию об условиях вынесения объективного и непредвзятого суждения. Однако стро-

    1 Напомним, что под индуктивным выводом обычно понимают рассуждение по схеме «от частных наблюдений — к общей эмпирической закономерности».

    гая, т. е. математико-статистическая, теория случайной выборки вплоть до кон­ца XIX — начала XX вв. не пользовалась популярностью в среде профессио­нальных статистиков. Многим исследователям казалось, что в основе отбора должна лежать не «игра случая», а поиск типичных, характерных наблюдений. Это убеждение препятствовало применению в массовых обследованиях мето­дов теории вероятности, достигшей высочайшего уровня развития уже в XVIII— первой половине XIX вв. Применимость выборочного метода для изучения слу­чайно распределенных признаков, например дохода или размера семьи, была впервые обоснована в работах норвежца А. Киэра, англичан А. Боули и К. Пир­сона, а также русского статистика А. И. Чупрова2.

    Следующим принципиально важным шагом в развитии выборочного метода стала осуществленная Р. Фишером разработка техники рандомизации в экспе­рименте и выборочном наблюдении3. О роли рандомизации в планировании эксперимента говорится в главе 4. Что же касается выборочного обследования, то оно часто используется как «замена» экспериментального метода. Нельзя провести эксперимент, в котором людям в случайном порядке присваиваются определенные значения переменных «пол» или «цвет кожи». Однако примене­ние выборочного метода и статистического анализа, как мы увидим в дальней­шем, позволяет справляться с этими ограничениями и делать выводы о взаимо­связях между самыми разными переменными, включая вышеупомянутые. Но для того, чтобы такие выводы были обоснованы, нужно устранить любое сис­тематическое влияние «посторонних», смешивающих факторов на изучаемые переменные. Единственным средством для достижения этой цели является аб­солютно случайный характер отбора наблюдений. Лишь равенство шансов по­падания в выборку для каждого наблюдения, т. е. отбор «наугад», гарантирует от намеренных или ненамеренных искажений. Пусть, например, в ходе опроса мы изучаем влияние пола и рода занятий респондента на его отношение к пла­нированию семьи и ограничению рождаемости. Если используемая нами выбо­рочная процедура ведет к тому, что работающие женщины имеют несколько меньшие шансы стать респондентами, чем домохозяйки и пенсионерки (после­дних, как известно, проще застать дома), наши результаты наверняка окажутся смещенными.

    Поэтому наилучшей моделью отбора считается вероятностная, или случай­ная, выборка4, в которой строго соблюдается принцип равенства шансов попа­дания в выборку и для всех единиц изучаемой совокупности, и для любых после­довательностей таких единиц.

    Именно с рассмотрения разных подходов к построению вероятностной выбор­ки мы и начнем наше обсуждение, чтобы в дальнейшем перейти к не столь совершенным видам целевого, т. е. не основанного на вероятностях отбора, и их роли в практике социологических исследований.

    Выше мы определили, что такое выборка. Сейчас нам необходимо строго опре­делить еще несколько элементарных понятий. Переписью называют процедуру

    2 Более детальные сведения о развитии выборочного метода можно найти, в частности, в интересной и доступной книге: Дружинин Н. К. Выборочное наблюдение и экспери­мент. М.: Статистика, 1979.

    3 См.: Fisher R. A. The Design of Experiment. 3rd ed. L.: Oliver & Boyd, 1942.

    4 В дальнейшем мы будем использовать термины «случайная выборка» и «вероятност­ная выборка» как взаимозаменяемые.

    сбора информации о каждом члене изучаемой группы или популяции. Все чле­ны интересующей исследователя группы (популяции) составляют генеральную совокупность. Выборочная процедура обеспечивает обоснованность и «закон­ность» выводов о генеральной совокупности, сделанных на основании неболь­шой выборки.

    Типы вероятностных выборок и их реализация

    Первым шагом в построении любой модели отбора, включая вероятностную, является определение генеральной совокупности. Решение этой задачи далеко не всегда бывает очевидным. Прежде всего, генеральная совокупность, т. е. множество интересующих социолога объектов исследования, может быть задана и описана лишь на основе каких-то содержательных представлений. Если, например, нас интересуют политические пристрастия избирателей, естествен­но включить в генеральную совокупность лишь тех, кто уже достиг 18-летнего возраста. Изучение факторов, влияющих на формирование семейного бюд­жета горожан, потребует иного определения генеральной совокупности: ин­тересующая исследователя популяция в данном случае будет состоять из городских семей.

    Полезно также помнить о том, что идеальная генеральная совокупность, зада­ваемая теоретическим описанием предмета исследования, почти никогда не будет полностью совпадать с реальной совокупностью. Реальная генеральная сово­купность подвержена постоянным колебаниям: «взрослое население города Воронежа на 00 час 15 ноября 1996 года» будет отличаться от «взрослого насе­ления города Воронежа на 00 час 16 ноября 1996 года». Некоторые люди за день уедут из города, попадут в больницу, некоторые — вернутся домой из ко­мандировки и т. п. Поэтому столь важно при описании изучавшейся в исследо­вании генеральной совокупности указывать время и место проведения иссле­дования. Следует также помнить, что идеальная генеральная совокупность — это теоретическая абстракция, более или менее совпадающая с реальной сово­купностью. Выборка осуществляется из реальной популяции, переход от кото­рой к идеальной совокупности обеспечивается не только правилами статисти­ческого вывода, но и некоторой долей теоретического воображения.

    Если исследователь построил выборку, которая представляет интересующую его совокупность с приемлемой степенью точности, то полученная выборка является репрезентативной (представительной). В противоположном случае можно говорить о наличии существенной выборочной ошибки. Более строго выборочную ошибку определяют как расхождение между оценкой некоторого показателя, получаемой на основании исследования выборки, и истинным зна­чением этого показателя в генеральной совокупности.

    К счастью, существуют точные методы для учета и оценки случайной выбороч­ной ошибки, связанной с не носящими систематического характера колебания­ми изучаемой переменной в разных подвыборках из одной и той же генераль­ной совокупности. Подробнее эти методы мы будем обсуждать ниже (в частно­сти, формулы для расчета случайной ошибки выборки будут рассмотрены в главе 8). Значительно более серьезную проблему создает наличие система­тических смещений, возникающих в результате нарушения случайного харак­тера выборочной процедуры. Результаты такого «не вполне случайного» отбо-

    pa могут выглядеть более или менее правдоподобно, однако сами по себе они никогда не позволят обнаружить смещение или оценить его величину.

    Последнее утверждение можно проиллюстрировать на примере классического опыта с рулеткой. Если нам скажут, что вчера десять раз подряд выпало «крас­ное», мы сможем назвать такую серию событий крайне маловероятной. Однако этот субъективно подозрительный результат сам по себе не дает оснований для каких-то суждений о величине и характере ошибок, порождаемых выборочной процедурой, т. е. об исправности механизма самой рулетки.

    Систематическая ошибка выборки не обязательно является результатом злого умысла. Например, в США во время войны во Вьетнаме (до введения контрак­тной системы набора на армейскую службу) правительство проводило специ­альные лотереи для отбора призывников. Фактически случайно отбирались даты рождения: все годные к несению строевой службы юноши, родившиеся в день, который определялся в ходе такого «розыгрыша», призывались в армию. В 1970 г. результаты отбора были подвергнуты острой критике. Проведенное специаль­ной комиссией расследование показало, что в выборочной процедуре действи­тельно присутствовало смещение. Билетики с напечатанными датами были зак­лючены в специальные капсулы, которые затем опускали в лотерейный бара­бан в порядке следования месяцев, начиная с января. Из-за недостаточного перемешивания капсул внутри барабана капсулы с ноябрьскими и декабрьски­ми датами концентрировались в верхней части и, естественно, выпадали с за­метно большей частотой5.

    Самым знаменитым примером смещенной выборочной процедуры в истории социологии стал предвыборный опрос, проведенный американским журналом «The Literary Digest» в 1936 г. Результаты опроса показывали, что Ф. Д. Руз­вельт получит 40,9% голосов и уступит президентское кресло республиканцу А. Ф. Лэндону. В действительности Рузвельт получил 60,2% голосов избирате­лей. Расхождение в 19,3% в значительной степени объяснялось характером выборочной процедуры. Дело в том, что на практике для построения любой выборки используют какой-то список всех членов изучаемой совокупности, на­зываемый основой выборки. В опросе, проведенном «The Literary Digest», в качестве основы выборки использовались телефонные справочники, а также регистрационные списки владельцев автомобилей6. Во второй половине 1930-х гг. такие списки включали в себя почти исключительно представителей экономически благополучных классов. Беднейшие слои населения, избиратель­ная активность которых, кстати, существенно увеличилась в годы Великой Деп­рессии, оказались недостаточно представлены в выборке, что и послужило при­чиной столь значительной ошибки. (Интересно отметить, что объем выборки в описываемом случае был просто огромным — свыше двух миллионов че­ловек!)

    Существует несколько типов вероятностной выборки, различающихся характе­ром выборочной процедуры. Мы рассмотрим лишь пять: простую случайную, систематическую, стратифицированную, кластерную и многоступенчатую.

    Процедура построения простой случайной выборки включает в себя следую­щие шаги.

    5 RouncefieldM., HolmesP. Practical Statistics. Basingstoke: Macmillan Education Ltd, 1989. P. 122.

    6 Galiup G. A. Guide to Public Opinion Polls. Princeton: Princeton University Press, 1948.

    Таблица 7.1 Таблица случайных чисел7

    Номер столбца Номер строки

    1

    2

    3

    4

    5



    6

    7

    8

    9

    10

    1

    98

    08

    62

    48

    26



    45

    24

    02

    84

    04

    2

    33

    18

    51

    62

    32



    41

    94

    15

    09

    49

    3

    80

    95

    10

    04

    06



    96

    38

    27

    07

    74

    4

    79

    75

    24

    91

    40



    71

    96

    12

    82

    96

    5

    18

    63

    33

    25

    37



    98

    14

    50

    65

    71

    6

    74

    02

    94

    39

    02



    77

    .55

    73

    22

    70

    7

    54

    17

    84

    56

    11



    80

    99

    33

    71

    43

    8

    11.

    66

    44

    98

    83



    52

    07

    98

    48

    27

    9

    48

    32

    47

    79

    28



    31

    24

    96

    47

    10

    10

    69

    07

    49

    41

    38



    87

    63

    79

    19

    76

    11

    09

    18

    82

    00

    97



    32

    82

    53

    95

    27

    12

    90

    04

    58

    54

    97



    51

    98

    15

    06

    54

    13

    73

    18

    95

    02

    07



    47

    67

    72

    52

    69

    14

    75

    76

    87

    64

    90



    220

    97

    18

    17

    49

    15

    67

    35

    86

    33

    26



    50

    10

    39

    42

    61


    Во-первых, нужно получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки.

    Во-вторых, следует определить предполагаемый объем выборки, т. е. ожидае­мое число опрошенных.

    В-третьих, нужно извлечь из таблицы случайных чисел (см. табл. 7.7) столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно ока­заться 100 человек, из таблицы берут 100 случайных чисел.

    В-четвертых, нужно выбрать из списка-основы (см. выше) те наблюдения, но­мера которых соответствуют выписанным случайным числам8.

    Прежде чем мы перейдем к обсуждению возникающих на этом пути практи­ческих затруднений, рассмотрим упрощенный пример реализации описанной процедуры.

    Пусть нам предстоит построить случайную выборку объемом в 12 человек из совокупности, содержащей 60 членов. Можно предположить, что мы хотим оценить калорийность ежедневного рациона питания 60 студентов-социологов, обучающихся на втором курсе университета, чтобы исследовать возможное вли­яние энергетической ценности рациона на академическую успеваемость. Для этого можно пронаблюдать за питанием небольшой выборки, состоящей из две­надцати студентов. В качестве основы выборки мы используем список всех 60 студентов. Присвоим всем студентам в списке двузначные номера—от «01»

    7 Составлено на основе таблицы: Appendix С: Random Numbers // Zeiler R. A., Carmines E. G. Statistical Analysis of Social Data. Chicago: Rand McNally, 1978. P. 364—367.

    8 Здесь и далее речь идет о случайной безвозвратной выборке, так как выборка с воз­вращением отобранной единицы в совокупность на каждом шаге отбора не очень удоб­на практически (хотя и обладает рядом статистических преимуществ).

    до «60» (если бы максимальный номер в списке был трехзначным, мы бы при­сваивали трехзначные номера, используя нули в отсутствующих разрядах— например, «067», «003»). Далее нам предстоит последовательно выписать две­надцать двузначных чисел из таблицы случайных чисел (см. табл. 7.7). Отме­тим, что таблицы случайных чисел фактически состоят из случайных цифр, которые обычно сгруппированы для удобства в блоки, состоящие из двузнач­ных либо пятизначных чисел. Объединение цифр в последовательности и бло­ки условно и не имеет особого статистического смысла. Поэтому в случаях, когда нужны, например трехзначные числа, а таблица состоит из пятизначных, пользуются каким-то несложным правилом, скажем, используют только три первые цифры каждого пятизначного числа, а оставшиеся две игнорируют. Со­ответственно двузначные числа можно объединять.

    Чтобы решить, с какого места в таблице начинать отсчет номеров, достаточно задаться произвольными номерами строки и столбца. В нашем примере мы нач­нем с пересечения второй строки и третьего столбца. Первым номером в нашем списке окажется 51. Далее можно двигаться по любому правилу: подряд, через строку, через два столбца и т. п. Мы будем выписывать нужные нам двенадцать двузначных номеров подряд по строке, двигаясь по горизонтали и переходя при необходимости на следующую строку.

    Если при этом будут попадаться числа, превосходящие по величине самый боль­шой номер в нашем списке (60), мы будем их пропускать. То же относится и к повторяющимся числам. В результате мы получим последовательность:

    51, 32, 41, 15, 09, 49, 10, 04, 06, 38, 27, 07.

    Нам остается выписать из списка-основы фамилии, стоящие под этими номера­ми. Если вы располагаете персональным компьютером, то вместо таблицы можно воспользоваться «генератором случайных чисел», имеющимся в большинстве статистических программ.

    Простая случайная выборка — это не только наглядное воплощение идеи слу­чайного отбора, но и своего рода эталон, с которым сравниваются другие веро­ятностные процедуры. Здесь необходимо заметить, что вопреки часто высказы­ваемому и неверному мнению простую случайную выборку не следует рассмат­ривать как самую примитивную форму вероятностного отбора. Напротив, более сложные модели случайных выборок используют в тех случаях, когда простую нельзя применить из-за практических или финансовых ограничений. О каче­стве этих более сложных процедур отбора также судят посредством сравнения с простой случайной выборкой.

    Самые очевидные ограничения для использования простой выборки воз­никают в случае большого объема генеральной совокупности. Прежде всего исследователь сталкивается с проблемами поиска полной и несме­щенной основы выборки. При обследованиях небольших групп и пер­вичных коллективов эти проблемы обычно легко решаются: достаточно воспользоваться членскими списками, списками личного состава и т. п., внеся в них необходимые уточнения. В широкомасштабных опросах об­щественного мнения и социологических обследованиях чаще применя­ют другие основы: переписные листы, списки избирателей, домовые книги, карточки паспортных столов милиции (а также картотеки РЭУ, ДЭЗ и т. п.), нехозяйственные книги сельских советов. Все эти «гото­вые» основы выборки обладают определенными преимуществами и не-

    достатками9. Решая практическую задачу планирования выборочного ис­следования, социолог обычно оценивает возможные основы по несколь­ким параметрам.

    Во-первых, списки, пригодные для составления основы выборки, могут хра­ниться либо централизованно, либо децентрализованно, «вразброс», в различ­ных территориальных органах власти, статистических учреждениях и т. п. Ес­тественно, что в первом случае затраты на получение доступа к основе будут значительно ниже, чем во втором. Фактически при децентрализованном хране­нии исследователь должен самостоятельно составить единый список-основу, собрав необходимые данные в результате обхода (или объезда) всех соответ­ствующих институций.

    Во-вторых, используемые в качестве основы выборки списки могут обладать различной степенью точности. Точность списка, в свою очередь, зависит от его полноты, частоты его обновления. Эти качества (полнота списка и высокая ча­стота его пересмотра) редко встречаются одновременно. Как правило, самыми полными оказываются именно те основы, которые реже всего обновляются. Таковы, конечно, данные переписей или эпизодически составляемые именные распределительные списки (типа списков на получение приватизационных че­ков). К сожалению, чем больше времени отделяет планируемое вами исследо­вание от последней переписи, тем больше вероятность возникновения ошибок и смещений в основе выборки.

    Очень существенными достоинствами обладают списки паспортных столов милиции, жилищно-эксплуатационных контор и других местных администра­тивных органов.

    Качество основы выборки оценивают уже на стадии планирования исследова­ния. Особое внимание уделяют таким потенциальным угрозам валидности, как неполнота выборочной основы, «склеивание» единиц отбора, «пустые» эле­менты в списке. О неполноте говорят в тех случаях, когда список, используе­мый для построения выборки, не содержит в себе некоторые единицы, безус­ловно относящиеся к целевой совокупности. Например, списки жильцов могут не содержать сведений о тех жильцах, которые еще не зарегистрировались по новому месту жительства. В некоторых случаях проблему неполной основы можно решить за счет использования дополнительных основ. В нашем примере со списками жильцов такой дополнительной основой могут стать «листки при-бытия-убытия», которые хранятся в паспортных столах отделений милиции (с помощью последних ведется учет прописки граждан). Примером «склеива­ния» может служить ситуация, когда генеральная совокупность, определяемая объектом исследования, состоит из индивидов, а реальной основой отбора слу­жит список квартир или домовладений, содержащий лишь сведения об ответ­ственных квартиросъемщиках либо о собственниках недвижимости. «Пустые» элементы в основе выборки встречаются в тех случаях, когда исходный список содержит имена или адреса, за которыми не стоят реально существующие (или практически доступные) выборочные единицы. Эта проблема часто возникает

    9 В отечественной литературе сравнительный анализ разных основ и их применения в конкретных исследованиях осуществлен, например, в книге: Арутюнян Ю. В., Дроби-жева Л. М., Кондратьев В. С., Сусоколов А. А. Этносоциология: цели, методы и некото­рые результаты исследования. М.: Наука, 1984. Гл. IV.

    при использовании устаревших списков, содержащих информацию о временно уехавших, выбывших, умерших и т. п.10

    Описанные выше трудности составления валидной, т. е. соответствующей объек­ту исследования (целевой совокупности), основы выборки носят и статисти­ческий, и «экономический» характер. Довольно часто исследователь сталкива­ется с ситуацией, когда временные и финансовые затраты на осуществление простой случайной выборки становятся неприемлемо высокими. Наиболее ра­зумным выходом здесь является использование других, «компромиссных», про­цедур случайного отбора.

    Систематическая выборка по качеству часто приближается к простой случай­ной. Систематическая выборка, как и простая случайная, требует полного списка или заданного упорядочения совокупности (см. ниже). Техника осуществления систематического отбора элементарна: сначала случайным образом отбирается первая единица, затем отбору подлежит каждый k. элемент. Число k в данном случае называют шагом отбора. Можно, например, отбирать каждый 25-й или каждый 200-й элемент. Чтобы определить шаг отбора, нужно поделить изве­стный объем генеральной совокупности (N) на предполагаемый объем вы­борки (п).

    Пусть, например, нужно отобрать 200 человек из 20000 владельцев телефонов:

    1) определим шаг отбора: N/n = 20000 : 200 = 100;

    2) с помощью таблицы случайных чисел найдем первую выборочную еди­ницу. Если, скажем, выпал номер «053», то из списка владельцев телефо­нов выпишем того, кто значится под этим номером;

    3) с установленным шагом отбираем номера: 153, 253, 353, 453 и т. д. до исчерпания списка.

    Иногда генеральная совокупность (и соответственно основа выборки) слиш­ком велика либо исследователю известен не полный список, а лишь правило упорядочения элементов в генеральной совокупности. Предположим, что мы хотим составить представление о весе и формате книг, содержащихся в некой библиотеке, при том, что мы не располагаем полным каталогом, а лишь видим, как книги расставлены на стеллажах. При условии, что объем библиотечного собрания нам приблизительно известен, мы можем воспользоваться процеду­рой систематического отбора и отобрать, скажем, каждую 55-ю книгу. Очень важно отобрать «стартовую» единицу сугубо случайным образом. Именно в этом пункте кроется основная слабость систематического отбора. Если в способе упорядочения единиц совокупности имеет место некая цикличность, т. е. неиз­вестная нам «система» (систематический паттерн), а случайность в выборе «старта» должным образом не обеспечена, то полученная выборка может так­же оказаться смещенной (если о систематическом паттерне мы знаем заранее, то он не представляет собой угрозы валидности и может быть учтен в ходе отбора). Если воспользоваться примером с отбором книг в библиотеке, то легко представить себе такую гипотетическую ситуацию: исследователь выбирает в качестве стартовой первую книгу на нижней полке ближайшего стеллажа и далее двигается с шагом 250 единиц. Если на каждом стеллаже размещается около 500 книг, то приблизительно половина его выборки будет взята с нижних

    10 Подробнее об источниках смещений в основе выборки и некоторых способах борьбы со смещениями см.: KishL. Survey sampling. N. Y.: J. Wiley, 1965. P. 53—59.

    полок. Однако известно, что на нижних полках многих библиотек нередко раз­мещают книги больших форматов — художественные альбомы, атласы и т. п. Если в нашем примере это правило упорядочения будет соблюдено хотя бы в половине случаев (т. е. половина нижних полок будет отведена под «неформат­ные» издания, под так называемые фолио), любые выборочные оценки «направ­ленности» библиотечного собрания или формата представленных в нем книг окажутся невалидными. Аналогией примеру с библиотечными книгами мо­жет служить случай систематической выборки городских квартир. Если в ре­зультате осуществляемого непосредственно «в поле» интервьюерами система­тического отбора в выборке будут сверхпредставлены квартиры, расположен­ные на первых и последних этажах, возникнет систематическая выборочная ошибка. На первых и последних этажах в российских городах часто живут люди из групп, имеющих более низкий социально-экономический статус и соответ­ственно ограниченные финансовые ресурсы: квартиры, расположенные на «крайних» этажах и соприкасающиеся с системами коммунального водо- и теп­лоснабжения, обычно стоят дешевле, так как названные системы в России тра­диционно являются источником неприятностей и дисфункций в структуре жиз­необеспечения.

    Стратифицированный отбор и соответственно стратифицированная выборка используются в тех случаях, когда из каких-то содержательных соображений важно обеспечить представительность вероятностной выборки по каким-то конкретным важным для исследовательских целей критериям. В литературе существует определенная путаница вокруг проблемы стратификации («стра-та» — это социальная, возрастная или иная группа, буквально «слой»).

    Применительно к стратифицированному отбору часто высказывают все те не­верные и предрассудочные мнения, которые в начале XX века высказывались относительно квотной выборки (см. ниже) и ее воображаемых преимуществ перед случайным отбором. В действительности стратифицированный отбор име­ет определенные практические преимущества до тех пор, пока сохраняется его вероятностный, случайный характер. Как только стратифицированная выборка превращается в более или менее специально отобранную квотную выборку, воспроизводящую некоторые известные пропорции генеральной совокупности (например, 51% женщин, 30% горожан и т. п.), любые статистические, т. е. стро­гие, оценки параметров генеральной совокупности становятся невозможными.

    Стратификацией, строго говоря, называют процедуру, при которой отбор осу­ществляют как бы из нескольких «параллельных» подсовокупностей, заданных на одной и той же генеральной совокупности. Это абстрактное определение можно прояснить с помощью примера. Пусть у нас есть генеральная совокуп­ность взрослых горожан, относительно которой мы располагаем какой-то су­щественной с точки зрения исследовательских гипотез информацией. Наличие такой предварительной информации необходимое условие стратифициро­ванного отбора. Предположим, мы знаем, что в генеральной совокупности 60% рабочих и 40% служащих. Это соотношение может оказаться весьма суще­ственным с точки зрения наших исследовательских гипотез, если оно задает одну из независимых переменных, как, например, при изучении влияния рода занятий на частоту посещения футбольных матчей. Даже при отсутствии зна­чительной систематической погрешности небольшие смещения в реализации случайной выборочной процедуры могут привести к ситуации, когда в нашей конкретной выборке соотношение рабочих и служащих будет существенно

    (на 5—7%) отклоняться от ожидаемой «правильной» пропорции, имеющей ме­сто в генеральной совокупности (см. обсуждение нормальной кривой и индук­тивного статистического вывода в гл. 8). Соответственно под угрозой окажется точность наших оценок взаимосвязи между главной независимой переменной (профессиональным статусом) и интересом к футболу. Такого рода неточность может быть устранена при использовании еще одной случайной выборки из генеральной совокупности, но здесь вступают в силу экономические соображе­ния, так как исследовательский бюджет обычно ограничен. В описанной ситу­ации желательно заранее обеспечить представленность обеих интересующих нас групп, т. е. страт, сохранив вероятностный характер отбора. Этого можно добиться, если осуществить некую независимую процедуру случайного отбора для каждой социальной группы в отдельности (в нашем примере для рабочих и служащих) и затем объединить полученные случайные подвыборки в одну (за­метьте, что для нашего примера объем подвыборки рабочих, в согласии с зара­нее известной пропорцией, будет в 1,5 раза больше объема подвыборки служа­щих). Полученная в результате выборка будет и стратифицированной (по про­фессиональному статусу), и вероятностной.

    На практике две случайные процедуры отбора в подвыборки-страты можно тех­нически объединить в одну, если мы располагаем априорной информацией о принадлежности каждой выборочной единицы к той или иной страте. Для это­го достаточно вести параллельный отбор из списка-основы в несколько подвы-борок (по числу страт). Собственно выборочная процедура может быть и про­стой случайной, и систематической (соответственно мы получим либо про­стую, либо систематическую стратифицированную выборку).

    Рассмотрим эту процедуру на примере составления систематической вы­борки населения, стратифицированной по этнической принадлежности. Пусть мы осуществляем выборку взрослых жителей небольшого промыш­ленного центра, при этом полученная выборка должна отражать существу­ющую этнодемографическую ситуацию: 80% русских, 10% украинцев и 10% представителей других национальностей. Основываясь на информа­ции, хранящейся в паспортных столах милиции (или на избирательных списках), мы в идеальном случае можем составить полный список-осно­ву, включающий 100000 известных административным органам постоян­ных жителей. Если предварительно мы предполагаем включить в нашу выборку около 1000 человек, нам нужно отобрать из картотек паспортных столов (или избирательных списков) каждого сотого. То есть доля гене­ральной совокупности f, включенная в выборку, составит 1/100:

    f = объем выборки (n) / объем целевой совокупности (N).

    Выборка объемом в 1000 человек будет включать в себя 800 русских, 100 украинцев и 100 представителей других национальностей. Причем шаг систематического отбора (К) для всех трех подсовокупностей будет равен 100.
    1   ...   10   11   12   13   14   15   16   17   18


    написать администратору сайта