Рабочая книга социолога. Вторая структура социологического знания общая социологическая теория
Скачать 3.63 Mb.
|
Глава пятая Методы статистики в социологическом исследовании.
Определение измерения. Измерением называется процедура, с помощью которой объекты измерения, рассматриваемые как носители определенных соотношений, отображаются в некоторую математическую систему с соответствующими отношениями между элементами этой системы. В качестве объектов измерения могут выступать респонденты, производственные коллективы, условия труда и быта и т. д. В отношения, которые моделируются при измерении, объекты вступают как носители определенных свойств. Так, мы можем рассматривать респондентов изучаемой совокупности как носителей такого свойства, как удовлетворенность своим трудом, и рассматривать отношение равенства между ними, считая каких-то респондентов «равными» или «неравными» в зависимости от степени рассматриваемой удовлетворенности. Те же респонденты могут выступать как носители такого свойства, как «возраст». Ясно, что между ними может быть определено отношение равенства, однако респонденты, «равные» друг другу и первом случае, могут оказаться «неравными» во втором. Каждому объекту при измерении приписывается определенный элемент используемой математической системы. В социологии чаще всего используются числовые математические системы, т. е. такие системы, элементами которых являются действительные числа. Однако возможно аффективное использование и нечисловых математических систем1: частично упорядоченных множеств, графов, матриц и т. д. Адекватное измерение предполагает наличие общего представления о наблюдаемых объектах, об их изучаемых сторонах. Такое, представление даст возможность выделить отношения между объектами, которые должны отображаться в соответствующие отношения между элементами использующейся математической системы2. Поскольку при практическом осуществлении измерения социологи в подавляющем большинстве случаев используют числовые системы, остановимся на принципах их применения в социологии. Будем называть шкалой тот алгоритм, с помощью которого каждому наблюдаемому объекту ставится в соответствие некоторое число. Приписываемые же объектам числа назовем шкальными значениями этих объектов. Элементы используемых в социологии числовых систем, как правило, нельзя считать «полноценными» числами. Приведем пример. Предположим, что нас интересует отношение порядка между респондентами по их удовлетворенности своим трудом. Пусть процесс измерения состоит в следующем. Мы задаем каждому респонденту вопрос: «Удовлетворены ли Вы своим трудом?» с традиционным веером из пяти ответов (от «совершенно не удовлетворен» до «вполне удовлетворен»). Каждому ответу присвоим соответственно числа от 1. до 5. Ясно, что реальным отношениям между респондентами в таком случае отвечает лишь отношение порядка между числами. Другие же операции под этими числами, например их сложение, не имеют эмпирически интерпретируемого смысла. Другими словами, полученные шкальные значения не являются числами в обыденном значении этого понятия. Встает естественный вопрос: какими известными соотношениями между числами мы в подобных ситуациях можем пользоваться, чтобы, анализируя шкальные значения, можно было получать содержательные выводы? Для ответа на этот допрос необходимо в первую очередь четко представить себе характер числовых систем, использующихся в процессе измерения в социологии. Неоднозначность шкальных значений. Допустимые преобразования и типы шкал. Единственное требование, предъявляемое к числам, служащим шкальными значениями, состоит в том, что рассматриваемые эмпирические отношения должны переходить в соответствующие им числовые отношения. Этого требования, как правило, бывает недостаточно для однозначного определения множества шкальных значений. Совокупности величин, полученных по используемым в социологии шкалам, обычно бывают определены лишь с точностью до некоторых преобразований этих величин, которые называются допустимыми преобразованиями соответствующих шкал; В соответствии со сложившейся в литературе традицией тип шкалы определяется соответствующим этой шкале множеством допустимых преобразований. Чтобы пояснить введенные определения, опишем типы наиболее часто использующихся в социологии шкал. Шкалы наименований (номинальные, классификационные). При использовании шкалы наименований объекты измерения распадаются на множество взаимно исключающих и исчерпывающих классов. Каждому классу даётся наименование, числовое обозначение которого является одним из шкальных значений. Шкала наименований получается, если в качестве моделируемых в процессе измерения эмпирических отношений выступают лишь отношения равенства и неравенства между объектами. Требования, предъявляемые к шкальным значениям, состоят в том, что равным объектам должно соответствовать одно и то же число, а неравным — разные числа. Поэтому номинальная шкала фактически задает некоторую классификацию исходных объектов. Один класс — это совокупность объектов, имеющих одно и то же шкальное значение. Номинальные шкалы можно определить как шкалы, допустимыми преобразованиями которых являются произвольные взаимно однозначные преобразования3, т. е. преобразования, сохраняющие отношения равенства и неравенства между числами. Изучаемые эмпирические отношения одинаково хорошо будут отражать, например, следующие совокупности шкальных значений: (1, 1, 2, 3, 4) и (15, 15, 14, 13, 12). Каждая из этих совокупностей получена из другой с помощью некоторого однозначного преобразования. Отметим, что даже при таком простейшем измерении к построению шкалы надо подходить с большой осторожностью. Получаемые классы должны иметь социологическую значимость. Ясно, что сначала исследователь должен решить, что он будет классифицировать, какие категории будут при этом исследоваться. Например, если изучаются респонденты как носители определенной профессии, то классифицировать их нужно по принадлежности к той или иной профессии. Предполагается, что каждой профессии произвольно приписывается число, причем разным профессиям соответствуют разные числа. Однако уже здесь проблема измерения (т. е. приписывания респондентам определенных чисел) не столь проста. Нельзя с предельной четкостью выделить всевозможные профессии или, по крайней мере, считать, что все профессии взаимно исключают друг друга. Например, неизбежно придется столкнуться с таким частным случаем, когда профессия будет комбинацией нескольких. И тогда встанет вопрос о соотнесении респондента, имеющего такую профессию, с некоторой группой профессий и обозначении ее числовым знаком. Порядковые шкалы (шкалы порядка). Порядковая шкала получается, если при осуществлении измерения моделируются не только эмпирические отношения равенства и неравенства между изучаемыми объектами, по и отношения порядка между ними. Порядковая шкала не только задает некоторую классификацию на множестве объектов, но и устанавливает определенный порядок между классами. Порядковые шкалы можно определить как шкалы, в качестве допустимых преобразований которых выступают произвольные монотонно возрастающие преобразования4. Последние образуют подсовокупность всех взаимно однозначных преобразований, включающую те из них, которые сохраняют отношение порядка между числами. Примером совокупностей шкальных значений, получающихся друг из друга с помощью некоторого монотонно возрастающего преобразования, могут служить совокупности (1, 3, 5, 4, 2) и (18, 20, 28, 24, 19). Интересующие нас отношения равенства, неравенства и порядка между объектами с одинаковым успехом отражены в любой из этих совокупностей. Ясно, что порядковые шкалы образуют подмножество номинальных шкал. Пример порядковой шкалы мы получим, если будем различать людей данной профессии по квалификации (сложности труда и т.д.). На практике часто не удается полностью упорядочить объекты изучаемой совокупности относительно того или иного интересующего исследователя свойства. Предположим, например, что изучается совокупность людей носителей свойства - «удовлетворенность специальностью», а более узко — свойства, содержащегося в вопросе «Удовлетворены ли Вы своей специальностью?» и пяти ответах на него от «полностью удовлетворен» до «совсем не удовлетворен». Обычно считается, что любую совокупность людей можно упорядочить в отношении данного свойства, т. е. что ответившие «специальностью полностью удовлетворен» выше по измеряемому качеству, чем те, кто ответил, что «специальностью удовлетворен» и т. д. Зачастую предполагаемого четкого различения оценок не наблюдается и респонденты не могут однозначно выбрать тот или иной ответ. В этом случае на помощь могут прийти частично упорядоченные множества. Шкальные значения, полученные по порядковой шкале, часто называют рангами. Интервальные шкалы (шкалы интервалов). Интервальные шкалы получаются, если в процессе измерения мы моделируем не только те отношения, которые моделируются при использовании порядковой шкалы, но и отношение равенства (или, что одно и то же, порядка) для разностей (интервалов) между изучаемыми объектами. Далеко не всегда в тех случаях, когда удается построить порядковую шкалу, удается построить и интервальную. Например, возьмем классификацию рабочих по разрядам. Известно, что первый разряд ниже второго, второй — третьего и т. д. (и это соответствует определенному эмпирическому отношению порядка между респондентами), т. е. разряды отвечают порядковой шкале. Однако сопоставлять дистанции между каждой парой разрядов все же нельзя. Интервальным шкалам соответствуют положительные линейные преобразования5, т. е. такие преобразования, которые, наряду с отношениями равенства, неравенства и порядка между числами сохраняют и отношения равенства и порядка между их разностями, (или, что то же самое, частное от деления любой такой разности на любую другую). Примером совокупности чисел, получающихся друг из друга с помощью положительного линейного преобразования (У = 3Х + 9), служат совокупности (5, 5, 2, 1, 2) и (24, 24, 15, 12, 15). Нетрудно проверить, что в этих совокупностях отражаются одни и те же отношения равенства, неравенства и порядка, как для чисел, так и для интервалов между ними (так, для первой совокупности 5 — 2 > 2 — 1, а для соответствующих шкальных значений из второй совокупности 24 — 15 > 15 — 12). Легко видеть также, что частные от деления величины одного интервала между шкальными значениями на величину другого не зависят от того, какую из рассматриваемых шкал мы выбираем (так, верно соотношение (5 – 2):(2-1)=(24-15):(15-12)=3). Это справедливо для любых интервальных шкал. Ясно, что положительные линейные преобразования являются под совокупностью монотонно возрастающих преобразований, а совокупность интервальных шкал — подмножеством шкал порядка. Главная трудность при построении интервальных шкал в социологии состоит в обосновании равенства или разности дистанций между объектами. Процедуры, позволяющие таким образом преобразовать шкальные значения порядковой шкалы, что равенство (порядок) расстояний между полученными числами можно будет трактовать как отражение соответствующего равенства (порядка) «расстояний», между изучаемыми объектами, носят название метризации шкалы (или «оцифровки» шкальных значений.)6. На практике известно много методов шкалирования, позволяющих получать интервальную шкалу «косвенным» образом, без отображения указанного отношения непосредственно в процессе измерения7. Шкалам отношений соответствуют положительные преобразования подобия8, составляющие подсовокупность положительных линейных преобразований, оставляющих без изменения отношения между числами (под отношением здесь понимается частное от деления одного числа на другое). Шкалу отношений получим, если будем требовать, чтобы в процессе измерения не только отношения между эмпирическими объектами отображались в соответствующие; числовые отношения, но и один и тот же объект отображался в 0. Подобная возможность иногда возникает в социологических исследованиях. Так, при изучении удовлетворенности респондентов своим трудом, вероятно, в качестве такого объекта имеет, смысл выбрать респондента, равнодушного к своей работе. Фиксацию такого нулевого объекта можно рассматривать как задание начала отсчета; шкальных значений. Поэтому можно сказать, что шкалы отношений образуют подмножество интервальных шкал, характеризующееся фиксацией начала отсчета. Неоднозначность совокупности шкальных; значений, полученных с помощью измерения по шкале отношений, иллюстрируется примером следующих двух совокупностей, отражающих одни и те же эмпирические отношения равенства, неравенства и порядка как между респондентами, так и между соответствующими интервалами и, кроме того, отвечающих одному и тому же началу отсчета (один и тот же объект (второй) в обоих случаях отображается в: (2, 0,—1,4, 1) и (3, 6,—3/2, 6, 3/2). Легко видеть также, что для обеих совокупностей частные от деления между шкальными значениями любых пар объектов одни и те же (2:4 = 3: 6 и т. д.). Ясно, что рассматриваемые совокупности получаются друг из друга с помощью некоторого положительного преобразования подобия (у = 3/2х). Шкалы разностей — это шкалы, которым соответствуют преобразования сдвига9. Ясно, что такие преобразования образуют подсовокупность положительных линейных преобразований. Шкалы разностей получаются из интервальных шкал при фиксации единицы измерения. Для большинства социологических шкал трудно задать естественным образом такую единицу (исключение составляют шкалы типа «возраст», «стаж работы», «доход» и некоторые другие). Однако шкалу разностей можно получить, например, при отыскании шкальных значений рассматриваемых объектов с помощью некоторых методов парных сравнений (см. гл. 7), Сказанное подытожено в схеме 1, где указаны допустимые преобразования описанных шкал и отражено соотношение их типов. Признаки, значения которых получены по порядковой или номинальной шкале, обычно называют качественными, а признаки, для получения значений которых использовалась шкала, тип которой ниже типа интервальной шкалы — количественными. В соответствии с имеющейся традицией будем говорить, что две шкалы позволяют достичь одного и того же уровня измерения, если эти шкалы являются шкалами одного типа (т. е. если соответствующие этим шкалам совокупности допустимых преобразований совпадают)10. Адекватность математических методов. Одним из основных вопросов, встающих перед исследователем после осуществления измерения, является вопрос о том, какие математические методы он имеет право применять для анализа полученных чисел. Представляется целесообразным считать разрешенными (далее допустимыми, адекватными) только такие методы, результаты, применения которых не зависят от того, по какой из возможных шкал получены исходные данные. Необходимым условием такой независимости является инвариантность этих результатов относительно допустимых преобразований используемых шкал. Основанием для такого подхода служит то, что именно такие результаты в принципе поддаются содержательной интерпретации, только они могут отражать реальные закономерности. Отметим, однако, что одной независимости результатов применения какого-либо метода от выбора конкретных используемых шкал отнюдь не достаточно для того, чтобы попытка их содержательной интерпретации увенчалась успехом. Необходимо также содержательное осмысление соответствующих результатов хотя бы для одной из возможных шкал. Подчеркнем, что понятие допустимости или недопустимости той или иной статистики (различных мер средней тенденции, мер разброса, коэффициентов связи между признаками и т. д.) является относительным. Все зависит от того, в каком «контексте», значения этой статистики используются, какие именно соотношения между этими значениями значимы для получения содержательных выводов. Так, сопоставление средних тенденций двух совокупностей может осуществляться с помощью сравнения средних арифметических значений некоторого признака по их величине, с помощью оценки разности (отношения) этих средних и т. д. И возможность использования средних арифметических значений зависит от того, какие именно соотношения между ними подлежат содержательной интерпретации. Подчеркнем следующее. Если удалось показать, что некоторое числовое соотношение можно содержательно проинтерпретировать, то не имеет значения, удастся ли при этом найти эмпирические аналоги отдельных входящих в это соотношение операций над числами. Например, можно делать содержательные выводы на основе сравнения по величине двух средних арифметических значений некоторого признака, никак не интерпретируя при этом суммы шкальных значений, вычисляемые в процессе нахождения средних арифметических. Как отмечалось выше, для проверки разрешенное любого соотношения необходимо убедиться в том, что это соотношение инвариантно относительно допустимых преобразований использовавшейся при измерении шкалы (или нескольких шкал, если исходные данные получены по разным шкалам, но мы такой случай рассматривать не будем). Однако на практике такая проверка бывает довольно сложной. Соответствующая проблема в теории измерений называется проблемой адекватности рассматриваемого числового соотношения. Аналогично можно говорить о проблеме адекватности результатов применения какого-либо математического метода. Естественно, что чем уже круг допустимых преобразований, тел большее количество математических соотношений оставляют эти преобразования без изменения. Другими словами, чем выше тип шкалы, чем выше уровень измерения, тем большее количество математических методов можно применять к шкальным значениям, получая при этом интерпретируемые результаты. Вопрос об адекватности используемых в социологии математических методов, как правило, является весьма сложным. Полученные к настоящему времени результаты касаются лишь небольшого числа методов. Рассмотрим некоторые из них. Прежде всего, остановимся на вопросе о корректности использования различного рода средних и коэффициентов связи между признаками. Ясно, что любую статистику можно использовать в произвольном «контексте» только в том случае, если ее значение остается инвариантным относительно применения к исходным данным любого допустимого преобразования соответствующей шкалы. Нетрудно показать, что для номинальной шкалы, удовлетворяющей такому условию, средней будет мода, для порядковой шкалы — медиана и другие квантили. Значение среднего арифметического остается без изменения лишь для абсолютных шкал. Поэтому обращение с ним требует известной осторожности. Однако можно показать11, что сравнивать по величине средние арифметические значения какого-либо признака можно уже в том случае, когда исходные данные получены по интервальной шкале (другими словами, результаты такого сравнения не изменяются при применении к исходным данным произвольного положительного линейного преобразования). Относительно коэффициентов связи можно сказать следующее, Инвариантными относительно допустимых преобразований рассматриваемых шкал являются значения коэффициентов связи, рекомендуемых в § 6 настоящей главы для соответствующего уровня измерения. Так, значение коэффициента корреляции не изменяется при применении к исходным данным произвольного положительного линейного преобразования; значения коэффициентов Кендалла t и Спирмена r, инвариантны относительно произвольного монотонно возрастающего преобразования входящих в них величин; значения коэффициентов х2> Ф Р, К, Т инвариантны относительно произвольного взаимно однозначного преобразования исходных данных12. |