Главная страница
Навигация по странице:

  • Семантический дифференциал.

  • 3. Надежность измерения социальных характеристик

  • Компоненты надежного измерения

  • Правильность измерения — выявление систематических ошибок.

  • Пример

  • 1 4

  • Рабочая книга социолога. Вторая структура социологического знания общая социологическая теория


    Скачать 3.63 Mb.
    НазваниеВторая структура социологического знания общая социологическая теория
    АнкорРабочая книга социолога.doc
    Дата19.11.2017
    Размер3.63 Mb.
    Формат файлаdoc
    Имя файлаРабочая книга социолога.doc
    ТипГлава
    #10295
    КатегорияСоциология. Политология
    страница22 из 38
    1   ...   18   19   20   21   22   23   24   25   ...   38

    Шкалограммный анализ.

    Шкалограммный анализ Гуттмана ве­дет к построению шкал порядкового уровня измерения. Эта тех­ника связана с построением одномерных шкал, т. е. шкал, не за­трагивающих вопросов или не включающих факторов, посторонних по отношению к измеряемой характеристике.

    Например, при обсуждении построения шкал методом равных интервалов рассматривались также такие суждения: «Учусь по­тому, что хочу больше знать» к «Учеба позволит мне достигнуть материального благополучия». Очевидно, эти два суждения отра­жают отношение к учебе по двум разным измерениям. Если второе утверждение имеет дело с экономической стороной, то первое от­ражает сторону познавательную. Метод Гуттмана направлен на построение одномерных шкал, т. е. шкал, не затрагивающих свойства посторонних по отношению к измеряемой характеристике.

    Основная идея метода состоит в том, что шкала должна состоять из иерархизированной системы вопросов, т. е. такой, в которой согласие с вышестоящим по иерархии суждением должно вест: к согласию с нижестоящими суждениями. Например, утверждении о том, что респондент имеет высшее образование, говорит о том, что он учился в вузе, а также о том, что он закончил среднюю школу.






     

    Построение шкалы распадается на ряд этапов.

    l. Отбирается серия суждений относительно измеряемого, свойства.

    2. Эти суждения раздаются группе респондентов (около 100 че­ловек), в которую входят представители обследуемой категории населения. Респонденты отвечают на каждый вопрос либо «да», либо «нет».

    3. Отбрасываются те суждения, которые набрали более 80% благожелательных и отрицательных ответов. Число оставшихся признаков должно быть нелепее десяти.

    4. Следующий шаг состоит в ранжировании оставшихся вопро­сов и респондентов по числу набранных баллов от высшего к низ­шему. В идеальном случае должна получиться картина (шкалограмма), представленная табл. 26.

    Поскольку такая идеальная ситуация почти никогда не наблю­дается, то в результате перестановки строк и столбцов исходной: эмпирической таблицы получается только приблизительная шкалограмма (не имеющая треугольного вида);

    Предположим, что группе респондентов (10 человек) предъяв­лено 8 суждений и результаты опроса сведены в исходную таблицу данных (табл. 27) (знаком «+» обозначено согласие с данным суждением). Преобразованная исходная матрица данных, полученных путем ранжирования лиц и суждений, представлена в табл. 28. Полученная в результате шкалограмма (табл. 28) очень близка к идеальной и имеет лишь три ошибки (одну слева от ломаной и две — справа).

    Вычисляется коэффициент воспроизводимости (это процент ре­акций на признак, которые воспроизводятся правильно);











     

     

    Если воспроизводимость не менее 0,90, то это означает, что данный набор суждений образует одномерную шкалу. Для табл. 28 коэффициент воспроизводимости равен

    Иначе говоря, данную шкалу можно рассматривать как одномер­ную в гуттмановском смысле.

     

     

     






    Кроме того, необходимо учитывать следующие критерии:

    а) каждая категория (суждение) должна обладать минимальной ошибкой;

    б) ошибки должны иметь случайный характер. Если же какая-то одна частная ошибка встречается значительно чаще, чем другая, то это значит, что признак не принадлежит шкальному типу. Суж­дение, которое не удовлетворяет этим требованиям, отбрасывается.

    В более сложных шкалах вместо ответов «да», «нет» респон­дентам можно предложить оценить каждое суждение, например, по шкале: 4 — «полностью согласен»; 3 — «согласен»; 2— «не знаю, не могу ответить»; 1 — «не согласен»; 0—«категорически не со­гласен».

    Процедура построения шкалограммы в этом случае совершенно аналогична дихотомическому случаю. Баллы при ранжировании вопросов и ответов равны сумме отмеченных значений отдельных вопросов. Коэффициенты репродуктивное для таких шкал могут быть повышены как за счет выбрасывания отдельных вопросов, не укладывающихся в шкалограмму, так и путем укрупнения числа градаций ответов на вопрос (например, ответы с пятью градациями укрупнить до трех градаций: 2— «согласен»; 1 —- «не знаю»; 0 — «несогласен»).

    Построенная шкала предъявляется обследуемой совокупности респондентов, причем все. суждения шкалы предварительно тасуются в беспорядке. Ранг опрашиваемого определяется по сумме набранных баллов.

    Подсчитав средний ранг для различных групп респондентов, можно проранжировать сами группы относительно измеряемого свойства.

    Основное преимущество шкалограммного анализа состоит в од­нозначности балла, получаемого респондентом в отличие от ранее рассмотренных методов шкалирования.

    К недостаткам шкалы относятся большие технические и ряд теоретических трудностей, связанных с ее построением. Кроме того, одномерность не является инвариантной чертой шкалы, т. е. дан­ная шкала может быть одномерной для одной группы индивидов и не быть таковой для другой.

    Семантический дифференциал.






    Метод «семантического» дифференциала (СД) разработан Ч. Осгудом для измерения смысла понятий и слов и прежде всего для дифференциации эмоциональной стороны значения данного понятия11. В социологии и социальной

    психологии метод СД чаще всего применяется при изучении эмо­циональных компонентов социальных установок.

    Для определения отношения респондентов к сопоставляемым между собой объектам (словам) используется следующая процедура. Допустим, требуется измерить различие установок к числу детей в семье. Измерение производится по набору шкал, каждая из ко­торых представляет собой континуум, образованный парой антонимичных прилагательных. Континуум содержит семь градаций ин­тенсивности отношения. Например, по шкале «хорошее — плохое» оценка объекта устанавливается следующим образом: «очень хоро­шее» (+3), «хорошее» (+2), «немного хорошее» (+1) «ни хорошее, ни плохое» (0), «немного плохое» (—1), «плохое» (—2), «очень пло­хое» (—3), Каждый респондент выражает свое отношение к числу детей в семье по всему набору шкал, число которых зависит от лелей исследования и ограничивается объемом опросного листа. Критерием отбора шкал является частота употребления антонимов в языке и способность шкалы вызывать реакции по всему про­странству континуума при оценке самых различных слов.

    После заполнения опросного листа оценки каждого из респондентов по каждой шкале суммируются, затем вычисляется- средняя арифметическая оценка объекта установки для группы в целом. Если полученные средние нанести на график, составленный из вычерченных в масштабе шкал измерения, и соединить таким образом найденные точки ломаной линией то можно получить профиль данного объекта. На рис. 13 наглядно представлены различия -репродуктивных установок при опросе группы из 107 человек12.

    Различие в отношении к числу детей в семье графически выра­жается расстояниями между - средними оценками сопоставляемых объектов по каждой шкале. Однако это различие установок точнее может быть выражено посредством вычисления величины диффе­ренциала Д. Расчет осуществляется по формуле.






    где Д — величина дифференциала, показывающая степень различия в отношении к объектам х и у по набору из л шкал; dразность средних оценок объектов х и у по шкале i. Величина дифференциа­ла выражается положительным числом, и чем ближе оно к нулю, тем выше сходство в отношении к сопоставляемым объектам. Данные табл. 29 показывают различие установок к числу детей (расчет






    произведен по 15 шкалам, 9 из которых представлены на рис. 13).

    Сопоставление абсолютных значений дифференциалов позволяет сделать вывод о том, что различия репродуктивных установок весь­ма существенны и что установки объединяются в две самостоятель­ные группы: установки на малодетность (Д12) и установки на среднедетность (Д34)> так как величины Д12 и Д34 меньше величины Д23—соответственно 2,72—2,62—3,97.

    Следует отметить, что Ч. Осгуд и его коллеги при разработке методики СД и ее применении в различных областях познания вы­явили общую меру, на основе которой выносятся человеческие оценки. Она состоит из трех критериев или факторов, которые в совокупности определяют эмоциональный аспект значения иссле­дуемого понятия.

    Каждый из трех факторов, а именно оценки, силы и активности, представлен набором тесно связанных между собой шкал, отража­ющих отдельные аспекты человеческого восприятия показания ор­ганов чувств. Наиболее употребительными для фактора оценки являются: «хорошее - плохое», «светлое — темное», «чистое — грязное»; для факторов силы: «сильное — слабое», «тяжелое — лег­кое», «твердое — мягкое»; для фактора активности: «активное — пассивное», «быстрое — медленное», «теплое — холодное». Обычно, определяя набор шкал (эта задача является главной при использо­вании метода СД), исходят из специфики оцениваемых объектов и стремятся к тому, чтобы представить все три основных фактора (имеются также и другие факторы, но они встречаются редко, а их применение обусловлено специальными целями исследования).

    Многие исследователи считают, что в принципе методика СД позволяет фиксировать только оценочную сторону отношения, и по­этому часто прибегают к вычислению дифференциала не по шкалам каждого из основных факторов в отдельности, а в целом по всему набору применяющихся шкал. Надо сказать, что рассмотрение на­званных факторов как трех координат измерения значения, как

    трех осей «семантического» пространства встречается в основном в психолингвистике, а также при описании истории создания методи­ки СД и практически в социологии используется крайне редко. Метод СД достаточно сложен и трудоемок, тем не менее его применение оправдывается возможностями выявления различий в реакциях на вербальные объекты.

     

    1. 3.                Надежность измерения социальных характеристик

     

    Описанные выше способы построения шкал не дают полного представления о свойствах полученных оценок. Для этого необхо­димы дополнительные процедуры, результаты которых будем опи­сывать в терминах ошибок измерения. Назовем это проблемой на­дежности измерения. Рассмотрим ее решение на пути выявления правильности измерения, его устойчивости и обоснованности.

    Компоненты надежного измерения. При изучении правильности -устанавливается общая приемлемость данного способа измерения. Непосредственно понятие правильности связано с возможностью учета в результате измерения различного рода систематических оши­бок. Систематические ошибки имеют некоторую стабильную приро­ду возникновения: либо они являются постоянными, либо меняются по определенному закону.

    Устойчивость характеризует степень совпадения результатов измерения при повторных применениях измерительной процедуры и описывается величиной случайной ошибки. Наиболее сложный вопрос надежности измерения — его обоснованность. Обоснованность связана с доказательством того, что измерено вполне определенное заданное свойство объекта, а не некоторое другое, более или менее на него похожее.

    При установлении надежности следует иметь в виду, что в процессе измерения участвуют три составляющие: объект измере­ния, измеряющие средства, с помощью которых производится ото­бражение свойств объекта на числовую систему, и субъект, произ­водящий измерение. Предпосылки надежного измерения кроются в каждой отдельной составляющей.

    Прежде всего сам объект в отношении измеряемого свойства может обладать значительной степенью неопределенности. Так, за­частую у индивида нет четкой иерархии жизненных ценностей, а следовательно, нельзя получить и абсолютно точные данные, ха­рактеризующие важность для него тех или иных явлений.

    Но может быть и так, что способ получения оценки не обеспе­чивает максимально точных значений измеряемого свойства. Напри­мер, у респондента существует определенная иерархия ценностей, а для получения информации используется номинальная оценка с вариациями ответов от «очень важно» до «совсем неважно». Как правило, из приведенного набора все ценности помечаются ответами «очень важно», «важно», хотя реально у респондента имеется боль­шее число уровней значимости.

    Наконец, при наличии высокой точности первых двух составляющих измерения субъект, производящий измерение, допускает грубые ошибки. Например, в процессе клинического интервью, в хо­де которого должна быть выявлена система Ценностей опрашивае­мого, интервьюер не смог довести до респондента суть беседы, не смог добиться доброжелательного отношения к исследованию и пр.

    Каждая составляющая процесса измерения может быть источ­ником ошибки, связанной либо с устойчивостью, либо с правильностью, либо с обоснованностью. Однако, как правило, исследова­тель не в состоянии разделить эти ошибки по источникам их про­исхождения и поэтому изучает ошибки устойчивости, правильности и обоснованности всего измерительного комплекса в совокупности. При этом правильность (как отсутствие систематических ошибок): и устойчивость информации —элементарные предпосылки надеж­ности. Наличие существенной ошибки в этом отношении уже сво­дит на нет проверку данных измерения на обоснованность.

    В отличие от правильности и устойчивости, которые 'могут быть измерены достаточно строго и выражены в форме числового пока­зателя, критерии обоснованности определяются либо на основе логических рассуждений, либо на основе косвенных показателей. В смежных с социологией науках, например в психологии, проблема обоснованности теста решается путем сопоставления его результатов с результатами внешнего критерия — с известной груп­пой или с данными реального поведения. В социологии такой при­дем, как правило, не удается использовать, поэтому обычно применяется сравнение данных одной методики с данными других: методик или исследований, т. е. обоснованность устанавливается более косвенным путем. При этом, разумеется, не обязательно до­биваться полного соответствия результатов. Достаточным будет уста­новление общих тенденций, что зависит и от соотносительной зна­чимости самих критериев, и от их функции в общем замысле ис­следования.

    Правильность измерения — выявление систематических ошибок. Прежде чем приступать к изучению таких компонентов надежно­сти, как устойчивость и обоснованность. Необходимо убедиться в правильности выбранного инструмента измерения (шкалы или, си­стемы шкал).

    Возможно, что последующие этапы окажутся излишними, если в самом начале выяснится полная неспособность данного инстру­мента на требуемом уровне дифференцировать изучаемую совокуп­ность, или может оказаться, что систематически не используется какая-то часть шкалы или ее отдельная градация. Прежде всего нужно ликвидировать или уменьшить такого рода недостатки шкалы и только затем использовать ее в исследовании,

    Отсутствие разброса, ответов по значениям шкалы. Попадание ответов в один, пункт свидетельствует о полной непригодности из­мерительного инструмента — шкалы. Такая ситуация может воз­никнуть или из-за «нормативного» давления в сторону общепринятого мнения; или из-за того, что градации(значения) шкалы по­имею? отношения к определению данного свойства рассматривае­мых объектов (нерелевантны).

    Например, если все опрашиваемые респонденты согласны с ут­верждением «хорошо, когда работа или задание требуют универ­сальных знаний», нет ни одного ответа «не согласен», остается только зафиксировать этот факт, однако подобная шкала не по­может дифференцировать изучаемую совокупность по отношению респондентов» к работе.

    Часто примером нерелевантности являются многие исходные шкалы методики семантического дифференциала Осгуда. Так, в ча­стности, при изучении установок инженера в работе измерения респондентов по шкалам «мужской — женский», «горячий — холод­ный» и др. давали оценку только в середине шкалы, в нейтральной точке, Уточнение позволило сделать вывод, что эти шкалы, по мнению респондентов, не, имеют отношения к изучаемым установкам.

    Использование части шкалы. Довольно часто - обнаруживается, что практически работает лишь какая-то часть шкалы, какой-то один из его полюсов с прилегающей более или менее обшир­ной зоной.

    Так, если респондентам для оценки предлагается шкала, имею­щая положительный и. отрицательный полюса, в частности от +3 до —3, то при оценивании какой-то заведомо положительной ситуа­ции респонденты не используют отрицательные оценки, а диффе­ренцируют свое мнение лишь с помощью положительных. Для того чтобы вычислить значение относительной ошибки измерения, ис­следователь должен знать определенно, какой же метрикой поль­зуется респондент — всеми семью градациями шкалы или только четырьмя положительными. Так, ошибка измерения в 1 балл мало о чем говорит, если мы не знаем, какова действительная вариация мнений.

    Пример13. Девятнадцати испытуемым было предложено выска­зать отношение к трем понятиям по семи шкалам к каждому. Шкалы имели по 21 градации с крайними полюсами +10 и —10 и средней точкой 0. В целом получено 399 (19 • 3 • 7) оценок соследующим распределением:



    Поскольку значения аi< 0 использовались всего лишь 11 раз: (3 + 3 + 5) из 399, т. е. в 2,8% случаев, то возникает вопрос, дей­ствует ли отрицательная часть этой шкалы. Возможно, что попа­дание в эту часть шкалы — явление чисто, случайное. Проверим предположение.

    Будем считать, что если вероятность попадания в конец шкалы превышает 5% при достаточно малом уровне значимости (a == 0,05 или a=0,01), то наблюдаемые попадания ответов являются случайными и соответствующая часть шкалы «не работает». Для этого границы доверительного интервала, построенного по имею­щейся частоте для вероятности попадания в конец шкалы, сравним со значением 5 %. Если значение 5% оказывается выше границ этого интервала, то следует признать, что проверяемая часть шкалы «не работает».

    Для расчета границ доверительного интервала воспользуемся формулами14



    Здесь т — доля попаданий в проверяемую часть шкалы; га — объем выборочной совокупности данных; Zкоэффициент доверия, соответствующий 2a (о доверительном оценивании см. с. 211).

    Для рассматриваемого примера т — 0,0276; п — 399; Za = l,96 для а = 0,05. Подставляя эти значения в формулы, получим pt= 0,016, pz = 0,049. То же самое в процентах: р1 = 1,6%; р2 = 4,9%. Поскольку значение 5% не принадлежит интервалу (1,6%; 4,9%), то считаем, что отрицательная часть шкалы (аi < 0) «не работает», следовательно, 21-балльная оценка функционирует лишь в области от +10 до 0.

    Для вопросов, имеющих качественные градации ответов, можно применять подобное требование в отношении каждого пункта шка­лы: каждый из них должен набирать не менее 5% ответов, в про­тивном случае считаем этот пункт шкалы неработающим.

    Требование 5%-го уровня наполнения в двух рассмотренных задачах не следует рассматривать как строго обязательное; в за­висимости от задач исследования могут быть выдвинуты большие или меньшие значения этих уровней.

    Неравномерное использование отдельных пунктов шкалы. Слу­чается, особенно при использовании упорядоченных шкал, града­ции которых сопровождаются словесными описаниями, что некото­рое значение переменной (признака) систематически выпадает из поля зрения респондентов, хотя соседние градации, характеризующие более низкую и более высокую степень выраженности при­знака, имеют существенное наполнение.

    Так, если конфигурация распределения ответов на вопрос с четырьмя упорядоченными градациями такая, как на рис. 14, то, видимо, шкала неудачно сформулирована. Значительное наполнение двух соседних пунктов (1 и о) свиде­тельствует о «захвате» части голосов из плохо, сформулированного пункта 2. Аналогичная картина наблюдается и в том случае, когда респонденту предлагают шкалу, имеющую слишком большую дробность: будучи не в, со­стоянии оперировать всеми градация­ми шкалы, респондент выбирает лишь несколько базовых. Например, зачастую десятибалльную шкалу респонденты расценивают как некоторую модифи­кацию пятибалльной, предполагая, что «десять» соответствует «пяти», «восемь» — «четырем», «пять» — «трем» и т. д. При этом базовые оценки используются значительно чаще, чем другие.

    Для выявления указанных аномалий равномерного распределе­ния по шкале можно предложить следующее правило: для достаточ­но большой доверительной вероятности (1 — a >=0,99) и, следова­тельно, в достаточно широких границах наполнение каждого зна­чения не должно существенно отличаться от среднего из соседних наполнений.

    Соответствующий статистический критерий таков:



    Эта величина имеет хи-квадрат распределение с одной степенью свободы (df = 1).

    Здесь iномер значения признака, который подвергается ана­лизу; пiнаблюдаемая частота дли этого значения;

     


    1   ...   18   19   20   21   22   23   24   25   ...   38


    написать администратору сайта