Хрестоматия. Петухов. Том 3. Книга 2. Учебник по общей психологии, предназначено для проведения семинарских занятий по данному курсу и самостоятельного чтения
Скачать 20.88 Mb.
|
2. Методы прямого измерения ощущений. Закон Сти-венса. Типы шкал. Методы шкалирования Дж. Гласе, Дж. Стэнли [ИЗМЕРЕНИЕ И ТИПЫ ШКАЛ]1 Измерение Существует множество определений «измерения», несколько отличающихся друг от друга в зависимости от точки зрения исследователя. Общим во всех определениях является, по-видимому, следующее: измерение есть приписывание чисел вещам в соответствии с определенными правилами. Измерить рост человека — значит приписать число расстоянию между макушкой человека и подошвой его ног, найденному с помощью линейки. Измерение коэффициента интеллектуальности (IQ) ребенка — это присвоение числа характеру ответной реакции, возникающей у него на группу типовых задач. Измерение преобразует определенные свойства наших восприятий в известные, легко поддающиеся обработке вещи, называемые «числами». Каким невыносимым был бы мир, если бы мы не измеряли! Разве не полезно физику знать, что сталь плавится при высокой температуре, а путешественнику, — что Чикаго — это «город, вытянутый вдоль спускающегося вниз шоссе»? Известно, какую важную роль играет измерение в педагогике и почти в каждом социальном предприятии. Измерительные шкалы Представления о «шкалах измерений» образуют полезную группу понятий. Этими проблемами интересовались бихевиористы и некоторые другие ученые. Теперь мы кратко рассмотрим различные шкалы и их применение в статистике. 1 Гласе Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.: Прогресс, 1976. С. 12-20. (Здесь и далее заголовки в квадратных скобках даны редакторами-составителями.) Тема 17. Экспериментальные исследования восприятия Измерения в шкале наименований (номинальные измерения)1 Номинальное измерение (присвоение обозначения или обозначений) едва ли заслуживает того, чтобы называться «измерением». Это процесс группирования предметов в классы, когда объекты, принадлежащие к одному классу, идентичны (или почти идентичны) в отношении некоторого признака или свойства. Далее классам даются обозначения; вместо обозначений классы могут также принимать и часто принимают для идентификации числа, которые могут служить объяснением заголовка «номинальное измерение». Схемы классификации видов в биологии — примеры номинальных измерений. Психологи часто кодируют «пол», обозначая «особей женского рода» нулем, а «особей мужского рода» — единицей; это также номинальное измерение. Мы выполнили бы номинальное измерение, если бы присвоили 1 англичанам, 2 — немцам, а 3— французам. Равна ли одному французу сумма одного англичанина и одного немца (1 + 2 = 3)? Конечно, нет. Числа, которые мы присваиваем в номинальном измерении, обладают всеми свойствами любых других чисел. Мы можем складывать их, вычитать, делить или просто сравнивать. Но если процесс присвоения чисел предметам представлял собой номинальное измерение, то наши действия с величиной, порядком и прочими свойствами чисел вообще не будут иметь никакого смысла по отношению к самим предметам, поскольку мы не интересовались величиной, порядком и другими свойствами чисел, когда присваивали их. При номинальных измерениях используется исключительно та особенность чисел, что 1 отличается от 2 или 4 и что если предмет А имеет 1, а предмет В — 4, то А и В различаются в отношении измеряемого свойства. Отсюда вовсе не следует, что в «В» содержится больше свойства, чем в «А». Три остальные шкалы, с которыми мы будем иметь дело, используют три следующих свойства чисел: числа можно упорядочивать по величине, их можно складывать и делить. Порядковые измерения Порядковое измерение возможно тогда, когда измеряющий может обнаружить в предметах различие степеней признака или свойства. В этом случае используется свойство «упорядоченности» чисел и числа приписываются предметам таким образом, что если число, присвоенное предмету А, больше числа, присвоенного В, то это значит, что в А содержится больше данного свойства, чем в В. 1Использованные здесь названия шкал измерений и многие понятия принадлежат С.С.Стивенсу (см.: Стивене С.С. Экспериментальная психология. М.: Иностранная литература, 1960. Т. 1). Гласе Дж.., Стэнли Дж.. [Измерение и типы шкал] 45 Допустим, мы просим кого-то проранжировать Мери, Джейн, Алису и Бетти с точки зрения красоты. Мы можем расположить их следующим образом: Бетти, Джейн, Мери, Алиса. Порядковое измерение имеет место в том случае, когда мы присваиваем Бетти, Джейн, Мери и Алисе соответственно номера 1, 2, 3 и 4. Заметим, что номера 0, 23, 49 и 50 тоже подошли бы, поскольку расстояние между двумя соседними номерами не имеет значения. Мы не можем себе представить, что измеритель в состоянии распознать, например, будет ли различие между «количеством» красоты Бетти и Джейн больше или меньше разницы между красотой Джейн и Мери. Поэтому не стоит придавать большого значения тому, что разница в оценках Бетти и Джейн такая же, как и дистанция между Мери и Алисой. Посмотрим теперь, как числа занимают места предметов. Числа — это частичные представители предметов; мы обращаемся к ним, когда важны как различия между ними, так и их порядок. При порядковых измерениях числа обеспечивают некоторую экономию при передаче информации. Вместо сообщения о том, что «Бетти признана наименее красивой, Джейн — следующей за ней, Мери — второй после самой красивой, а Алиса — самой красивой», мы можем сказать:
Шкала твердости минералов — тоже порядковая шкала. Если минерал А может оставить царапины на минерале В, то он тверже, следовательно, он получает более высокий номер. Предположим, что минералам А, В, С и Dподобным способом приписаны соответственно номера 12, 10, 8 и 6. Нам известен самый твердый и самый мягкий минерал. Разность твердостей А и В является такой же, как и разность твердостей С и D, или нет? Мы не имеем об этом никакого представления, потому что номера были присвоены так, что учитывались только признаки однозначности и порядка — измерение было порядковым. Другой известной порядковой шкалой является «ранг в классе средней школы». Номера устанавливаются от «1» для «максимального среднего значения отметок» до п для «минимального среднего значения отметок» в группе из п учеников. (Если бы, например, три первых ученика имели максимально возможные средние, то каждый из них должен был бы получить ранг «2», представляющий собой среднее первых трех рангов 1, 2 и 3. Этот способ присвоения чисел основан на соглашении, 46 Тема 17. Экспериментальные исследования восприятия потому что сохраняется постоянной сумма связанных и несвязанных рангов, например: 1+2 + 3 = 2 + 2 + 2.) Не существует закона, запрещающего кому-либо складывать, вычитать, умножать и производить другие операции над числами, которые присвоены предметам в ходе порядкового измерения. Однако результаты этих операций могут и ничего не говорить о количествах анализируемого свойства, которым обладают предметы, соответствующие этим числам. Например, различие между «рангами красоты» Алисы и Бетти равно трем; различие между рангами Мери и Джейн равно единице. Но есть ли смысл в том, что разница в красоте между Алисой и Бетти оценивается в три раза выше, чем между Мери и Джейн? Конечно, нет. Результаты арифметических действий здесь нельзя интерпретировать так, что они говорят нам что-либо о количествах свойства, которым фактически обладают предметы. Вы можете делать с числами, которые вы получаете, все, что угодно, но вы всегда столкнетесь с вопросом: «Имеют ли какое-нибудь значение результаты этих операций?» Интервальные измерения Интервальное измерение возможно, когда измеритель способен определить не только количества свойства в предметах (характеристика порядкового измерения), но также фиксировать равные различия между предметами. Для интервального измерения устанавливается единица измерения (градус, метр, сантиметр, грамм и т.д.). Предмету присваивается число, равное количеству единиц измерения, которое эквивалентно количеству имеющегося свойства. Например, температура некоторого металлического бруска 86° по Цельсию. Важная особенность, отличающая интервальное измерение от измерения отношения (которое будет рассмотрено ниже), состоит в том, что оцениваемое свойство предмета вовсе не пропадает, когда результат измерения равен нулю. Так, вода при 0° С имеет все же некоторую температуру. Точка нуль на интервальной шкале произвольна. Числа, приписываемые в процессе интервального измерения, имеют свойства однозначности и упорядоченности. Кроме того, в данном случае существенна и разница между числами. Число, присвоенное предмету, представляет собой количество единиц измерения, которое он имеет. Сегодня температура 16° по Цельсию; вчера 13°. Сегодня на 3° теплее, чем вчера. Если завтра температура будет 22°, то вчера и сегодня имеют больше сходства с точки зрения температуры, чем вчера и завтра. Разность между 13 и 16 составляет половину разности между 16 и 22; кроме того, величины этих разностей говорят нам кое-что о температуре воздуха. Исчисление лет — интервальная шкала. Год первый был выбран произвольно как «год рождения» Христа. Единица измерения — период Гласе Дж.., Стэнли Дж. [Измерение и типы шкал] 47 в 365 дней. 1931 г. ближе к настоящему времени, чем любой другой год с меньшим номером. Время между 1776 и 1780 гг. равно времени между 1920 и 1924 гг. Джемс К.Полк был президентом США в течение срока (1845—1849) вдвое меньшего, чем Дуайт Д.Эйзенхауэр (1953—1961). Интервальное измерение — это такое присвоение чисел предметам, когда равные разности чисел соответствуют равным разностям значений измеряемого признака или свойства предметов. Измерение отношений Измерение отношений отличается от интервального только тем, что нулевая точка не произвольна, а указывает на полное отсутствие измеряемого свойства. Измеритель может заметить отсутствие свойства и имеет единицу измерения, позволяющую регистрировать различающиеся значения признака. Равные различия чисел, присвоенных при измерении, отражают равные различия в количестве свойства, которым обладают оцениваемые предметы. Кроме того, раз нулевая точка не произвольна, а абсолютна, то не лишено смысла утверждение, что у А в два, три или четыре раза больше свойства, чем у В. Рост и вес являются примерами шкал измерения отношений. Нулевого роста вообще не существует, а мужчина ростом 183 см в два раза выше мальчика, имеющего рост 91,5 см, Шкала отношений называется так потому, что отношения чисел для нее существенны. Эти отношения можно интерпретировать как отношения значений свойств измеряемых объектов. Установление отношения применительно к точной интервальной шкале в терминах количества свойства в объектах не имеет смысла. Например, если 3 июня максимальная температура была 32° С, а 17 марта — 8° С, то неправильно говорить, что 3 июня была температура в четыре раза выше, чем 17 марта. В педагогике и в науках о поведении большинство измерений относится к номинальному, порядковому и интервальному уровням. Лишь наименее важные переменные в этих областях допускают пока измерение отношений: в действительности только с трудом можно найти шкалы, удовлетворяющие условиям интервальной шкалы. Иногда переменные шкалы отношений, такие, как время (решения задачи или заучивания списка слов), рост, вес или расстояние, могут представлять интерес, но это бывает не часто. Таблица 1 подводит итог и дополняет сказанное относительно шкал измерения. Измерительные шкалы описаны выше догматически. Мы пытались опереться на доводы небольшой группы психологов, имеющих точные представления об уровне, на котором проводится измерение. Мы не можем изложить их аргументы так хорошо, как они это сделали сами, и поэтому рекомендуем обратиться к их работам, прежде чем вынести суж- 48 Тема 17. Экспериментальные исследования восприятия дение об их позиции. В этих работах вы найдете доводы за и против вышеприведенных понятий. Anderson N.H. Scales and statistics: parametrics and nonparametrics // Psychological Bulletin. 1961. 58. № 4. P. 305—316. Kaiser H.F. Review of «Measurement and Statistics» by Virginia Senders // Psychometrica. 1960. 25. P. 411—413. (Этот обзор работы Сендерс является в высшей степени критическим по отношению к позиции, занимаемой Стивенсом и Сендерс). Lord F.M. On the statistical treatment of football numbers // American Psychologist. 1953. 8. P. 750—751. (Эта сатирическая статья видного психометрика и статистика представляет собой убедительный вывод про- Гласе Дж.., Стэнли Дж. [Измерение и типы шкал] 49 тив такого представления, будто шкала измерения указывает, какую статистику можно использовать). Senders V.L. Measurement and Statistics. N. Y.: Oxford University Press, 1958. (Этот учебник построен на основе понятий Стивенса; позиция автора — одна из крайних позиций, занимаемых психологами). Siegel S. Nonparametric Statistics. N. Y.: McGraw-Hill, 1956. (Позиция Зигеля идентична позиции Стивенса. Книга Зигеля сосредоточивает внимание на том, какие статистические методы свойственны тем или иным шкалам. Несмотря на полезный во многих отношениях материал, подчеркивание «допустимости» и «пригодности» статистики, вероятно, неуместно). Математика, измерение и психофизика // Экспериментальная психология / Под ред. С.С.Стивенса. М.: Иностранная литература, 1960. Т. I. С. 19—89. (Эта ранняя статья пробудила интерес к проблеме измерительных шкал и вызвала горячую полемику). Эти работы могут создать впечатление, что «шкала» некоторым образом задает определенные свойства. Некий набор чисел, присвоенных группе объектов, вполне определенно относит их к той или иной категории: шкала является либо номинальной, либо порядковой, либо интервальной, либо шкалой отношений; и ничего другого нет. Эта позиция может привести к хаосу при недостатке понимания со стороны тех, кто реально осуществляет психологические и педагогические измерения. Сторонники Стивенса утверждают, например, что шкалы IQ (коэффициента интеллектуальности) порядковые, а не интервальные. Некритичное принятие этого утверждения вынуждает совершенно игнорировать величину разницы между оценками IQ. Предположим, Джо имеет по шкале IQ оценку 50, Сэм — 110, а Боб — 112. Если IQ — в самом деле порядковая шкала, то можно сказать лишь, что Боб умнее Сэма, который умнее Джо. Утверждение, что Боб и Сэм более похожи с точки зрения IQ, чем Сэм и Джо, было бы неоправданно. Сказать, что последнее утверждение необоснованно, потому что шкалы IQ — только порядковые шкалы, было бы произволом. Спросите человека, проводившего испытания IQ, и он скажет вам до проверки детей, что Джо гораздо менее умен, чем Сэм и Боб, которые более близки друг к другу. Попытайтесь внушить этому исследователю, что ему не следует обращать внимания на величины различий между оценками, и он попросит вас заняться вашим собственным делом и будет прав. Даже несмотря на то, что единица IQ не совсем эквивалентна единице измерения при различных значениях IQ, шкалы IQ находятся не на одном уровне с более низкими порядковыми шкалами. Шкала IQ производит как строго порядковую, так и интервальную категоризацию: может быть лучше говорить о ней как о «квазиинтервальной». Часто для исследователя важно классифицировать шкалы измерений по категориям. Если числа, которые измеритель приписывает п 50 Тема 17. Экспериментальные исследования восприятия различным объектам, представляют собой ряд не более чем в п рангов, то есть 1, 2, ..., п (порядковая шкала), то некоторые операции с числами бессмысленны по отношению к свойствам объектов. Исследователя следует предупредить об этом. Он должен понимать также, что если он произвольно присвоил 3 мужчинам, а 2 женщинам (номинальное измерение), то тот факт, что 3 больше 2, ничего не говорит об измеряемом признаке, называемом «пол». Таким образом, различия между шкалами могут оказаться полезными. Однако, за исключением крайне редко используемых мер (таких, как время, длина, масса), педагогические и психологические измерения, особенно клинические, не поддаются какой-либо простой классификации, вроде «порядковой» или «интервальной». Больше мы не будем делать замечаний по шкалам. Лишь немногие статистические методы, обсуждаемые в этой книге, строились с учетом связи мер с объектами измерения. Характер этой связи представляет интерес для специалиста по измерениям. Статистические методы — это средства анализа чисел, как таковых, а не как истинных значений некоторого признака. Всякий статистический метод можно применить к любой совокупности чисел (с некоторыми ограничениями, разумеется), но мы не знаем метода, который был бы неэффективным, потому что используемые в нем числа являются «неподходящими». Статистические методы (вероятно, кроме некоторых психометрических методов шкалирования) ничего не добавляют и ничего не отнимают от значимости чисел, к которым они применяются. Эта точка зрения, сформулированная с юмором и проницательностью, принадлежит Каплану: «Математика может избавить нас от мучительной необходимости размышлять, но мы должны платить за эту привилегию, испытывая муки раздумий как до того как математика вступает в действие, так и после. Я вспоминаю детскую загадку, где обнаруживается эта необходимость. Трое мужчин зарегистрировались в отеле, уплатив по 10 долларов каждый за комнату. Служащий, чуть позже сообразивший, что три комнаты составили комплект, стоимость которого только 25 долларов, дал 5 долларов коридорному для возврата гостям. Так как 5 долларов не делятся на три, а также и по другим, менее деликатным причинам коридорный оставил 2 доллара у себя и вернул только 3. На обратном пути он подсчитал: «Каждый из них заплатил 10 долларов. Я вернул 3 доллара или по одному доллару каждому, поэтому каждый из них в действительности заплатил 9. Далее, трижды девять — 27, плюс 2 доллара, которые я оставил у себя, получим 29. Где же тридцатый доллар?» Конечно, если его 2 доллара вычесть из 27, а не прибавить, то остаток равен 25 — сумме оплаты отеля. Мы вольны складывать числа, если хотим, но не должны рассчитывать, на то, чтобы сумма играла какую-нибудь роль в данной ситуации. В махинациях коридорного отсутствует не доллар, а здравый смысл: его логика была не лучше, чем его мораль»1. 1 Kaplan A. The Conduct of Inquire. San Francisco: Chandler, 1964. P. 205-206. |