Перегудов Ф. И., Тарасенко Ф. П
Скачать 4.17 Mb.
|
§ 6.2. ИЗМЕРИТЕЛЬНЫЕ ШКАЛЫИзмерение – это алгоритмическая операция, которая данному наблюдаемому состоянию объекта, процесса, явления ставит в соответствие определенное обозначение: число, номер или символ. Такое соответствие обеспечивает то, что результаты измерений содержат информацию о наблюдавшемся объекте, количество же информации зависит от степени полноты этого соответствия и разнообразия вариантов (см. § 5.7) . Нужная нам информация получается из результатов измерения с помощью их преобразований, или, как еще говорят, с помощью обработки экспериментальных данных. Совершенно ясно, что чем теснее соответствие между состояниями и их обозначениями, тем больше информации можно извлечь в результате обработки данных. Менее очевидно, что степень этого соответствия зависит не только от организации измерений (т.е. от экспериментатора), но и от природы исследуемого явления, и что сама степень соответствия в свою очередь определяет допустимые (и недопустимые) способы обработки данных. В данном параграфе мы будем рассматривать только такие объекты, про любые два состояния которых можно сказать, различимы они или нет, и только такие алгоритмы измерения, которые различным состояниям ставят в соответствие разные обозначения, а неразличимым состояниям – одинаковые обозначения* . Это означает, что как состояния объекта, так и их обозначения удовлетворяют следующим аксиомам эквивалентности: 10. А = A (рефлексивность). 20. Если А = В, то В = А (симметричность). 30. Если А = В и В = С, то А = С (транзитивность). Здесь символ = обозначает отношение эквивалентности; в том случае, когда А и В – числа, он означает их равенство. ШКАЛЫ НАИМЕНОВАНИЙ Предположим, что число различимых состояний (математический термин – число классов эквивалентности) конечно. Каждому классу эквивалентности поставим в соответствие обозначение, отличное от обозначений других классов. Теперь измерение будет состоять в том, чтобы, проведя эксперимент над объектом, определить принадлежность результата к тому или иному классу эквивалентности и записать это с помощью символа, обозначающего данный класс. Такое измерение называется измерением вшкаленаименований (иногда эту шкалу называ- ют также номинальной или классификационной); указанное множество символов и образует шкалу. Особенности шкалы наименований рассмотрим на примерах. Естественнее всего использовать шкалу наименований в тех случаях, когда классифицируются дискретные по своей природе явления (например, различные объекты). Для обозначения классов могут быть использованы как слова естественного языка (например, географические названия, собственные имена людей и т.д.), произвольные символы (гербы и флаги государств, эмблемы родов войск, всевозможные значки и т.д.), номера (регистрационные номера автомобилей, официальных документов, номера на майках спортсменов), так и их различные комбинации (например, почтовые адреса, экслибрисы личных библиотек, печати и пр.) Все эти обозначения эквивалентны простой нумерации (в некоторых странах человек при рождении получает номер, под которым он фигурирует в государственных информационных системах всю жизнь), но на практике часто предпочитают другие обозначения (вообразите, что вместо имен и фамилий ваших друзей и знакомых вы должны будете использовать номера!). Поскольку присваиваемое классу объектов обозначение в принципе произвольно (хотя после присвоения и однозначно), эту свободу в выборе можно использовать для удобства. Так, при большом и/или нефиксированном числе классов их конкретизация упрощается и облегчается, если обозначения вводятся иерархически. Примером могут служить почтовые адреса: страна – территориальная административная единица (республика, штат, кантон, графство, область) – населенный пункт – улица – дом – квартира – адресат. Другой пример – автомобильные номера: в их символике есть обозначение как территории, так и принадлежности машины (государственная или личная). Необходимость классификации возникает и в тех случаях, когда классифицируемые состояния образуют непрерывное множество. Задача сводится к предыдущей, если все множество разбить на конечное число подмножеств, искусственно образуя тем самым классы эквивалентности. Теперь принадлежность состояния к какому-либо классу снова можно регистрировать в шкале наименований. Однако условность введенных классов (не их шкальных обозначений, а самих классов) рано или поздно проявится на практике. Например, возникают трудности точного перевода с одного языка на другой при описании цветовых оттенков: в английском языке голубой, лазоревый и синий цвета не различаются; не исключено, что англичане иначе видят мир (например, в одном английском толковом словаре слово “синий” объясняется как “цвет чистого неба, древесного дыма, снятого молока, свинца”, а в другом – как “цвет неба или моря, а также вещей намного бледнее или темнее, как дым, удаленные холмы, лунный свет, синяк”). Аналогичная ситуация имеет место в профессиональных языках. Вспомним примеры с наименованиями коров у африканского племени масаев, различных состояний снега у эвенков (см. § 2.3). Названия болезней также образуют шкалу наименований. Психиатр, ставя больному диагноз “шизофрения”, “паранойя”, “маниакальная депрессия” или “психоневроз”, использует номинальную шкалу; и все же иногда врачи не зря вспоминают, что “нужно лечить больного, а не болезнь”: название болезни лишь обозначает класс, внутри которого на самом деле имеются различия, так как эквивалентность внутри класса носит условный характер. Перейдем теперь к вопросу о допустимых операциях над данными, выраженными в номинальной шкале. Подчеркнем еще раз, что обозначения классов – это только символы, даже если для этого использованы номера. Номера лишь внешне выглядят как числа, но на самом деле числами не являются. Если у одного спортсмена на спине номер 4, а другого – 8, то никаких других выводов, кроме того, что это разные участники соревнований, делать нельзя: так, нельзя сказать, что второй “в два раза лучше” или что у одного из них форма новее. С номерами нельзя обращаться как с числами, за исключением определения их равенства или неравенства: только эти отношения определены между элементами номинальной шкалы (см. приведенные выше аксиомы 10 – 30). Поэтому при обработке экспериментальных данных, зафиксированных в номинальной шкале, непосредственно с самими данными можно выполнять только операцию проверки их совпадения или несовпадения. Изобразим эту операцию с помощью символа Кронекера: ?ij = {1: хi = хj; 0: хi? хj}, где хi и хj – записи разных измерений. С результатами этой операции можно выполнять более сложные преобразования: считать количества совпадений (например, число наблюдений k-го класса равно , n – общее число наблюдений), вычислять относительные частоты классов (например, частота k-го класса есть рk = nk/n), сравнивать эти частоты между собой (находя, например, моду – номер наиболее часто встречающегося класса ), выполнять различные статистические процедуры, строго следя, однако, чтобы в этих процедурах с исходными данными не выполнялось ничего, кроме операции проверки их на совпадение (например, можно использовать 2 -тест, другие тесты на относительных частотах, коэффициент согласия и т.д.). В тех случаях, когда наблюдаемый (измеряемый) признак состояния имеет природу, не только позволяющую отождествить состояния с одним из классов эквивалентности, но и дающую возможность в каком-то отношении сравнивать разные классы, для измерений можно выбрать более сильную шкалу, чем номинальная. Если же не воспользоваться этим, то мы откажемся от части полезной информации. Однако усиление измерительной шкалы зависит от того, какие именно отношения между классами существуют в действительности. Это и явилось причиной появления измерительных шкал разной силы. ПОРЯДКОВЫЕ ШКАЛЫ Следующей по силе за номинальной шкалой является порядковая шкала (используется также название ранговая шкала). Этот класс шкал появляется, если кроме аксиом тождества 10 – 30 классы удовлетворяют следующим аксиомам упорядоченности: 40. Если А В, то либо A > B, либо В > А. 50. Если А > В и В > С, то А > С. Обозначив такие классы символами и установив между этими символами те же отношения порядка, мы получим шкалусовершенногопорядка. Примерами применения такой шкалы являются нумерация очередности, воинские звания, призовые места в конкурсе. RANK, NUMBER, POINT, SCORE балл MEASUREMENT измерение INTERVAL интервал RATIO отношение (чисел) NOMINAL SCALE шкаланаименований Измерение – операция, ставящая наблюдаемому явлению в соответствие один из элементов подходящей измерительной шкалы. Измерительная шкала может иметь разную силу в зависимости от того, являются ли ее элементы символами, номерами или числами. Измерительную шкалу следует выбирать максимально сильной, однако сила шкалы должна соответство-вать природе наблюдаемого явления и не быть завышенной. Иногда оказывается, что не каждую пару классов можно упорядочить по предпочтению: некоторые пары считаются равными. В таком случае аксиомы 40 и 50 видоизменяются. 4'. Либо А В, либо А В. 5'. Если А В и В С, то А С. Шкала, соответствующая аксиомам 4' и 5', называется шкалой квазипорядка. Примером шкалы квазипорядка служит упорядочение по степени родства с конкретным лицом (мать = отец > сын = дочь, дядя = тетя < брат = сестра и т.п.). Иная ситуация возникает, когда имеются пары классов, несравнимые между собой, т.е. ни А В, ни В А (это отличается от условия квазипорядка, когда одновременно А В и В А, т.е. А = В) . В таком случае говорят о шкалечастичногопорядка. Шкалы частичного порядка часто возникают в социологических исследованиях субъективных предпочтений. Например, при изучении покупательского спроса субъект часто не в состоянии оценить, какой именно из двух разнородных товаров ему больше нравится (например, клетчатые носки или фруктовые консервы, велосипед или магнитофон и т.д.); затрудняется человек и упорядочить по предпочтению любимые занятия (чтение литературы, плавание, вкусная еда, слушание музыки...). Как видим, порядковые шкалы могут быть различными. В зависимости от того, каким аксиомам упорядоченности отвечают рассматриваемые объекты, мы должны пользоваться либо шкалой совершенного, либо шкалой частичного порядка. Однако разнообразие порядковых шкал этим не исчерпывается. Иногда число градаций в шкале задается заранее, и эксперимент лишь определяет, к какому из упорядоченных классов относится наблюдаемый объект (например, оценка на экзамене, сила землетрясения, воинское звание и т.п.) . В других случаях эталонные классы отсутствуют, а упорядочение проводится непосредственным попарным сравнением самих рассматриваемых объектов (например, выстраивание солдат в шеренгу по росту, определение мест в результате спортивных соревнований, музыкальных конкурсов и т. д.). Очень важно обратить внимание на то, что отношение порядка ничего не говорит о “дистанциях” между сравниваемыми классами или объектами. Это придает порядковым шкалам характерную особенность: наблюдения, зафиксированные в таких шкалах, не являются числами. Даже если экспериментальные данные представлены цифрами (как школьные баллы, номера мест, занятых в соревновании, и т.п.), эти данные нельзя рассматривать как числа. Над ними нельзя производить арифметические операции и вообще любые действия, результат которых изменится при преобразованиях шкалы, не нарушающих порядка. Например, нельзя вычислять среднее арифметическое порядковых измерений (х1, х2, ..., хi, ..., хn), т.е. величину , так как переход к монотонно преобразованной шкале х' = f(х) (сохраняющей данную упорядоченность) после усреднения даст величину . Между тем не все это знают; ярким примером такого широко распространенного заблуждения являлось использование в школах и вузах в недавнем прошлом (а кое-где продолжающееся и сейчас) “средних баллов”. Правда, сразу было замечено, что средний балл, худо-бедно “работавший” в руках одного учителя, в рамках одного класса переставал играть роль объективного показателя при сравнении выпускников разных школ. Во всяком случае непродуманно введенный ранее учет средних школьных баллов при проведении конкурса для поступления в высшие учебные заведения был недавно отменен. Допустимые операции над порядковыми наблюдениями вытекают из отношений, определяющих эти шкалы, т.е. из отношений эквивалентности и предпочтения. Допустимые операции представляют собой только операции проверки выполнимости этих отношений. Операция проверки принадлежности наблюдения к заданному классу (или неразличимости двух наблюдений) была уже введена выше, при рассмотрении номинальной шкалы, как символ Кронекера ?ij, где один индекс – номер наблюдения, а другой – номер класса или другого наблюдения (в зависимости от типа порядковой шкалы). Операция проверки отношения предпочтения тоже может быть формализована. Введем индикаторную функцию Сij предпочтения для упорядоченной* пары индексов (i, j), а именно: Сij = { 1, если объект с индексом i предпочтительнее объекта с индексом j или эквивалентен ему; 0, если верно обратное предпочтение }. В результате по значению бинарной функции Сij мы можем однозначно судить о порядке предъявленных объектов. Как и ранее, в зависимости от типа шкалы, один объект – данное наблюдение, а другой – либо некоторый класс, либо другое наблюдение. Итак, непосредственно над порядковыми данными можно производить только операции по определению величин ?ij и Сij. Результаты этих операций являются двоичными числами; над ними уже можно производить арифметические и логические операции. Например, если i и j – номера наблюдений в совокупности данных (х1, ..., хi, ..., хn), то мы можем установить номер i-го наблюдения в упорядоченном ряду: . Этот номер называется рангом i-го объекта; отсюда про- исходит специальное название для данного типа порядковых шкал – ранговые. Если имеет место квазипорядок, то часть наблюдений мо- жет совпадать (в статистике такая группа наблюдений называется связкой), и все члены связки получают одинаковый (старший для них) ранг. Когда это неудобно, прибегают либо к присвоению ранга, среднего для данной связки (мидранга), либо присваивают ранги от младшего до старшего случайным образом. С числами ?ij и Сij можно выполнять и другие необходимые операции. Кроме нахождения частот и мод (как и для номинальной шкалы), появляется возможность определить выборочную медиану (т.е. наблюдение с рангом Ri, ближайшим к числу n/2); можно разбить всю выборку на части в любой пропорции, находя выборочные квантили любого уровня р, 0 < р < 1 (т.е. наблюдения с рангом Ri, ближайшим к величине nр); можно определить коэффициенты ранговой корреляции между двумя сериями порядковых наблюдений (rs Спирмэна, ? Кендалла); строить другие статистические процедуры. Подчеркнем еще раз, что даже в тех случаях, когда состояния, которые допускают только порядковые сравнения, в эксперименте измеряются через величины, связанные с ними косвенно, но фиксируемые в числовых шкалах, эти измерения все равно остаются измерениями в порядковой шкале. Пфанцагль [6] приводит наглядные примеры, иллюстрирующие сказанное. Первый пример взят из медицины. Известно, что за показатель интенсивности патологического процесса принимается скорость выпадения осадка при добавлении в пробирку с кровью цитрата натрия; скорость осаждения измеряется в миллиметрах в единицу времени. Идея такого измерения основана на том, что увеличение интенсивности патологического процесса приводит к повышению содержания глобулина, что увеличивает скорость выпадения осадка. Поэтому высота слоя осадка за данный интервал времени монотонно связана с интенсивностью исследуемого патологического процесса. Функциональный вид этой связи неизвестен, для разных лиц различен и нелинеен: изменение количества цитрата натрия или времени осаждения приводит к непропорциональным изменениям высоты осадка. Теперь предположим, что для одного больного лекарство А привело к уменьшению осадка с 75 до 60 мм, а для другого лекарство Б – с 65 до 55 мм. Отсюда нельзя заключать, что лекарство А эффективнее, так как оно привело к уменьшению осадка на 15 мм, а лекарство Б – только на 10! В качестве второго примера рассматривается испытание умственных способностей, при котором измеряется время, затрачиваемое испытуемым на решение тестовой задачи. В таких экспериментах время хотя и измеряется в числовой шкале, но как мера интеллекта принадлежит порядковой шкале. Выше мы не без умысла к названию порядковой шкалы присоединяли слова “в строгом смысле”. Суть состоит в том, что порядковые в строгом смысле шкалы определяются только для заданного набора сравниваемых объектов, у этих шкал нет общепринятого, а тем более абсолютного стандарта. Поэтому при определенных условиях правомерно выражение “первый в мире, второй в Европе” – просто чемпион мира занял второе место на всеевропейских соревнованиях. МОДИФИЦИРОВАННЫЕ ПОРЯДКОВЫЕ ШКАЛЫ По-видимому, опыт работы с сильными числовыми шкалами и желание уменьшить относительность порядковых шкал, придать им хотя бы внешнюю независимость от измеряемых величин побуждают исследователей к различным модификациям, придающим порядковым шкалам некоторое (чаще всего кажущееся) усиление. Другая важная причина попыток усиления шкалы состоит в том, что многие измеряемые в порядковых (принципиально дискретных) шкалах величины имеют действительный или мыслимый непрерывный характер: сила ветра или землетрясения, твердость вещества, глубина и прочность знаний, овладение навыками и т.п. Сама возможность введения между любыми двумя шкальными значениями третьего способствует тому, чтобы попытаться усилить шкалу. Все это вместе взятое привело к появлению и использованию на практике ряда порядковых шкал, но не в таком “строгом смысле”, как те, о которых мы говорили выше. При этом иногда с полученными данными начинают обращаться как с числами, даже если произведенная модификация не выводит шкалу из класса порядковых. Это сопряжено с ошибками и неправильными решениями. Рассмотрим некоторые из известных модификаций. Шкала твердости по Моосу. Из двух минералов тверже тот, который оставляет на другом царапины или вмятины при достаточно сильном соприкосновении. Отношение “А тверже В” – типичное отношение порядка. В 1811 г. немецкий минералог Ф. Моос предложил установить стандартную шкалу твердости, постулируя только десять ее градаций. За эталоны приняты следующие минералы с возрастающей твердостью: 1 – тальк, 2 – гипс, 3 – кальций, 4 – флюорит, 5 – апатит, 6 – ортоклаз, 7 – кварц, 8 – топаз, 9 – корунд, 10 – алмаз. Шкала Мооса устанавливает искусственно квазипорядок, так как промежуточных единиц градаций твердости эта шкала не имеет. Градации твердости все равно не носят числового характера: нельзя говорить ни что алмаз в два раза тверже апатита, ни что разница в твердостях флюорита и гипса такая же, как у корунда и кварца; измерения твердости методом царапания не дают оснований для оправдания таких утверждений. Шкала силы ветра по Бофорту. В 1806 г. английский гидрограф и картограф адмирал Ф. Бофорт предложил балльную шкалу силы ветра, определяя ее по характеру волнения моря: 0 – штиль (безветрие), 4 – умеренный ветер, 6 – сильный ветер, 10 – шторм (буря), 12 – ураган. Кроме штиля, градации силы ветра имеют условный, качественный характер. Шкала магнитуд землетрясений по Рихтеру. В 1935 г. американский сейсмолог Ч. Рихтер предложил 12-балльную шкалу для оценки энергии сейсмических волн в зависимости от последствий прохождения их по данной территории. Затем он развил метод оценки силы землетрясения в эпицентре по его магнитуде на поверхности земли и глубине очага. Балльные шкалы оценки знаний учащихся. Слушая ответы учащихся или сравнивая их письменные работы, опытный преподаватель может обнаружить разницу между ними и установить, чьи ответы лучше; это типичное отношение порядка. Методом сравнения можно определить, кто в классе лучше других знает данный предмет; сложнее, но иногда возможно (это зависит от состава класса) определить лучшего ученика в классе. Сравнение старшеклассника с младшеклассником по степени овладения знаниями проблематично. Потребность общества в официальном определении степени квалифицированности проходящих обучение независимо от того, где, когда и как они получают образование, способствовала введению общепринятых шкал для оценивания знаний учащихся в виде баллов (такие шкалы введены повсеместно). Все испытывают, в том числе и на собственном опыте, неточность, приблизительность этой шкалы. Одна из попыток “улучшить” шкалу баллов состоит в увеличении числа градаций. В наших школах принята 5-балльная, в вузах – 2-балльная (для зачетов) и 4-балльная (для экзаменов) системы оценок, в некоторых европейских странах – 10-балльная, а в англоязычных странах – 100-балльная система. Это не спасает положения, и преподаватели неофициально (“для себя”) вводят дополнительные градации – присоединяют к баллам плюсы, минусы, точки. Примечательно, что и при 100-балльной шкале некоторые преподаватели используют дробные баллы. Все это происходит потому, что не существует ни абсолютного стандарта, единого для всех людей, ни даже условного общедоступного стандарта, наподобие эталонов твердости или высоты волн, и знания могут оцениваться только в порядковой шкале. Тем не менее мало кто (не только учащиеся, но и преподаватели) понимает, что балльная шкала принадлежит к классу порядковых. Дело доходит до того, что даже в официальных вопросах, влияющих на судьбы людей, учитывают среднеарифметический балл – величину, не имеющую смысла в порядковой шкале! Некоторый оттенок объективности и количественности балльной шкале пытаются придать директивным определением того, каким требованиям должен удовлетворять учащийся, чтобы иметь право на тот или иной балл, т.е. ввести независимые стандарты. Однако преподаватели неизбежно по-разному понимают и выполняют инструкции, и оценки все равно получаются относительными: известно, что уровень знаний отличников разных школ или вузов заметно различается. Именно поэтому в ответственных случаях устраивают не конкурсы документов об успеваемости, а конкурсы самих претендентов, т.е. возвращаются к порядковому измерению, непосредственному сравнению обладателей знаний. ШКАЛЫ ИНТЕРВАЛОВ Если упорядочивание объектов можно выполнить настолько точно, что известны расстояния между любыми двумя из них, то измерение окажется заметно сильнее, чем в шкале порядка. Естественно выражать все расстояния в единицах, хотя и произвольных, но одинаковых по всей длине шкалы. Это означает, что объективно равные интервалы измеряются одинаковыми по длине отрезками шкалы, где бы они на ней ни располагались. Следствием такой равномерности шкал этого класса является независимость отношения двух интервалов от того, в какой из шкал эти интервалы измерены (т.е. какова единица длины интервала и какое значение принято за начало отсчета). ORDER, ORDINAL, ORDER-TYPE порядковый TIE связка (наблюдений) WEAK, FEEBLE слабый PARTIAL частичный Данные, зафиксированные в протоколе эксперимента принадлежат определенной измерительной шкале. При обработке данных важно следить за тем, чтобы над ними выполнялись только такие действия, которые допустимы для использованной шкалы. Нарушение этого правила может привести к неправомерной интерпретации результатов опыта. Сказанное можно выразить вполне формализованно. Пусть М – множество совершенно упорядоченных элементов, для каждой пары с, d которых задано вещественное число ?(с, d), удовлетворяющее следующим условиям: (1) если с < d, то ?(с, d) >0; (2) если с М и r – вещественное число, то найдутся такие d, е M, что ?(с, d)= r, ?(с, е) = = –r; (3) для любых (с, d, е) M верно равенство ?(с, d) + ?(d, е) = ?(с, е). Множество М с таким бинарным отношением назовем интервальной шкалой. В шкале интервалов можно ввести систему координат. Выберем для этого любую пару точек (“репер”) с, d М; точка с играет роль начала координат, а интервал (с, d) – роль единичного интервала. Каждой точке е М поставим в соответствие координату хe = ?(с, е)/?(с, d). Тогда точка с будет иметь координату 0, а точка d – координату 1. Если ввести в М другую систему координат, построенную на репере с1 n d1, то координаты xe и xe1 точки е в этих двух системах координат будут связаны линейным соотношением хе = = аxe1 + b. Действительно, ,. Следовательно, где а и b – очевидные обозначения. Несмотря на то, что координата xe и разности хе – хf меняются при смене репера, для любых е, f, g, h М отношение интервалов не зависит от выбора репера. Итак, интервальные шкалы могут иметь произвольные начала отсчета и единицы измерения, что можно выразить словами: “шкала интервалов единственна с точностью до линейных преобразований”. Примерами величин, которые по физической природе либо не имеют абсолютного нуля, либо допускают свободу выбора в установлении начала отсчета и поэтому измеряются в интервальных шкалах, являются температура, время, высота местности. Начало летоисчисления у христиан установлено от рождества Христова, а у мусульман – на 622 г. позднее – от переезда Мухаммеда в Медину; единицы летоисчисления привязаны к относительным перемещениям Солнца и Луны, но в астрономии существует целых шесть разных определений года. Высоту принято отсчитывать от уровня моря, но это привело к тому, что большая часть территории Голландии имеет... отрицательную высоту, так как расположена ниже уровня моря. Несмотря на произвольность начала отсчета, в обыденной жизни координаты интервальной шкалы иногда абсолютизируются (вспомните, как много эмоций и реальных событий мы связываем с Новым годом, началом нового века, и т.д.). Название “шкала интервалов” подчеркивает, что в этойшкалетолькоинтервалыимеют смысл настоящих чисел и только над интервалами следует выполнять арифметические операции: если произвести арифметические операции над самими отсчетами по шкале, забыв об их относительности, то имеется риск получить бессмысленные результаты. Например, если сказать, что температура воды увеличилась в два раза при ее нагреве от 9 до 18 по шкале Цельсия, то для тех, кто привык пользоваться шкалой Фаренгейта, это будет звучать весьма странно* , так как в этой шкале температура воды в том же опыте изменится от 48,2 до 64,4. Подобно тому как определение значения символа Кронекера является единственной допустимой операцией над наблюдениями в номинальной шкале, а вычисление ранга наблюдения – в порядковой шкале, в интервальной шкале единственной новой допустимой операцией над наблюдениями является определение интервала между ними. Над интервалами же можно выполнять любые арифметические операции, а вместе с ними – использовать подходящие способы статистической и иной обработки данных. Например, центральные моменты (в том числе дисперсия) имеют объективный физический смысл, а начальные моменты (в том числе среднее значение) являются относительными наряду с началом отсчета. Поэтому понятие относительной погрешности (коэффициента вариации, т.е. отношения стандартного отклонения к математическому ожиданию) не имеет смысла для интервальной шкалы. Это не означает, что вообще нельзя суммировать показания в шкале интервалов, например вычислять выборочное среднее . Однако с такой величиной нужно обращаться так же, как и с другими исходными наблюдениями, – она остается интервальной величиной и приобретает числовой смысл только в процессе определения интервалов. Поэтому выборочная дисперсия имеет объективный смысл, хотя и определяется черезх по формуле ; дело в том, что Х –х является интервалом. ШКАЛЫ ОТНОШЕНИЙ Пусть наблюдаемые величины удовлетворяют не только аксиомам 40 и 50, но и аксиомам аддитивности: 60. Если А = Р и В > 0, то А + В > Р. 70. А + В = В + А. 80. Если А = Р и В = Q, то А + В = Р + Q. 90. (А + В) + С = А + (В + С) . Это существенное усиление шкалы: измерения в такой шкале являются “полноправными” числами, с ними можно выполнять любые арифметические действия, так как вычитание, умножение и деление – лишь частные случаи сложения. Введенная таким образом шкала называется шкалой отношений. Этот класс шкал обладает следующей особенностью: отношение двух наблюдаемых значений измеряемой величины не зависит от того, в какой из таких шкал произведены измерения: х1/х2 = у1/у2. Этому требованию удовлетворяет соотношение вида у = ах (а ??0). Таким образом, величины, измеряемые в шкале отношений, имеют естественный, абсолютный нуль, хотя остается свобода в выборе единиц. В самом деле, при наличии абсолютного нуля свобода в выборе начала отсчета исчезает, и в формуле связи между разными системами координат, выведенной для интервальных шкал, второй член равен нулю (так как ?(с, с1) = ?(с, с) = 0), откуда и следует у = ах. Примерами величин, природа которых соответствует шкале отношений, являются длина, вес, электрическое сопротивление, деньги. ШКАЛЫ РАЗНОСТЕЙ К числу шкал, единственных с точностью до линейных преобразований, относятся шкала интервалов (y = ах + b, а > 0 и b произвольны) и шкала отношений (у = ах, а > 0 – преобразование растяжения) . Рассмотрим особенности шкал, инвариантных к сдвигу: у = х + b. Повторно применяя сдвиг к у(z = у + b = х + 2b), затем к z и т.д., обнаруживаем, что в такой шкале значение не изменяется при любом числе сдвигов: у = х + nb, n = 0, 1, 2, ... . Постоянная b является характерным параметром шкалы и называется ее периодом. Полученную шкалу бу- дем называть шкалой разностей (иногда ее также называют цикли- ческой или периодической). В таких шкалах измеряется направление из одной точки (шкала компаса, роза ветров и т.д.), время суток (циферблат часов), фаза колебаний (в градусах или радианах) . Циклические шкалы являются частным случаем интервальных шкал. Однако соглашение о хотя и произвольном, но едином для нас начале отсчета шкалы позволяет использовать показания в этой шкале как числа, применять к ним арифметические действия (до тех пор, пока кто-нибудь не забудет об условности нуля, например при переходе на летнее время или обратно, пересечении линии смены дат и т.д.). АБСОЛЮТНАЯ ШКАЛА Рассмотрим такую шкалу, которая имеет и абсолютный нуль, и абсолютную единицу. Эта шкала не единственна с точностью до какого-либо преобразования, а просто единственна, уникальна. Именно такими качествами обладает числовая ось, которую естественно назвать абсолютной шкалой. Важной особенностью абсолютной шкалы по сравнению со всеми остальными является отвлеченность (безразмерность) и абсолютность ее единицы. Указанная особенность позволяет производить над показаниями абсолютной шкалы такие операции, которые недопустимы для показаний других шкал, – употреблять эти показания в качестве показателя степени и аргумента логарифма. Числовая ось используется как измерительная шкала в явной форме при счете предметов, а как вспомогательное средство присутствует во всех остальных шкалах. Внутренние свойства числовой оси, при всей кажущейся ее простоте, оказываются чрезвычайно разнообразными, и теория чисел до сих пор не исчерпала их до конца. А некоторые безразмерные числовые отношения, обнаруживаемые в природе, вызывают восхищение и изумление (явления резонанса; гармонические отношения размеров, звуков; законы теории подобия и размерности; квантование энергии элементарных частиц и т.п.). Согласование шкалы с природой наблюдений В табл. 6.1 приведены основные сведения о всех рассмотренных в данном параграфе измерительных шкалах. Можно сказать, что чем сильнее шкала, в которой производятся измерения, тем больше сведений об изучаемом объекте, явлении, процессе дают измерения. Поэтому так естественно стремление каждого исследователя провести измерения в возможно более сильной шкале. Однако важно иметь в виду, что выбор шкалы измерения должен ориентироваться на объективные отношения, которым подчинена наблюдаемая величина, и лучше всего производить измерения в той шкале, которая максимально согласована с этими отношениями. Можно измерять и в шкале, более слабой, чем согласованная (это приведет к потере части полезной информации), но применять более сильную шкалу опасно: полученные данные на самом деле не будут иметь той силы, на которую ориентируется их обработка. Аналогичная ситуация имеет место и после того, как проведены измерения. У исследователя могут быть причины, побуждающие его преобразовать протокол наблюдений, переведя их из одной шкалы в другую. Если при этом данные переводятся в более слабую шкалу, то обычно исследователь отдает себе отчет в том, что в результате происходит некоторое ухудшение качества выводов. Иногда же исследователи усиливают шкалы; типичный случай – ”оцифровка” качественных шкал: классам в номинальной или порядковой шкале присваиваются номера, с которыми дальше “работают” как с числами. Если в этой обработке не выходят за пределы допустимых преобразований, то “оцифровка” – это просто перекодировка в более удобную (например, для ЭВМ) форму. Однако применение других операций сопряжено с заблуждениями и ошибками, так как свойства, навязываемые подобным образом, на самом деле не имеют места. О ДРУГИХ ШКАЛАХ Обширный опыт наблюдений в разнообразных областях науки и практики нередко приводил к целесообразности использования шкал, отличающихся от рассмотренных выше. Обсудим наиболее важные и интересные из них. Таблица 6.1. Итоговая таблица измерительных шкал
Очень распространены измерения непрерывных величин, возможные значения которых образуют континуум. По ряду причин результат наблюдения такой величины всегда фиксируется с “округлением”, с конечной точностью, т.е. так, как будто наблюдаемая величина дискретна. Иногда эта точность связана лишь с выбором числа разрядов в записи наблюдения, и ее можно увеличить, просто наращивая число значащих цифр (что часто делается в компьютерных расчетах). Однако в научных и технических измерениях эта точность ограничивается не тем, на сколько еще частей можно разделить каждое деление шкалы, а классом точности самого прибора. В связи с этим следует различать шкалы, в которых измеряются величины, дискретные по своей природе (например, измерение энергии с точностью до квантов в физике элементарных частиц, подсчет поголовья скота, количества деревьев на данной площади и т.п.), и шкалы, в которых измеряются с конечной точностью непрерывные величины (масса, длина, напряжение, время и т. д.). Первые будем называть дискретными шкалами, вторые – дискретизованными. Обращение с данными в дискретизованной шкале имеет свои особенности. Важно, что в таких измерениях нельзя фиксировать дробные части деления шкалы, даже если стрелка прибора остановилась между метками: класс точности прибора не гарантирует различения внутри интервала точности. Казалось бы, последующая статистическая обработка совокупности неточных наблюдений может дать повышение точности за счет усреднения. Однако это верно не во всех случаях: все зависит от того, какой параметр распределения данных мы оцениваем, и не изменяет ли погрешность этот параметр. Другими словами, вопрос о влиянии дискредитации на конечный результат не является тривиальным. Известны случаи, когда “ухудшение” измерения в дискретизованной шкале на самом деле улучшает результат. Например, при определении координат звезд при проектировании изображения участка неба на светочувствительную матрицу, рекомендуется расфокусировать изображение так, чтобы световое пятно от звезды охватывало несколько пикселов ( ячеек) матрицы. Это увеличивает точность определения положения звезды. Другой интересный эффект дискретизации заключается в том, что при искажении измеряемого параметра распределения наблюдений существует некоторое число усредняемых наблюдений, превышение которого может лишь ухудшить точность конечного результата. Еще один практически важный класс шкал – нелинейные. Так называются шкалы, в которых интервалы не удовлетворяют условиям аддитивности. Иначе говоря, “цена” единичного деления такой шкалы зависит от того, в какой части шкалы находится это деление. Примерами могут служить квадратичная, логарифмическая, экспоненциальная шкалы, “вероятностная бумага”, многие номограммы. Причины введения нелинейных шкал могут быть как объективными (например, нелинейность измерительного прибора, большой динамический диапазон измеряемой величины), так и субъективными (удобство и наглядность представления данных, желание подчеркнуть некоторые детали полученной зависимости и т.д.). Обработка данных, зафиксированных в таких шкалах, требует учета конкретного характера нелинейности. Следует иметь в виду и то, что некоторые из нелинейных преобразований могут ненамеренно изменить силу шкалы. Например, в акустике и радиотехнике часто отношение мощностей сигналов представляется в децибелах: N [дб] = 10 lg(Р2/P1) . Мощности Р1 и Р2 измеряются в шкале отношений, следовательно, все операции, необходимые для получения количества децибел, допустимы. Однако величина N принадлежит шкале интервалов, что должно учитываться при дальнейшем оперировании с нею (например, нельзя говорить, что мощность данного сигнала равна такому-то количеству децибел и не указать, в сравнении с чем). Обратим внимание на еще одну особенность типовых шкал. Бросается в глаза резкое, принципиальное отличие между “слабыми” качественными шкалами – номинальной и порядковой – и “сильными” количественными шкалами – интервалов, разностей, отношений, абсолютной. Кажущееся очевидным различие между “качеством” и “количеством”, несводимость одного к другому, применительно к измерительным шкалам вдруг теряет очевидность. Во всяком случае возникает интригующий вопрос: является ли переход от качественных шкал к количественным принципиально скачкообразным, или существует возможность путем пошагового усиления порядковой шкалы “плавно” дойти до интервальной? Возможность постепенного усиления открывается в связи с введением, наряду с упорядочением альтернатив, понятия силы предпочтения. Речь идет о возможности сравнения “расстояний” между упорядоченными альтернативами. Ясно, что как только эти расстояния начнут изменяться в числовых шкалах, так и шкала в целом станет числовой (напомним, что формальное определение интервальной шкалы вводилось именно через определение интервала). Отказ от сравнения сил предпочтения оставляет нас в рамках порядковой шкалы. Существует и промежуточный вариант: сравнивать различия между альтернативами в порядковой шкале. Это – явное усиление шкалы, не переводящее ее, однако, в разряд количественной. Такую шкалу называют шкалой гиперупорядочения. Дальнейшее усиление состоит в том, чтобы упорядочивать силы предпочтения сил предпочтения и т.д. Сходится ли такая последовательность порядковых шкал хотя бы в пределе к числовой шкале, и при каких требованиях к нечисловому характеру сил предпочтения – остается пока математически открытым вопросом. Как пример нетривиального усиления порядковой шкалы при числовом характере сил предпочтения, изложим идею шкалы Черчмена и Акоффа на частном примере. Пусть имеется четыре предмета. Сначала опрашиваемый упорядочивает их в порядке предпочтения: А В С D. Затем его просят поставить в соответствие (приписать) предметам любые числа между нулем и единицей, выразив грубо “силу” предпочтения. Пусть результат таков:
Целью является уточнение с помощью дальнейших вопросов действительной силы предпочтений опрашиваемого. Например, что он предпочитает, А или В, С и D вместе взятые. Результат необходимо как-то отразить в весовых коэффициентах. Делается предположение, что весовой коэффициент совокупности альтернатив равен сумме их весовых коэффициентов. Если, например, А > (В С D), приписывают новые коэффициенты:
Далее спрашивают, как упорядочиваются В и (С D). Если, по мнению опрашиваемого, С D > В, то уменьшают вес В так, чтобы он был меньше суммы весов С и D:
Другие начальные веса при указанных вопросах и ответах могут остаться неизменными, если они сразу отвечали указанным требованиям. Например:
Чтобы сократить перебор комбинаций при уточнении шкалы, авторы метода предлагают наиболее предпочтительной альтернативе приписывать единичный вес, а остальные группировать по три и действовать по указанной методике. Если и при этом количество перебираемых комбинаций окажется большим (что неизбежно при большом числе упорядочиваемых объектов), то можно прибегнуть к неполному перебору, применив случайный механизм выбора троек и установив критерий прекращения пересчета весов. Основным предметом критики порядковой шкалы Черчмена и Акоффа является тот факт, что предположение об аддитивности весов предпочтения в психологии нередко не выполняется: скажем, опрашиваемый может оценивать смесь меда с дегтем иначе, чем суммой весов меда и дегтя в отдельности; то же может относиться и к оценке хлеба с маслом и хлеба и масла в отдельности. Интересно отметить, что несмотря на задание сил предпочтения в шкале отношений (так как к ним применяются операции сложения и деления), результирующая шкала определяется только приблизительно, остается оценочной. Это прежде всего связано с тем, что опрашиваемый не в состоянии точно описать силы своих предпочтений, и задаваемые им числа являются лишь интуитивными приближениями.
|