Новиковы методология науч иследования. А. М. Новиков Д. А. Новиков методология научного исследования
Скачать 1.55 Mb.
|
4. Снижение размерности. Часто в результате экспери- ментальных исследований возникают большие массивы ин- формации. Например, если каждый из исследуемых объектов 40 Простой называется регрессия одной переменной по другой. Об измерениях и анализе эмпирических данных 241 описывается по нескольким критериям (измеряются значения нескольких переменных – признаков), то результатом изме- рений будет таблица с числом ячеек, равным произведению числа объектов на число признаков (показателей, характери- стик). Возникает вопрос, а все ли переменные являются ин- формативными. Конечно, исследователю желательно было бы выявить существенные переменные (это важно с содержа- тельной точки зрения) и сконцентрировать внимание на них. Кроме того, всегда желательно сокращать объемы обрабаты- ваемой информации (не теряя при этом сути). Чем тут могут помочь статистические методы? Существует целый класс задач снижения размерности, цель которых как раз и заключается в уменьшении числа анализируемых переменных либо посредством выделения существенных переменных, либо/и построения новых показа- телей (на основании полученных в результате эксперимента). Для снижения размерности используется факторный анализ, а основными методами являются кратко рассматри- ваемый ниже метод главных компонент и многомерное шка- лирование [65]. Метод главных компонент заключается в получении не- скольких новых показателей – главных компонент, являю- щихся линейными комбинациями исходных показателей (напомним, что линейной комбинацией называется взвешен- ная сумма), полученных в результате эксперимента. Главные компоненты упорядочиваются в порядке убывания той дис- персии, которую они «объясняют». Первая главная компо- нента объясняет бóльшую часть дисперсии, чем вторая, вто- рая – бóльшую, чем третья и т.д. Понятно, что чем больше главных компонент будет учитываться, тем большую часть изменений можно будет объяснить. Преимущество метода главных компонент заключается в том, что зачастую первые несколько главных компонент (одна-две-три) объясняют бóльшую часть (например, 80- 90 %) изменений большого числа (десятков, а иногда и сотен) показателей. Кроме того, может оказаться, что в первые не- 242 Приложение 3 сколько главных компонент входят не все исходные парамет- ры. Тогда можно сделать вывод о том, какие параметры яв- ляются существенными, и на них следует обратить внимание в первую очередь. Решив задачи описания данных, установления сходст- ва/отличий, проанализировав качественно и количественно зависимости между переменными и выявив существенные переменные, можно анализировать соотношение групп пере- менных и пытаться прогнозировать значения одних перемен- ных в зависимости от значений других переменных или вре- мени развития того или иного процесса. 5. Классификация. Обширную группу задач анализа данных, основывающихся на применении статистических методов, составляют так называемые задачи классификации. В близких смыслах (в зависимости от предметной области) используются также термины: «группировка», «систематиза- ция», «таксономия», «диагностика», «прогноз», «принятие решений», «распознавание образов». Обсудим некоторые различия между этими терминами. В [65] предложено выде- лить три подобласти теории классификации: дискриминация (дискриминантный анализ), кластеризация (кластерный ана- лиз) и группировка. Здесь мы кратко остановимся на сути этих методов. Тех же читателей, которые заинтересуются, как ими пользоваться, мы адресуем к соответствующей литерату- ре [65, 86]. В дискриминантном анализе классы предполагаются за- данными (например, обучающими выборками, для элементов которых известно, каким классам они принадлежат: напри- мер, больной-здоровый, правильно-неправильно, легкая сте- пень заболевания – средняя – тяжелая и т.д.). Задача заключа- ется в том, чтобы каждый вновь появляющийся объект отнести к одному из этих классов. У термина «дискримина- ция» имеется множество синонимов: диагностика (например, в медицине требуется поставить диагноз из конечного списка возможных диагнозов, если известны определенные характе- ристики пациента и известно, какие диагнозы ставились Об измерениях и анализе эмпирических данных 243 пациентам, вошедшим в обучающую выборку), распознава- ние образов с учителем, автоматическая (или статистическая) классификация с учителем и т.д. Если в дискриминантном анализе классы заданы, то кла- стеризация и группировка предназначены для выявления и выделения классов. Синонимами являются: построение клас- сификации, таксономия, распознавание образов без учителя, автоматическая классификация без учителя и т.д. Задача кластерного анализа заключается в выделении по эмпирическим данным резко различающихся групп (класте- ров) объектов, которые схожи между собой внутри каждой из групп. При группировке, когда резких границ между кластерами не существует, исследователю приходится самому вводить границы между группами объектов. Использование компьютера при анализе результатов эксперимента, несомненно, целесообразно 41 . С одной сторо- ны, ряд статистических методов реализован в такой популяр- ной программе, как Microsoft Excel для Window, входящей в стандартный комплект Microsoft Office, и установленной, наверное, на любом современном компьютере. С другой стороны, на сегодняшний день существует множество специ- альных профессиональных программ, позволяющих осущест- влять статистический анализ данных. Среди последних мож- но выделить и рекомендовать к использованию такие наиболее распространенные пакеты статистического анализа как: Statistica, StatGraphics и SPSS. Однако, упомянутые про- граммы достаточно сложны и требуют значительных времен- ных затрат для их освоения. Поэтому можно рекомендовать следующее: если для решения задач исследования хватает возможностей Excel, то можно ограничиться использованием этой программы (недостатком ее, правда, является практиче- 41 Все обсуждаемые в настоящем разделе достоинства и недостатки программного обеспечения отражают лишь субъективное мнение авто- ров и не могут рассматриваться как попытка рекламы того или иного продукта. 244 Приложение 3 ски полное отсутствие вразумительных объяснений, которые помогли бы неподготовленному пользователю понять, что получилось в результате расчетов). Если возможностей Excel недостаточно, то нужно обращаться к профессиональным статистическим программам. Каждая из них обладает своими достоинствами и недостатками (в одной более полно реализо- ваны одни методы, в другой другие и т.д.). С методической точки зрения можно рекомендовать использовать программу StatGraphics (версии 5.0 и выше). Ее достоинством с позиций непрофессионального статистика является наличие «советчи- ка», который разъясняет, что означает та или иная вычислен- ная величина, и что исследователю следует делать дальше. Необходимо подчеркнуть, что при описании статистиче- ских методов нами даны лишь вводные соображения. Заинте- ресованному читателю можно порекомендовать обратиться к более добротной и профессиональной литературе по этой тематике – см. [55, 56, 65, 86], а также ссылки в этих работах. Завершив описание статистических методов, отметим, что часто при организации исследования сложных явлений и процессов и обработке его результатов возникает необходи- мость использования агрегированных (комплексных) и/или векторных оценок. Рассмотрим кратко их специфику. Агрегированные оценки. Во многих экспериментах имеется значительное число (десятки, сотни, а иногда и тыся- чи) объектов (субъектов). В результате измерения их показа- телей получается набор их частных оценок. Понятно, что сравнивать между собой и анализировать одновременно все частные оценки не всегда возможно и целесообразно, так как всегда существует их разброс, обусловленный неконтроли- руемым различием объектов эксперимента. Поэтому для того, чтобы, во-первых, получить обозримое число характеристик и, во-вторых, для того, чтобы сгладить индивидуальные колебания, используют так называемые агрегированные (коллективные, групповые, производные) оценки. Например, если имелись частные (индивидуальные) оценки отдельных индивидуумов, то агрегированной оценкой Об измерениях и анализе эмпирических данных 245 будет «среднее» значение для их группы. Использование кавычек не случайно, так как получение агрегированных оценок на основании частных является их преобразованием, и преобразование это следует выполнять корректно. Приведем некоторые корректные процедуры агрегирова- ния для наиболее распространенных в экспериментальных исследованиях показателей. Для величин, измеренных в шкале отношений, наиболее типичным является вычисление среднего арифметического по группе. Эта процедура вполне корректна, и обычно ее реали- зация не вызывает затруднений. Наибольшее число ошибок возникает при агрегировании показателей, измеренных в порядковых шкалах. Отметим, что не следует складывать, вычитать, умножать или делить баллы друг на друга, да и на чтобы то ни было – все это абсолютно бессмысленные операции. В порядковой шкале для «усреднения» обычно используют медиану [56, 65]. Если имеется набор индивидуальных баллов, то агреги- рованной характеристикой группы будет число ее членов, получивших тот или иной балл 42 . Аналогичным образом агрегируется и информация о выделении уровней – если введены три уровня (например, уровни знаний: низкий, сред- ний и высокий) и имеется информация о распределении всех членов нескольких групп (контрольных или эксперименталь- ных) по этим уровням, то агрегированной информацией об объединенной группе будет число ее членов, обладающих тем или иным уровнем (вычисляемое как сумма по всем груп- пам числа их членов, обладающих данным уровнем) – соот- ветствующие примеры можно найти в [55, 56]. Если агрегирование частных оценок по группе экспери- ментальных объектов (субъектов) производится с целью получения характеристик группы в целом, то для описания 42 Отметим, что такая агрегированная характеристика группы как число ее членов, получивших данный балл, является величиной, измеренной уже в шкале отношений (в то время, как баллы измеряются в порядковой шкале). 246 Приложение 3 различных аспектов, свойств и т.п. одного и того же объекта используются так называемые векторные оценки. Векторные оценки. Нередко встречаются случаи, когда какое-либо изучаемое явление, процесс характеризуется несколькими показателями – вектором показателей. Напри- мер, при оценке труда какого-нибудь рабочего используются показатели качества труда (точности обработки деталей) и производительности труда (время выполнения операций). При этом часто возникает вопрос о возможности однозначной оценки этого явления, процесса или изучаемых их свойств одной величиной – комплексной оценкой. Например, во мно- гих спортивных состязаниях победитель выявляется по ком- плексной оценке – сумме очков, баллов, набранных на от- дельных этапах состязания или в отдельных играх, в многоборье – в отдельных видах спорта. На практике комплексные оценки встречаются довольно часто и, очевидно, без них не обойтись, хотя способы их определения нередко и вызывают множество недоуменных вопросов. Но в любом случае такие комплексные оценки, применяемые в повседневной жизни, являются либо резуль- татом определенных общественных соглашений, которые признаются всеми участниками, либо установлены каким- либо нормативным актом определенного директивного орга- на – министерства, ведомства и т.д. и в силу этого также признаются всеми заинтересованными лицами. Другое дело – применение комплексных оценок в науч- ном исследовании. Здесь сразу на первое место встает вопрос о научной, в том числе математической, строгости применяе- мой оценки. В частности, например, не вызывает сомнений возможность использования в организации труда такой ком- плексной оценки, как суммарные затраты времени на выпол- нение тех или иных технологических операций. Здесь сумми- руются однородные величины, измеренные в шкале отношений. Между тем, при использовании шкалы рангов (порядко- вой шкалы) суммирование баллов довольно часто встречается Об измерениях и анализе эмпирических данных 247 в исследованиях по педагогике, психологии, медицине, био- логии и другим наукам (см. анализ корректности использова- ния методов анализа данных в диссертациях по педагогике [56] и медицине [55]). Так, в одной «методологической» публикации для оценки эффективности деловой игры была использована следующая «формула»: Р = 50 – К – (В – 40), где Р – «комплексная» оценка в баллах, 50 – максимально возможное количество баллов, К – количество замечаний, сделанных ведущим, В – время в минутах. Как видим, здесь уж, что называется, «смешались в кучу кони, люди ...». Под знак суммы (разности) поставлены совершенно разнородные величины: баллы, количество замечаний, время, безразмер- ные числа. Достаточно простым и интуитивно понятным (но, в то же время, корректным) методом агрегирования балльных оценок является использование так называемых матриц свертки [59], элементы которых содержат значения агрегированного пока- зателя, а агрегируемые баллы задают номер строки и столбца. В некоторое оправдание используемым на практике не- корректным построениям комплексных оценок следует отме- тить, что проблема агрегирования векторных оценок на сего- дняшний день исследована не полностью, а существующие результаты, даже для их применения на практике, зачастую требуют хорошего знания высшей математики. Качественно же проблема векторных оценок (или как ее иногда называют – проблема принятия решений при многих критериях) может быть проиллюстрирована на следующем простом примере из области экономики: имеются два инвестиционных проекта с одним и тем же размером первоначальных вложений (допус- тим, 100 единиц), причем первый характеризуется более высоким доходом (300 единиц), но и более высоким риском (предположим, что вероятность неуспеха равна 0,2), чем второй (доход – 250 единиц, вероятность неуспеха (риск) – 0,05). В какой из проектов следует осуществлять инвестиции? Ответ неоднозначен. Если бы первый проект был более при- быльным и менее рискованным, то следовало бы выбирать 248 Приложение 3 его. Но имеются два критерия (доход и риск) и первая аль- тернатива (первый проект) «лучше» по одному критерию, но «хуже» по второму. В подобных ситуациях обычно поступа- ют следующим образом. На первом шаге выделяют множе- ство эффективных альтернатив (так называемых, недоми- нируемых по Парето, то есть таких альтернатив, что не существует других допустимых альтернатив, которые были бы «не хуже» по всем критериям, а по одному из критериев – «строго лучше»). В рассматриваемом примере оба проекта эффективны по Парето. Дальше – на втором шаге – возможно несколько вариан- тов (и привести априори рациональное обоснование того, какой из них следует использовать в том или ином конкрет- ном случае, невозможно): - ввести комплексный критерий, оценка по которому бу- дет вычисляться агрегированием оценок по исходным крите- риям. В рассматриваемом примере таким критерием может быть ожидаемый доход (произведение дохода на вероятность его получения). Значение такого комплексного критерия для первого проекта равно 240 = 300 (1 – 0,2), для второго – 237,5 = 250 (1 – 0,05). С точки зрения максимизации ожидае- мого дохода следует выбрать первый проект. В качестве комплексного критерия можно использовать ожидаемые потери (для первого проекта они равны 60 единиц, для второ- го – 12,5), тогда с точки зрения минимизации ожидаемых потерь следует выбрать второй проект; - упорядочить критерии по важности. Если считать доход более важным критерием, чем риск, то следует выбрать пер- вый проект (так как он приносит в случае успеха больший доход: 300 > 250). Но, если считать риск более важным кри- терием, чем доход, то следует выбрать второй проект (так как он характеризуется меньшим риском: 0,05 < 0,2); - возможны и другие варианты принятия решений, часть из которых будет «рекомендовать» выбрать первый проект, а другая часть – второй. Об измерениях и анализе эмпирических данных 249 Даже из приведенного элементарного примера многокри- териальной задачи принятия решений видно, что универсаль- ных «рецептов» в этой области не существует. Для тех, кто глубже заинтересуется проблемой комплексных оценок и принятия решений при многих критериях, можно рекомендо- вать ознакомиться с соответствующими публикациями [62, 64, 69, 79]. Но в любом случае при построении комплекс- ных оценок нужно быть предельно внимательным и осторож- ным. Кстати, нередко можно обойтись и без них. Если полу- чены количественные результаты по отдельным показателям, то можно ограничиться их качественной интерпретацией, не «загоняя под общий знаменатель», проанализировать и срав- нить исследуемые объекты отдельно по каждому из показате- лей. И пусть по каким-то показателям результаты экспери- ментальных групп будут лучше контрольных, а по каким-то хуже – от этого исследование только обогатится, станет дос- товернее. 250 Приложение 4 Приложение 4. О роли науки в современном обществе В настоящее время в обществе происходит стремитель- ная переоценка роли науки в развитии человечества. Попыта- емся выяснить причины этого явления и рассмотреть основ- ные тенденции дальнейшего развития науки и взаимоотношений в традиционном «тандеме» наука – прак- тика. Для начала обратимся к истории. Начиная с эпохи Воз- рождения, наука, отодвинув на задний план религию, заняла ведущую позицию в мировоззрении человечества. Если в прошлом выносить те или иные мировоззренческие суждения могли только иерархи церкви, то, впоследствии, эта роль целиком перешла к сообществу ученых. Научное сообщество диктовало обществу правила практически во всех областях жизни, наука являлась высшим авторитетом и критерием истинности. На протяжении нескольких веков ведущей, базо- вой деятельностью, цементирующей различные профессио- нальные области деятельности людей, являлась наука. Имен- но наука была важнейшим, базовым институтом, так как в ней формировалась и единая картина мира, и общие теории, и по отношению к этой картине выделялись частные теории и соответственные предметные области профессиональных деятельностей в общественной практике. «Центром» развития общества являлись научные знания, а производство этих знаний – основным видом производства, определяющем возможности остальных видов и материального, и духовного производства. Но во второй половине ХХ века определились карди- нальные противоречия в развитии общества: как в самой науке, так и в общественной практике. Рассмотрим их. |