Главная страница
Навигация по странице:

  • Цель психометрики

  • Задачи психометрики

  • Номинативные шкалы

  • Порядковая шкала

  • Интервальная шкала

  • Шкала равных отношений

  • Тема 29. Проблема возрастной периодизации психического


    Скачать 475.97 Kb.
    НазваниеТема 29. Проблема возрастной периодизации психического
    Дата15.12.2022
    Размер475.97 Kb.
    Формат файлаdocx
    Имя файла29-49.docx
    ТипДокументы
    #847194
    страница12 из 19
    1   ...   8   9   10   11   12   13   14   15   ...   19




    Тема 39. Проблема измерения в психологии

    Психометрика как наука. Психометрия (психометрика) -- дисциплина, изучающая теорию и методику психологических измерений, включая измерение знаний, способностей, взглядов и качеств личности. Психометрия является разделом прикладной статистики. В первую очередь, эта область касается создания и валидизации измерительных инструментов, таких как опросники, тесты и методики описания (оценки) личности. Она включает в себя две основные исследовательские задачи, а именно: 1) создание инструментов и построение процедур измерения; 2) развитие и усовершенствование теоретических подходов к измерению. Те, кто занимаются психометрией, могут быть как клиническими психологами, так и специалистами в области развития или HR. В любом случае, конкретной, отдельной квалификации по психометрии не требуется. В США преподавание психометрии ведётся на уровне бакалавриата, магистратуры и докторантуры.

    Большая часть ранних исследований в области психометрии была основана на стремлении измерить интеллект. Фрэнсис Гальтон, известный как «отец психометрии», включил ментальные измерения в антропометрические данные. Зарождение психометрии также связано с психофизикой. Два других начинателя психометрии Джеймс Маккин Кеттел и Чарльз Спирмен получили докторские звания в Лейпцигской лаборатории психофизики Вильгельма Вундта.

    Психометрист Луис Тёрстоун, основатель и первый президент Психометрического общества, в 1936 году разработал теоретический подход к измерению, который известен как закон сравнительных суждений. Этот подход тесно связан с психофизическими теориями Эрнста Вебера и Густава Фехнера. Также, Спирмен и Тёрстоун внесли большой вклад в развитие факторного анализа.

    Карл ПирсонГенри КайзерДжордж РашДжонсон О'КоннорФредерик ЛордЛедьярд ТюкерАртур Дженсен также внесли большой вклад в развитие психометрии.

    Область психометрии.

    Область психометрии связана с количественным подходом к анализу тестовых данных. Психометрическая теория обеспечивает исследователей и психологов математическими моделями, используемыми при анализе ответов на отдельные задания или пункты тестов, тесты в целом и наборы тестов. Прикладная психометрия занимается применением этих моделей и аналитических процедур к конкретным тестовым данным.

    Четырьмя областями психометрического анализа являются нормирование и приравнивание, оценка надежности, оценка валидности и анализ заданий. Каждая из этих областей содержит набор определенных теоретических положений и конкретные процедуры, используемые при оценке качества работы теста в каждом отдельном случае.

    Определение понятия «измерение» в социальных науках.

    Определение измерения в социальных науках имеет долгую историю. В настоящее время широкое определение, предложенное Стэнли Смит Стивенсом (1946), гласит, что измерение «приписывание чисел объектам или событиям по некоторому правилу». Это определение было представлено в работе, в которой Стивенс предложил четыре уровня измерения.

    Хотя это определение имеет широкое распространение, оно отличается от более классического определения измерения, принятого в физике, которое гласит, что измерение -- это численная оценка и выражение одной величины по отношению к другой (Мишель, 1997).

    Действительно, определение Стивенса было выдвинуто в ответ Британскому Комитету Фергюсона, председатель которого, А. Фергюсон, был физиком. Комитет был назначен в 1932 году Британской ассоциацией для содействия развитию науки в исследовании возможности количественной оценки сенсорных восприятий. Хотя ее председатель и другие члены были физиками, комитет также включал нескольких психологов.

    Доклад Комитета подчеркнул важность определения измерения. В то время как ответ Стивенса заключался в том, чтобы предложить новое определение, которое окажет значительное влияние на эту область, это был не единственный ответ на доклад.

    Другой, кардинально отличающийся, ответ призывал принять классическое определение, как это отражено в следующем заявление: "Измерение в психологии и физике, ни в каком смысле не различны.

    Физики могут проводить измерения тогда, когда они могут найти операции, с помощью которых можно обнаружить необходимый критерий. Психологи могут не беспокоиться о таинственных различиях в значении «измерения» в двух науках".

    Эти различные точки зрения отражены в альтернативных подходах к измерению.

    Например, методы, основанные на ковариационной матрице, как правило, используют числа, такие как сырые баллы, как измерение.

    Такой подход неявно влечет за собой определение Стивенса, которое требует только то, что номера присваиваются по некоторому правилу.

    Таким образом, основной задачей исследований, как правило, считается открытие связей между показателями, и факторов, положенных в основу этих связей.

    С другой стороны, когда используется измерительная модель такая, как модель Раша, номера не присваиваются на основе правил.

    Вместо этого, в соответствии с заявлением Риз выше, конкретные критерии для измерения указаны, а цель состоит в построении процедур или операций, которые предоставляют данные, отвечающие соответствующим критериям.

    Измерения оцениваются на основе моделей, и испытания проводятся для того чтобы удостовериться в том, были ли выполнены соответствующие критерии.

    Цели и задачи психометрики. Цель психометрики – обеспечить качественные результаты: повышение качества методики и качества процедуры обследования, т.е. решает 2 вопроса: чем и как проводить обследование. Задачи психометрики: - создание новых методик, обоснование требований к методикам; - разработка процедуры применения методики; - обоснование требований предъявляемых к психодиагносту.

    Специфика психологического измерения. Впервые в более или менее современном виде мысль о принципиальной возможности измерения психических явлений, процессов и состояний высказал известный немецкий философ Густав Теодор Фехнер (1801–1887). В своем фундаментальном труде «Элементы психофизики» он писал так: «...трудно возразить против того, что духовное вообще подчинено количественным отношениям. Ведь можно говорить не только о большей или меньшей силе ощущения, но и о разной силе влечений, о том, что существует большая или меньшая степень внимания, живости воспоминаний или образов фантазии, ясности сознания в целом, а также интенсивности отдельных мыслей... Таким образом, высшее духовное не в меньшей степени, чем чувственное... может быть охарактеризовано количественно» (Fechner, 1966).

    Несмотря на длительную полемику по поводу возможности количественного описания психических явлений, процессов и состояний, которая развернулась после выхода в свет книги Фехнера, на сегодняшний день трудно представить психологическую науку без измерения. Психофизика, психофизиология, психометрика, психодиагностика – вот далеко не полный перечень психологических дисциплин, в которых измерение является необходимейшим инструментом.

    Иногда говорят, что измерение психических величин, зачастую основанное на субъективных отчетах испытуемых, не внушает доверия только потому, что оно субъективно. Не вдаваясь в философскую сторону проблемы, можно сказать, что психологические измерения так же надежны и валидны, как и измерения физические, но обладают своими особенностями. Основные свойства психологического измерения – это его многофакторность и вариативность.

    Многофакторность измерения в психологии состоит в том, что на психологические величины оказывает влияние множество различных факторов, одни из которых (релевантные) непосредственно связаны с измеряемым признаком, другие (иррелевантные) не связаны с ним или связаны косвенно. Влияние всех иррелевантных факторов учесть невозможно. Однако чем большее их число будет учтено, тем более действенна данная методика, более валидна та или иная математическая модель, более точен тот или иной психологический прогноз.

    Существует наиболее оптимальный, на наш взгляд, способ преодоления трудностей, связанных с многофакторностью психологических измерений. Так, если на измеряемый психологический признак оказывает действие большое число разнообразных факторов, то априорно принимается точка зрения, что все эти многообразные и разнонаправленные факторы в конечном счете уравновешивают друг друга, и исследуемый признак варьирует случайным образом. Известно, что на принципе случайности основана целая область математической науки – теория вероятностей. Поэтому неудивительно, что многие из математических методов, используемых в психологии, основаны именно на вероятностной теории. Кроме того, существуют специальные методы и приемы, позволяющие определить, изменяется ли исследуемый признак случайным образом или неслучайно. Если психологическое свойство (признак) – случайная величина, то к нему применимы основные статистические критерии; если признак изменяется неслучайно, следует выявить и по возможности устранить (или минимизировать) тот фактор, который вносит систематическую ошибку. Если же это не представляется возможным, следует использовать так называемые непараметрические методы статистической обработки полученных результатов.

    Вариабельность (вариативность) психологических измерений состоит в том, что психологические величины (признаки, переменные) зачастую принимают значения, весьма отличающиеся друг от друга. Поэтому, наряду с мерами центральной тенденции (мода, медиана, среднее значение), в психологии всегда приходится учитывать и вариабельность (изменчивость) измеряемого признака. Доказано, что вариабельность переменных сама по себе является весьма информативным показателем. Разработано большое количество статистических методов, основанных именно на анализе вариабельности – дисперсионный, корреляционный, факторный анализ и др. Другими словами, вариабельность психологических признаков из противника превратилась в союзника, и на ее основе представилось возможным решать достаточно сложные статистические задачи.

    В различных областях и разделах психологии измерение имеет свою специфику. Так, психофизические измерения предусматривают, как правило, использование двух шкал: первая – это шкала физических единиц (сила света, звука, пространственные, временные параметры сигнала и т. д.), вторая – субъективная (шкала суждений, оценок и пр.), которая может быть выражена в терминах номинальной, порядковой, интервальной шкалы или шкалы отношений (см. подраздел 1.3). В случаях неметрического шкалирования исследователь, как правило, оперирует только субъективными шкалами.

    Двойственная метрика предполагается и в психофизиологических исследованиях. Физиологические процессы в организме человека измеряются специальными приборами и выражаются в общепринятых физических единицах – секундах, герцах, микро- и милливольтах и т. д. В то же время психические процессы, сопутствующие физиологическим изменениям в организме, измеряются в терминах субъективного самоотчета испытуемых.

    Особое место занимают измерения в психодиагностике, поскольку они включают в себя, с одной стороны, систему субъективных отчетов или невербальных операций субъекта, с другой – систему условных приемов и методов оценки психологических показателей.

    В заключение следует еще раз подчеркнуть, что, несмотря на вариативность и многофакторность психологических величин, измерение в психологии является неотъемлемым этапом исследования, позволяющим с определенной степенью точности и надежности описывать разнообразные психические явления, процессы и состояния.

    Типы шкал в психодиагностике: номинативная, порядковая, шкала интервалов и шкала равных отношений. Другие типы шкал. Шкала – это форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Наиболее общая классификация измерительных шкал предложена С.Стивенсом. В ее основу положен признак метрической детерминированности. Согласно этому признаку шкалы делятся на метрические (интервальные, шкалы отношений) и неметрические (номинативные, шкалы порядка). В соответствии с данным подходом рассмотрим шкалы нескольких уровней, иерархически упорядоченных по сложности.

    1. Номинативные шкалы (шкалы наименований от лат. nomen – имя, название) – шкалы, устанавливающие соответствие признака тому или иному классу. Название не измеряется количественно, оно лишь позволяет отличить один объект от другого. Пример номинативной шкалы – дихотомическая шкала, состоящая всего из двух ячеек, например: “мужчина/женщина”, “имеет братьев и сестер/единственный ребенок в семье”; “иностранец/соотечественник”; “проголосовал «за»/проголосовал «против»” и т.п. Признак, который изменяется по дихотомической шкале наименований, называется альтернативным. Он может принимать всего два значения.

    Более сложный вариант номинативной шкалы – классификация из трех и более ячеек, например: “экстрапунитивные/интрапунитивные/импунитивные реакции” или “выбор кандидатуры А/кандидатуры Б/кандидатуры В/кандидатуры Г”, или “старший/средний/младший/единственный ребенок в семье” и др.

    Классифицировав все объекты, реакции или всех испытуемых по ячейкам классификации, мы получаем возможность от наименований перейти к числам, подсчитав количество наблюдений в каждой из ячеек. Таким образом, номинативная шкала позволяет нам подсчитывать частоты встречаемости разных “наименований”, или значений признака, и затем работать с этими частотами с помощью математических методов.

    Возможными операциями с числами для номинативной шкалы являются следующие:

    – нахождение частот распределения по пунктам шкалы с помощью процентирования или в натуральных единицах;

    – поиск средней тенденции по модальной частоте (модальной (Мо) называют группу с наибольшей численностью);

    – установление взаимосвязи между рядами свойств, расположенных неупорядоченно (с этой целью составляются специальные таблицы, посредством которых, помимо простой процентовки в них можно подсчитать критерий сопряженности признаков по Пирсону (Х2).

    2. Порядковая шкала – шкала, классифицирующая признаки по принципу “больше – меньше”. Здесь субъекты могут быть ранжированы, например, по весу или росту. В порядковой шкале должно быть не менее трех классов, например, “положительная реакция/нейтральная реакция/отрицательная реакция” или “подходит для занятия вакантной должности/подходит с оговорками/не подходит”.

    В порядковой шкале мы не знаем истинного расстояния между классами, а знаем лишь, что они образуют последовательность. Например, классы “подходит для занятия вакантной должности” и “подходит с оговорками” могут быть реально ближе друг к другу, чем класс “подходит с оговорками” к классу “не подходит”.

    От классов легко перейти к числам, если мы условимся считать, что низший класс получает ранг 1, средний класс – 2, а высший – ранг 3, или наоборот. Например, мы можем легко оценить различия между двумя выборками испытуемых по преобладанию у них более высоких или более низких рангов или подсчитать коэффициент ранговой корреляции между двумя переменными, измеренными в порядковой шкале, допустим, между оценками профессиональной компетентности руководителя, данными ему разными экспертами.

    Все психологические методы, использующие ранжирование, построены на применении шкалы порядка. Если испытуемому предлагается упорядочить 18 ценностей по степени их значимости для него, проранжировать список личностных качеств социального работника или 10 претендентов на эту должность по степени их профессиональной пригодности, то во всех этих случаях испытуемый совершает так называемое принудительное ранжирование, т.е. ранжирование, при котором количество рангов соответствует количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.).

    Однако если у нас имеется всего 3 возможных класса и, следовательно, 3 ранга, и при этом, скажем, 20 ранжируемых испытуемых, то некоторые из них неизбежно получат одинаковые ранги. Все многообразие жизни не может уместиться в 3 градации, поэтому в один и тот же класс могут попасть люди, достаточно серьезно различающиеся между собой.

    С другой стороны, принудительное ранжирование может искусственно преувеличивать различия между людьми. Кроме того, данные, полученные в разных группах, могут изначально различаться по уровню развития исследуемого качества, и испытуемый, получивший в одной группе высший ранг, в другой получил бы всего лишь средний.

    Выход из положения может быть найден, если задавать достаточно дробную классификационную систему, скажем, из 10 классов, или градаций признака. В сущности, подавляющее большинство психологических методик, использующих экспертную оценку, построено на измерении одним и тем же “аршином” из 10, 20 или даже 100 градаций разных испытуемых в разных выборках.

    Итак, единица измерения в шкале порядка – расстояние в один класс или в один ранг, при этом расстояние между классами и рангами может быть разным (оно нам не известно).

    При операциях с числами порядковой шкалы необходимо помнить, что интервалы в шкале не равны, поэтому числа обозначают лишь порядок следования признаков. И операции с числами – это операции с рангами, но не с количественным выражением свойств в каждом пункте.

    Числа поддаются монотонным преобразованиям: их можно заменять другими с сохранением прежнего порядка (например, вместо ранжирования от 1 до 5 можно упорядочить тот же ряд в числах от 2 до 10 или от (-1) до (+1). Отношения между рангами останутся неизменными). Кроме этого, возможно использование модальных показателей, поиск средней тенденции с помощью медианы (Ме), которая делит ранжированный ряд пополам.

    Наиболее сильный показатель для таких шкал – корреляции рангов (по Спирмену – p или по Кендаллу – R). Ранговые корреляции указывают на наличие или отсутствие функциональных связей в двух рядах признаков, измеренных упорядоченными номинальными шкалами.

    3. Интервальная шкала – это шкала, классифицирующая по принципу “больше на определенное количество единиц – меньше на определенное количество единиц”. Шкала представляет собой полностью упорядоченный ряд с измеренными интервалами между пунктами, причем отсчет начинается с произвольно выбранной величины. Каждое из возможных значений признака отстоит от другого на равном расстоянии. Таким образом в шкале интервалов нулевая точка отсчета может устанавливаться произвольно, а величины единиц и направление отсчета могут определяться по избираемым константам.

    Эквивалентные интервальные шкалы могут быть линейно преобразованы друг в друга, что позволяет приводить результаты тестирования к общим шкалам и таким образом осуществлять сравнение показателей. Более того, многие статистические процедуры предполагают измерения по шкале интервалов.

    Главная трудность в построении таких шкал – обоснование равенства или разности дистанций между пунктами.

    Можно предположить, что если мы измеряем время решения задачи в секундах, то это уже явно шкала интервалов. Однако на самом деле это не так, поскольку психологически различие в 20 секунд между испытуемым А и Б может отнюдь не равно различию в 20 секунд между испытуемыми Б и Г, если испытуемый А решил задачу за 2 секунды, Б – за 22, В – за 222, а Г – за 242.

    Выход может быть найден путем перевода сырых баллов в единицы стандартного отклонения, при которых определенная часть результатов будет попадать в тот или иной отрезок, приравненный к различному уровню развития измеряемого свойства.

    Для интервальной шкалы применимы линейные преобразования чисел, переход от одной шкалы к шкале другой дробности пунктов или точкой отсчета. Возможно вычисление коэффициента ранговой корреляции, а также коэффициента парной корреляции по Пирсону (r).

    4. Шкала равных отношений – шкала, классифицирующая объекты или субъектов пропорционально степени выраженности измеряемого свойства. В отличие от интервальной шкалы она имеют значимую нулевую точку, которая не произвольна, а указывает на полное отсутствие измеряемого свойства.

    В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу, 2 так относится к 4, как 4 к 8.

    Наличие нулевой точки – проблема для большинства психологических переменных. Возможности человеческой психики столь велики, что трудно себе представить абсолютный нуль в какой-либо измеряемой психологической переменной. Абсолютная глупость и абсолютная честность – понятия скорее житейской психологии. То же относится и к установлению равных отношений: только метафора обыденной речи допускает, чтобы Иванов был в 2 раза (3, 10, 100) умнее Петрова или наоборот.

    Абсолютный нуль, правда, может иметь место при подсчете количества объектов или субъектов. Например, при выборе одной из 3 альтернатив испытуемые не выбрали альтернативу А ни разу, альтернативу Б – 14 раз и альтернативу В – 28 раз. В этом случае мы можем утверждать, что альтернативу В выбирают в два раза чаще, чем альтернативу Б. Однако при этом не измерено психологическое свойство человека, а соотношение выборов у 42 человек.

    По отношению к показателям частот возможно применять все арифметические операции, сложение, вычитание, деление и умножение. Единица измерения в этой шкале отношений – 1 наблюдение, 1 выбор, 1 реакция и т.п. Наряду с делением шкал на метрические и неметрические существует классификация по признаку формы фиксации эмпирических данных, а именно: шкалы вербальные, числовые и графические.

    Методы сбора данных о личности: L-данные; Q-данные; T-данные. «L»-данные. Данные, полученные путем регистрации реального поведения человека в повседневной жизни, принято называть «L»-данными (от «life record data») Идеально было бы иметь полное и подробное описание образа жизни исследуемого лица, однако на практике это неосуществимо. В лучшем случае удается получить информацию относительно отдельных периодов или сторон жизни испытуемого, например сколько раз ученик правильно отвечал на вопросы, сколько раз нарушал дисциплину, обращался к врачу и т. п. Поэтому чаще всего «L»-данные получают путем формализации оценок экспертов, наблюдающих поведение испытуемого в определенных ситуациях и в течение некоторого периода времени. С «L»-данных обычно начинаются предварительные исследования проблемы. В многомерных исследованиях очень важно достаточно полно охватить сферу исследования. Кэттелл считает, что «L»-данные идеальны для установления тех признаков поведения, которые нуждаются в измерении. «L»-данные хороши также тем, что все виды поведения уже представлены в языковой форме. Это гарантирует не только лучший начальный выбор переменных, но и более легкую интерпретацию полученных факторов. «Q»-данные. Изучение личности с помощью опросников и других методов самооценок обозначается как «Q-данные (от «Questionnaire data»). Благодаря простоте инструментальных конструкций и легкости получения информации «Q-данные (опросники, самоотчеты, шкалы самооценок и т. п.) занимают центральное место в личностных исследованиях. Число методик для получения «Q-данных огромно. Из них наиболее известны Миннесотский многопрофильный личностный перечень (MMPI), шестнадцатифакторный личностный опросник (16PF), опросники Айзенка (EPI, EPQ), Калифорнийский психологический тест. «Т»-данные – это сведения, получаемые от объективных тестов с контролируемой экспериментальной ситуацией (objective test data), а также от физиологических измерений. «T»-данные получают в результате объективного измерения поведения (вербального, невербального, социального и индивидуального) без обращения к самооценкам или оценкам экспертов. При всем многообразии объективных тестов во всех случаях создаются специальные микроситуации, способствующие проявлению основных измеряемых свойств.

    Валидность и надежность измерений. Надёжность – один из критериев проверки методик. В разработку этого критерия внесли свой вклад А. Анастази, Кронбах, Торндайк. Надёжность – относительное постоянство, устойчивость, согласованность результатов тестов при первичном и повторном измерении на одних и тех же испытуемых. Необходимо повторное измерение на той же выборке. Расхождения возможны, но они должны быть незначительны. Таким образом, надёжность говорит о точности и устойчивости результатов к действию случайных факторов. Общий разброс может быть результатом двух групп причин: Изменчивость, присущая самому признаку. Факторы внешней среды, которые могут повлиять Процедуры вычисления надёжности: Проведение одной и той же формы теста. (ретестовая надёжность), вычисление коэффициента корреляции. Интервал между проведением тестирования – от одного до нескольких месяцев. Проведение параллельных форм тестов. При проведении исследования с помощью эквивалентной формы теста специалист убеждается в правильности выбранного признака. Чтобы формы теста считались эквивалентными необходимо одинаковое количество заданий в обоих тестах, задания должны быть унифицированы, задания должны располагаться одинаково по степени сложности, должны быть одинаковые средние и стандартное отклонение. Используют два подхода для вычисления надёжности при помощи параллельных форм тестов: Одни и те же испытуемые обследуются при помощи одного теста. А потом другого и если коэффициент корреляции больше 0.7, то надёжность высока. Испытуемые делятся на две группы, одна группа проходит тест А, другая тест Б, через неделю – наоборот. Расщепление теста и вычисление коэффициента корреляции. Испытуемые выполняют две части теста, которые равноценны. В одну часть попадают все чётные задания, в другую – нечётные. Эта процедура показывает последовательность теста внутри себя, меру адекватности подбора вопросов. Вычисляется коэффициент корреляции. Коэффициент надёжности соответствует коэффициенту корреляции Спирмена или Писрона. Надёжность факторно-дисперсионная — способ определения надежности, основанная дисперсионном анализе результатов теста. Надежность теста соответствует отношению истинной дисперсии (т. е. дисперсии самого исследуемого фактора) к реально полученной эмпирической дисперсии. Последняя складывается из истинной дисперсии и дисперсии погрешности измерения. Факторно-аналитический подход к определению надежности дополнительно расчленяет и дисперсию истинного показателя. Валидность – способность теста измерить то, что он должен измерить по замыслу автора. Это понятие относится больше не к тесту, а к его цели. Тест может быть надёжным, но не валидным. Но если тест валиден, то он надёжен. Источники идей валидности: Первые идеи появились ещё до создания тестов. Часто исследователи связывали результаты исследования с будущими успехами. Например, Пифагор, связывал мышление и речь при помощи интуиции. Идея о необходимости практической проверки пригодности теста. Вне практики проблема валидности не может существовать. Философские идеи: истина- соответствие мысли действительности. Критерий истинности – полезность. Измерения, которые мы делаем не очевдны, они требуют теоретической основы. Теоретико-эмпирическая валидность. Развитие статистической науки – корреляции и факторного анализа.
    1   ...   8   9   10   11   12   13   14   15   ...   19


    написать администратору сайта