Признак, измеренный по дихотомической шкале, называется … признаком. Тема Анализ и представление
Скачать 4.5 Mb.
|
Тема 3. Основы измерения и количественного описания данных Глоссарий Измерительная шкала (лат. scala – лестница) – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Метрическая детерминированность – согласно этому признаку шкалы делятся на неметрические (номинативные, шкалы порядка) и метрические (интервальные, шкалы отношений). Нормальное распределение (распределением Гаусса или Гаусса — Лапласа) – распространенная разновидность непрерывного распределения вероятностей для случайной величины. Ранжирование – расположение собранных данных в определенной последовательности (убывания или нарастания показателей), определение места в этом ряду изучаемых объектов (например, составление списка учеников в зависимости от числа пропущенных занятий). Тема 3. Основы измерения и количественного описания данных Качественные и количественные методы анализа психологических данных Цели изучения темы: изучить основы измерения и количественное описание данных для проведения исследований в области психологии. Задачи темы: изучить виды шкал в психологии; научиться пользоваться номинативной шкалой, шкалой интервалов и шкалой отношений; определить, что такое нормальное распределение; изучить меры центральной тенденции и меры изменчивости. В результате изучения данной темы вы будете: Знать: виды шкал в психологии. Уметь: обрабатывать данные в соответствии с возможностями и ограничениями различных шкал. Владеть: навыками расчета среднего арифметического, дисперсии, стандартного отклонения. Учебные вопросы темы: Вопрос 1. Виды шкал в психологии. Свойства шкал, их возможности и ограничения. Вопрос 2. Номинативная шкала. Вопрос 3. Шкала интервалов и шкала отношений. Вопрос 4. Таблица исходных данных. Нормальное распределение. Вопрос 5. Меры центральной тенденции и меры изменчивости. Вопрос 1. Виды шкал в психологии. Свойства шкал, их возможности и ограничения В своей работе психолог часто сталкивается с необходимостью измерения индивидуально-психологических особенностей, таких как, например, креативность, импульсивность, тревожность, агрессивность и др. Для этого в психодиагностике разрабатываются специальные измерительные процедуры, в том числе и тесты. Помимо этого, в психологии широко используются экспериментальные методы и модели исследования психических феноменов в познавательной и личностной сферах. Как самостоятельный метод, измерение служит для выявления индивидуальных различий поведения субъекта и отражения им окружающего мира, а также для исследования адекватности отражения (традиционная задача психофизики) и структуры индивидуального опыта. Измерение включается в контекст эксперимента как метод регистрации состояния объекта исследования и соответственно изменения этого состояния в ответ на экспериментальное воздействие. В психологии измерительные шкалы представляют собой метрические системы, моделирующие исследуемый феномен путем замены прямых обозначений изучаемых объектов числовыми значениями и отображением пропорций континуального (непрерывного) состава элементов объекта в соответствующих числах. Каждому элементу из совокупности проявлений (свойств) изучаемого объекта соответствует определенный балл (шкальный индекс). Балл количественно устанавливает положение наблюдаемой единицы на шкале. Общая классификация шкал (по С. Стивенсу). В основу этой классификации положен признак метрической детерминированности, по которому все шкалы делятся на два типа: 1. неметрические (номинативные и шкалы порядка); 2. метрические (интервальные и шкалы отношений); Измерительная шкала (лат. scala – лестница) – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Основные типы измерительных шкал: 1) номинативная шкала (синонимы: номинальная шкала, шкала наименований); 2)порядковая шкала (синонимы: ординарная шкала, ранговая шкала, шкала порядка); 3) интервальная шкала (синоним: шкала интервалов); 4) шкала равных отношений (синоним: шкала отношений). Математическая мощность измерительной шкалы В восходящем порядке это шкала наименований, порядковая шкала, интервальная шкала и шкала отношений. Эти шкалы являются иерархическими: шкалы более высокого уровня обладают всеми свойствами шкал более низкого уровня плюс дополнительными свойствами. Шкала наименований допускает классификацию объектов по качественно различным и независимым категориям. Порядковая шкала включает классификацию и величину (больше или меньше), т. е., она допускает ранжирование объектов по степени выраженности той характеристики, которой они обладают. Интервальная шкала включает классификацию, величину и равенство интервалов. В дополнение к классификации, сравнению величины и установлению равных интервалов, шкала отношений обладает абсолютным началом отсчета. Рассмотрим первую неметрическую шкалу, она называется номинативной. Номинативные шкалы (шкалы наименований) устанавливают соответствие признака тому или иному классу. Объекты объединяются в классы или по общему свойству (классы эквивалентности), или символу (обозначению). Не обязательно, чтобы между выявленными классами существовала внутренняя связь, значение имеют только названия классов. Шкала наименований (номинативная шкала) получается путем присвоения «имен» объектам. При этом нужно разделить множество объектов на непересекающиеся подмножества. Иными словами, объекты сравниваются друг с другом, и определяется их эквивалентность — неэквивалентность. В результате данной процедуры образуется совокупность классов эквивалентности. Объекты, принадлежащие к одному классу, эквивалентны друг другу и отличны от объектов, относящихся к другим классам. Эквивалентным объектам присваиваются одинаковые имена. В основе номинативной шкалы (неметрической) лежит измерительная процедура — номинальное измерение, которая обычно не ассоциируется с изменением. Используя определенное правило, объекты группируют по различным классам так, чтобы внутри класса они были идентичны по измеряемому свойству. Примеры: 1. «пол»: 1 — мужской, 0 — женский. 2. «предпочтение домашних животных»: 1 — собаки, 2 — кошки; 3 — морские свинки; 0 — никакие. В случае, когда одному испытуемому присвоена 1, другому 2, третьему 3, то в данном случае нельзя сказать, что 1 <2, или 2 <3. Можно лишь утверждать, что 1 ≠ 2, 2 ≠ 3 и т. д. Номинативная шкала определяет только, что у этих испытуемых разные предпочтения: первый предпочитает собак, второй кошек, а третий — морских свинок. 3. Психологи очень часто применяют шкалу наименований в исследованиях. «Объективные» измерительные процедуры при диагностике личности приводят к типологизации: отнесению конкретной личности к тому или иному типу. Примером такой типологии являются классические темпераменты: холерик, сангвиник, меланхолик и флегматик. В этом случае мы может получить следующий пример группировки объектов по номинативной шкале: «темперамент»: а) сангвиник, б) флегматик, в) холерик, г) меланхолик. Самая простая номинативная шкала называется дихотомической. При измерениях по дихотомической шкале измеряемые признаки кодируют двумя символами, например: 0, 1; а), б) и т. п. Можно использовать любые два символа, отличающиеся друг от друга. Признак, измеренный по дихотомической шкале, называется альтернативным. Примеры альтернативных признаков. 1. этот человек — «экстраверт», а этот человек — «интроверт»; 2. этот человек умеет водить машину, а этот человек — не умеет. Единица измерения, которой мы оперируем в номинативной шкале — это количество наблюдений (испытуемых, свойств и т. п.). Вопрос 2. Порядковая шкала Порядковая шкала В том случае, когда между объектами возможно установление отношений типа «быстрее», «успешнее», «вкуснее», «ярче», «громче», «тверже» и др., появляется возможность расположить объекты в порядке возрастания или убывания определенного признака. После этого остается наделить упорядоченную последовательность числами таким образом, чтобы, например, большее число соответствовало большей степени выраженности признака. В результате получим шкалу порядка, в которой отношения между числами будут соответствовать отношениям между объектами. Порядковая шкала – это шкала, которая допускает возможность расположить пункты (или объекты) в порядке отношений между ними. Различают шкалу строгого порядка (отношение строгого порядка: «больше» и «меньше») и шкалу слабого порядка (отношение частичного порядка: «больше или равно» и «меньше или равно»). В первом случае на элементах множества реализуются отношения «больше» и «меньше», а во втором — «больше или равно» и «меньше или равно». Если измеряемым объектам присваивать натуральные числа, то значения измеренных величин можно заменять квадратами, логарифмами, нормализовать и т. д. При таких преобразованиях значений величин, определенных по шкале порядка, место объектов на шкале не изменяется, т. е. не происходит инверсий. Еще С. Стивенс высказывал мнение, что результаты большинства психологических измерений в лучшем случае соответствуют лишь шкалам порядка. Шкалы порядка широко используются в психологии познавательных процессов, экспериментальной психосемантике, социальной психологии: ранжирование, оценивание, в том числе педагогическое, дают порядковые шкалы. Классическим примером использования порядковых шкал является тестирование личностных черт, а также способностей. Большинство же специалистов в области тестирования интеллекта полагают, что процедура измерения этого свойства позволяет использовать интервальную шкалу и даже шкалу отношений. Как бы то ни было, шкала порядка позволяет ввести линейную упорядоченность объектов на некоторой оси признака. Тем самым вводится важнейшее понятие — измеряемое свойство (или линейное свойство). В то время как шкала наименований использует «вырожденный» вариант интерпретации понятия «свойство»: «точечное» свойство (свойство есть - свойства нет). Переходным вариантом шкалы порядка можно считать дихотомическую классификацию, проводимую по принципу «есть свойство — нет свойства». Если у объекта свойство есть, то объекту приписывается число 1, если у объекта свойства нет, то объекту приписывается число 0, при этом 1> 0. Типичный и хорошо известный всем пример порядковой шкалы — школьные оценки от 5 до 1 балла. Числовые значения порядковой шкалы нельзя складывать, вычитать, делить и умножать. Пример: Требуется закодировать уровень агрессивности по пяти градациям: самый низкий, низкий, средний, высокий, самый высокий: Градация Код Градация Код Градация Код Градация Код Самый низкий 1 Самый низкий 99 Самый низкий 1 Самый низкий 10 Низкий 2 Низкий 77 Низкий 25 Низкий 15 Средний 3 Средний 44 Средний 39 Средний 20 Высокий 4 Высокий 33 Высокий 59 Высокий 25 Самый высокий 5 Самый высокий 11 Самый высокий 99 Самый высокий 30 Каждая из предложенных кодировок является правильной, так как сохраняется отношение порядка. Первая кодировка является наиболее естественной, привычной, и поэтому более предпочтительной. Пример показывает, что интервалы в ранговой шкале не равны между собой. Например, для второй градации разность рангов по абсолютной величине равна: |99 – 77| = 22, |77 — 44| = 33, |44 — 33| = 11, |33 — 11| = 22. Другими словами, при измерении в шкале порядка (ранговой шкале) из всех свойств чисел учитывается только то, что они разные и одно число больше другого. В порядковой шкале должно быть не меньше трех классов (групп). Например, низкий, средний, высокий. Так, чтобы можно было расставить измеренные признаки по порядку (проранжировать). Чем больше число классов разбиений всей экспериментальной совокупности, тем шире возможности статистической обработки полученных данных и проверки статистических гипотез. Пример. Четверым студентам присвоены ранги в зависимости от того, кто быстрее выполнял задание, при этом ранг 1 присвоен тому студенту, который быстрее всех выполнил все задания. Студент Ранг A 1 B 2 C 3 D 4 Основываясь только на этих данных, мы может судить о том, кто раньше выполнил задания, а кто – позже. Но мы не можем судить, насколько каждый из студентов выполнял задание быстрее или медленнее другого. Правила ранжирования. Случай одинаковых рангов. Правила ранжирования: 1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1. Наибольшему – ранг, соответствующий количеству ранжируемых значений. Например, если количество равно 7, то наибольшее значение получит ранг 7 2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. Например, если двое испытуемых в группе показали самый высокий одинаковый результат, то им присваивается средний ранг: 1,5 = (1+2)/2, если трое – то средний ранг будет равен 2 = (1+2+3)/3 и т. д. 3. Общая сумма всех присвоенных рангов для группы численностью А должна совпадать с расчетной, которая определяется по формуле: сумма = А×(А+1)/2, где А – общее количество ранжируемых значений. Сумма рангов должна быть равна сумме по формуле. Если равенства нет, то ранжирование проведено неверно. Вопрос 3. Шкала интервалов и шкала отношений Интервальная шкала Шкала интервалов является первой метрической шкалой. Собственно, начиная с нее, имеет смысл говорить об измерениях в узком смысле этого слова — о введении меры на множестве объектов. Шкала интервалов определяет величину различий между объектами в проявлении свойства. С помощью шкалы интервалов можно сравнивать два объекта. При этом выясняют, насколько более или менее выражено определенное свойство у одного объекта, чем у другого. Шкала интервалов очень часто используется исследователями. Классическим примером применения этой шкалы в физике является измерение температуры по Цельсию. Шкала интервалов имеет масштабную единицу, но положение нуля на ней произвольно, поэтому нет смысла говорить о том, во сколько раз больше или меньше утренняя температура воздуха, измеренная шкалой Цельсия, чем дневная. Пример: Если вчера дневная температура воздуха была +10 0 С, а сегодня + 5 0 С. То не имеет смысла говорить о том, что вчера днем было в два раза теплее, чем сегодня. В шкале интервалов каждое из возможных значений измеренных величин отстоит от ближайшего к нему значения на равном расстоянии. Главное понятие этой шкалы – интервал, который можно определить, как долю или часть измеряемого свойства между двумя соседними позициями на шкале. Размер интервала – величина фиксированная и постоянная на всех участках шкалы. Важной особенностью шкалы интервалов является то, что у нее нет естественной точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства). Эта шкала имеет количественную меру, то есть определенные количественные пределы существования в данном качестве. Интервальная шкала позволяет применять практически всю параметрическую статистику для анализа данных, полученных с ее помощью. Помимо медианы и моды для характеристики центральной тенденции используется среднее арифметическое, а для оценки разброса—дисперсия. Можно вычислять коэффициенты асимметрии и эксцесса и другие параметры распределения. Для оценки величины статистической связи между переменными применяется коэффициент линейной корреляции Пирсона и т. д. Для измерения посредством шкалы интервалов устанавливаются специальные единицы измерения. В психологии – это стены и стенайны. При работе с интервальной шкалой измеряемому свойству или предмету приписывается число, равное количеству единиц измерения, эквивалентное количеству имеющегося свойства. Важной особенностью шкалы интервалов является то, что в нее нет естественной точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства). Шкала отношений Шкала отношений — наиболее часто используемая в физике шкала. По крайней мере, идеалом измерительной процедуры является получение таких данных о выраженности свойств объектов, когда можно сказать, во сколько раз один объект больше или меньше другого. Это возможно лишь тогда, когда помимо определения равенства, рангового порядка, равенства интервалов известно равенство отношений. Шкала отношений отличается от шкалы интервалов тем, что на ней определено положение «естественного нуля». Классический пример — шкала температур Кельвина. В психологии шкалы отношений практически не применяются. Определение нулевой точки - сложная задача для психологических исследований, накладывающая ограничение на использование данной шкалы. С помощью таких шкал могут быть измерены масса, длина, сила, стоимость (цена), т. е. всё, что имеет гипотетический абсолютный ноль. Шкала отношений, как наиболее мощная, суммирует все возможности, которыми обладают менее мощные шкалы наименований, порядка и интервалов. На ней определены отношения эквивалентности, равенства, порядка, функции метрики и расстояния. На шкале отношений можно определить равенство и ранговый порядок величин, равенство интервалов и отношений между величинами. Возможность оценки отношения величин – наиболее важная отличительная черта этой шкалы, определившая ее название. Итак, любое измерение производится с помощью инструмента измерения. То, что измеряется называется переменной, то чем измеряют – инструмент измерения. Результаты измерения называются данными либо результатами (говорят «были получены данные измерения»).Полученные данные могут быть разного качества – относиться к одной из четырех шкал измерения. Каждая шкала ограничивает использование определённых математических операций, и соответственно ограничивает применение определённых методов математической статистики. Вопрос 4. Таблица исходных данных. Нормальное распределение Таблица исходных данных Обычно в ходе исследования интересующий исследователя признак измеряется не у одного-двух, а у множества объектов (испытуемых). Кроме того, каждый объект характеризуется не одним, а целым рядом признаков, измеренных в разных шкалах. Одни признаки представлены в номинативной шкале и указывают на принадлежность испытуемых к той или иной группе (пол, профессия, контрольная или экспериментальная группа и т. д.). Другие признаки могут быть представлены в порядковой или метрической шкале. Поэтому результаты измерения для дальнейшего анализа чаще всего представляют в виде таблицы исходных данных. Каждая строка такой таблицы обычно соответствует одному объекту, а каждый столбец - одному измеренному признаку. Таким образом, исходной формой представления данных является таблица типа «объект - признак». В ходе дальнейшего анализа каждый признак выступает в качестве переменной величины, или просто - переменной, значения которой меняются от объекта к объекту. Предположим, психолога интересует социальная сплоченность двух параллельных классов, различие в этом отношении мальчиков и девочек и эффективность проведенного в одном из этих классов социально-психологического тренинга. Для измерения социальной сплоченности исследователь задавал каждому ученику до и после тренинга один и тот же вопрос: «Как часто твое мнение совпадает с мнением твоих одноклассников?». Для ответа ученикам предлагалось выбрать один из пяти вариантов: 1 - никогда, 2 - редко, 3 - затрудняюсь ответить, 4 - часто, 5 - всегда. Исходные данные исследования представлены в табл. Общая численность всех испытуемых N =60. Численность класса, с которым проводился тренинг, N1 = 30; численность другого класса - N2 = 30. Первые два столбца таблицы - порядковый номер испытуемого (№) и Ф. И. О. Далее следуют четыре столбца, соответствующие четырем интересующим исследователя признакам: х1i - пол (номинативный), х2i - класс (номинативный), 1 2 3 4 5 № Ф.И.О. Пол Класс Самооценка До После 1 2 3 4 1 Иванов И. О. 1 0 5 5 2 Васильев К. А. 1 1 3 4 3 Розова М. И. 0 1 2 з 4 Краснова О. С. 0 0 3 3 5 Цветов С. Т. 1 0 1 3 6 Лозовая Е. И. 0 1 4 4 … … … … … … i … x 1i x 2i x 3i x 4i … … … … … … 60 Петров Е. М. 1 1 3 3 Нормальное распределение Проверка на нормальность распределения играет большую роль, так как многие статистические методы предполагают, что анализируемые с их помощью данные распределены в соответствии с нормой. Необходимость такого сопоставления возникает, когда мы сомневаемся, в какой шкале представлен признак – в порядковой или метрической. А сомнения такие возникают очень часто, так как заранее, как правило, неизвестно, в какой шкале удается измерить изучаемое свойство (исключая случаи явно номинативного измерения). Наиболее весомым аргументом в пользу того, что признак измерен в метрической шкале, является соответствие выборочного распределения норме. Если индивидуальная изменчивость некоторого свойства есть следствие действия множества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения. Это и есть закон нормального распределения. Он характеризуется тем, что крайние значения признака встречаются достаточно редко, а значения близкие к средней величине – достаточно часто. По форме – это колоколообразная кривая, вершина которой соответствует среднему значению признака, а слева и справа она симметрична. График нормального распределения называется кривой Гаусса. Нормальным такое распределение называется потому, что оно очень часто встречается в естественнонаучных исследованиях и являлось «нормой» всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя разными учеными в разное время: Муавром в 1733 в Англии, Гауссом в 1809 в Германии, Лапласом в 1812 во Франции. Целью процедуры проверки нормальности распределения является решение вопроса о возможности применения тех или иных параметрических критериев. Для того чтобы распределение было нормальным, выборка должна соответствовать условиям репрезентативности и однородности. Нормальное распределение задаётся несколькими параметрами. Среди них среднее арифметическое, стандартное отклонение, эксцесс, ассиметрия. Если распределение не является нормальным, то его нельзя охарактеризовать средним арифметическим и стандартным отклонением. В таком случае говорят о непараметрических данных, для которых применяются непараметрические методы статистики. Непараметрические данные – данные, распределение вероятности, которых не соответствует нормальному и не может быть задано параметрами нормального распределения. Вопрос 5. Меры центральной тенденции и меры изменчивости Начнем с центральной тенденции. Методами статистической обработки результатов эксперимента называются математические приемы, формулы, способы количественных расчетов, с помощью которых показатели, получаемые в ходе эксперимента, можно обобщать, приводить в систему, выявляя скрытые в них закономерности. Речь идет о таких закономерностях статистического характера, которые существуют между изучаемыми в эксперименте переменными величинами. Все методы математико-статистического анализа условно делятся на первичные и вторичные. Первичными называют методы, с помощью которых можно получить показатели, непосредственно отражающие результаты производимых в эксперименте измерений. Соответственно под первичными статистическими показателями имеются в виду те, которые применяются в самих психодиагностических методиках и являются итогом начальной статистической обработки результатов психодиагностики. Вторичными называются методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности. К первичным методам статистической обработки относят, например, определение выборочной средней величины, выборочной дисперсии, выборочной моды и выборочной медианы. В число вторичных методов обычно включают корреляционный анализ, регрессионный анализ, методы сравнения первичных статистик у двух или нескольких выборок. Рассмотрим методы вычисления первичных описательных статистик выборки. Мера центральной тенденции – это число, характеризующее выборку по уровню выраженности измеренного признака. Существуют три способа определения центральной тенденции, каждому из которых отвечает своя мера: мода, медиана, выборочное среднее. Мода (Mode) – это такое значение из множества измерений, которое встречается наиболее часто. Моде (или модальному интервалу признака) соответствует максимальный подъем графика распределения частот. Если график распределения частот имеет единственный максимальный подъем (вершину), то такое распределение называется унимодальным. Пример Рассмотрим пример «предпочтение домашних животных». Предположим, что измерения проведены в группе из 10 респондентов. Пусть измеренный признак имеет следующие 10 значений: 1, 0, 2, 1, 0, 2, 2, 1, 3, 2. Мода Mo = 2, как наиболее часто встречающееся значение признака (наибольшее число респондентов отдали предпочтение кошкам). Когда все значения встречаются одинаково часто, то принято считать, что такое распределение не имеет моды. Пример При определении темперамента в группе из 12 испытуемых получены следующие измерения: а), б), б), в), а), в), в), г), б), г), а), г). Данное распределение не имеет моды, так как измерение показало, что среди 12 испытуемых трое являются сангвиниками, трое – холериками, трое – меланхоликами и трое – флегматиками. То есть все значения измеренного признака «темперамент» встречаются в данной выборке одинаково часто. Медиана (Median) – это такое значение признака, которое делит упорядоченное (ранжированное) множество пополам. Одна половина всех значений признака оказывается меньше медианы, а вторая половина значений – больше медианы. 1) Первым шагом для определения медианы является упорядочивание (ранжирование) всех значений измеренного признака по возрастанию или убыванию. 2) Если выборка значений признака нечетная, то медиана – центральное значение признака; если выборка – четная, то медиана – точка, лежащая посредине между двумя центральными значениями. Примеры. 1. Пусть 9 человек имеют следующий ежемесячный доход: 10 тыс. руб., 10 тыс. руб., 12 тыс. руб., 12 тыс. руб., 15 тыс. руб., 16 тыс. руб., 20 тыс. руб., 30 тыс. руб., 50 тыс. руб., Медиана Me = 15 тыс. руб. – то есть центральному значению в упорядоченной выборке. 2. Пусть 9 человек имеют ежемесячный доход как в предыдущем примере, а доход 10-го составляет 70 тыс. руб. в месяц. Мы имеем четную выборку из 10 значений измеренного признака «ежемесячный доход». Тогда медиана будет равна: Me = (15 тыс. руб. + 16 тыс. руб.)/2 = 15, 5 тыс. руб. То есть медиана в данном примере равна среднему значению двух центральных значений. Средняя арифметическая (М) – определяется как сумма всех значений измеренного признака, деленная на количество суммированных значений. В статистике ее обозначают буквой «М». Чтобы ее подсчитать, надо суммировать все значения ряда и разделить сумму на количество суммированных значений. Использовать для обоснования каких-либо предположений и гипотез только среднее значение нельзя, оно не отражает объективной картины! Пример: 1+9=10, М=5, и 5+5=10, М=5. Квартили (Quartiles) – это три точки значения признака, которые делят все упорядоченное (по возрастанию) множество значений измеренного признака на 4 равные по численности части. Процентили (Percentiles) – это 99 точек значений признака, которые деля все упорядоченное (по возрастанию) множество значений признака на 100 равных по численности частей. Процентили и квартили используют для определения частоты встречаемости тех или иных значений (или интервалов) измеренного признака, или для выделения подгрупп и отдельных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений. Меры изменчивости: размах выборки, дисперсия, стандартное отклонение Меры центральной тенденции отражают уровень выраженности измеренного признака. Однако не менее важной характеристикой является выраженность индивидуальных различий испытуемых по измеренному признаку. Меры изменчивости (Dispersion) применяются в психологии для численного выражения величины межиндивидуальной вариации признака. Размах (Range) – это разность между максимальным и минимальным значениями измеренного признака: R = x max – x min В предыдущем примере размах выборки значений ежемесячных доходов для группы из 10-ти испытуемых составил 60 тыс. руб. = 70 тыс. руб. – 10 тыс. руб. Для метрических данных используется дисперсия (вариация). Дисперсия (D) – мера рассеянности случайной величины (переменной). Это среднее арифметическое квадратов отклонений значений переменной от ее среднего значения. Однако сама дисперсия, как характеристика отклонения от среднего, часто неудобна для интерпретации. Дисперсия (Variation) – это мера изменчивости для метрических данных, пропорциональная сумме квадратов измеренных значений от их выборочного среднего: Эмпирическая (выборочная дисперсия) вычисляется по следующей формуле: Пример Вычислим выборочную (эмпирическую) дисперсию для следующей выборки N=7 № x i x i – M x (x i – M x ) 2 1 2 2– 4= -2 4 2 4 4-4=0 0 3 7 7-4=3 9 4 2 2-4=-2 4 5 1 1-4=-3 9 6 6 6-4=2 4 7 6 6-4=2 4 M x = (2+4+7+2+1+6+6)/7 = 28/7 = 4; D x = (4+0+9+4+9+4+4)/6 = 34/6 = 5,66 Алгоритм нахождения дисперсии: 1. Вычисляем среднее по выборке. 2. Для каждого элемента выборки вычисляем его отклонение от средней. 3. Каждый элемент возводим в квадрат. 4. Находим сумму этих квадратов. 5. Эту сумму делим на общее количество членов ряда. Это и есть дисперсия. Среднее квадратичное отклонение (в программе Excel – S, называется также основным, или стандартным, отклонением) – мера разнообразия входящих в группу объектов; она показывает, насколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и среднее квадратичное отклонение. Среднеквадратическое (стандартное) отклонение σ x равно положительному значению квадратного корня из выборочной (эмпирической) дисперсии D x : В условиях предыдущего примера среднеквадратическое отклонение равно: σ x = квадратный корень из числа 5,66=2,38 Вопросы для самопроверки: 1. Дайте понятие «измерение» в психологии. 2. Какие виды шкал вы знаете? 3. Как правильно сделать ранжирование, если ранги одинаковые? 4. Что такое нормальное распределение? 5. Как определить моду, медиану, среднее арифметическое? |