математические методы в психологии. мат.методы в психологии Ушакова А.И.. Федеральное государственное бюджетное образовательное учреждение высшего образования башкирский государственный педагогический университет им. М. Акмуллы
Скачать 414.5 Kb.
|
МодаМода — типичность — максимальная частота — наиболее часто встречающееся значение в совокупности наблюдений. Применяется, например, для определения размера одежды, обуви, калибра патронов, пользующихся популярностью у покупателей, анализа технических экспериментов, а также определение часто встречающегося значения среди данных, имеющих не числовую природу происхождения Среднее арифметическоеСреднее арифметическое — сумма всех чисел, деленное на их количество, зависимое от разброса наблюдений. Медиана — середина — уровень показателя, который делит набор данных на 2 равные половины (50/50). Она не присваивает наблюдениям весовые коэффициенты исходя из того, на сколько они отдалены от средней точки, а лишь оценивает их в зависимости от расположения. Развивая мысль можно также делить медиану на четверти — квартили: 0,25 квантиль — первый (нижний) квартиль; 0,5 квантиль — медиана — второй квартиль; 0,75 квантиль — третий (верхний) квартиль. Медиана — альтернатива среднему арифметическому, устойчивая к аномальным отклонениям («отщепенцам»). При выборе меры центральной тенденции нужно учитывать ее устойчивость к значениям, резко отклоняющихся от центра применяемых в каждом конкретном случае. Нужно определить какое влияние оказывают «отщепенцы»: искажают его или наоборот играют важную роль. Окончательный выбор меры центральной тенденции всегда лежит за исследователем. 7.Вычисление и смысл мер изменчивости (размах, дисперсия, стандартное отклонение). В качестве наиболее часто используемых мер изменчивости следует назвать размах, дисперсию, стандартное отклонение. Размах — это разница между максимальным и минимальным значениями: Для определения размаха выборку необходимо сначала упорядочить. Например, в массиве данных {8, 9, 11, 12, 12, 13, 14, 17, 19, 19, 20, 20} размах будет равен разности между наибольшим и наименьшим значениями, т.е. Дисперсия — это мера разброса данных относительно среднего значения: Стандартное отклонение представляет собой квадратный корень из дисперсии: По ряду причин этот показатель является более удобным, чем дисперсия. 8.Графические методы представления эмпирического распределения. График – графическое отображение данных, с помощью которого осуществляется анализ свойств, структуры, типа распределений. Существуют следующие виды графиков: диаграммы, гистограммы, полигоны, кумуляты. Графическая форма анализа данных применяется для более наглядного представления полученных соотношений, для сравнения двух и более числовых рядов, а также для отображения динамики изучаемых процессов. График всегда строится на основании числовых данных, содержащихся в таблице. Поэтому он только наглядно отображает зависимость, представленную в табличной форме. В любой таблице имеется определенное количество строк. Числа из этих строк отображаются на графике в виде ординат вдоль некоторой координатной оси. Полученные ординаты соединяются между собой одним из двух способов. В одном случае они соединяются непрерывной ломаной линией. Такой график называется полигоном распределения. В другом случае график строится из прямоугольников, высоты которых пропорциональны ординатам. Такой график называется гистограммой распределения. Полигон распределения имеет широкое распространение при графическом отображении результатов психологических исследований, представленных в виде дискретных рядов. Его основная особенность – непрерывность линии, что должно ассоциироваться с непрерывностью отображаемого им процесса. Этому требованию отвечают все измерительные шкалы, кроме номинальной, так как любые значения таких шкал упорядочены относительно друг друга. При использовании номинальной измерительной шкалы (шкалы наименований), значения которой относительно автономны, непрерывная линия не совсем удачна для отображения дискретных явлений. В таком случае удобнее использовать гистограмму с ее возможностью резкого обособления отдельных значений измерительной шкалы. Применение гистограммы особенно наглядно, если есть необходимость подчеркнуть разницу между соседними ординатами. истограммы также широко применяются для графического изображения интервальных рядов. В таком распределении, представленном в таблице, статистическим подлежащим служат интервалы изучаемого показателя, а сказуемым – частота наблюдения явлений в этих интервалах. В данном случае количественная информация отображается на обеих осях координат, поэтому не нужно обособлять друг от друга соседние полосы на гистограмме. График в виде гистограммы и особенно полигона удобен для наглядного отображения закона распределения изучаемых величин. Следует заметить, что по одним и тем же данным, представленным в таблице, часто можно построить и гистограмму, и полигон распределения. Если в гистограмме проставить точки посередине сторон верхних узких полос и соединить эти точки ломаной линией, получим полигон распределения. Кольцевую диаграмму надо отличать от круговой. Если кольцевая диаграмма – это замкнутый в кольцо полигон распределения, то круговая диаграмма представляет собой своеобразную гистограмму. Величина площади ее отдельных секторов соответствует площади отдельных полос гистограммы. Такая форма удобна для отображения процентных распределений, в сумме дающих 100%. Таким образом, формы представления данных в ходе количественного анализа психологической информации подобны применяемым в математической статистике, но более тесно связаны с содержанием отображаемых ими психологических явлений и процессов. Они помогают психологу проводить первичный и вторичный анализ исследовательских данных, устанавливать на этой основе новые тенденции и закономерности. 9.Принципы группировки данных. Для построения статистических группировок нужно выбрать группировочный признак, далее определить количество групп, на которые разбивают изучаемую статистическую совокупность и зафиксировать границы интервалов группировки. Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы. Выбор группировочного признака – сложный вопрос в теории статистической группировки и статистического исследования в целом. Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования. В группировку входят количественные и атрибутивные (качественные) признаки. Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.). Атрибутивные признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака. Число групп, на которые расчленяется статистическая совокупность, зависит от количества градаций атрибутивного признака. Важно изучить экономическую сущность исследуемого явления при построении группировки по количественному признаку. Для определения числа групп можно воспользоваться формулой Стерджесса: h + 3,322 ? lg N, где h – число групп; N – число единиц совокупности; lgN – десятичный логарифм от N. Данная формула говорит о том, что выбор числа групп объектно зависит от объема совокупности. После установления числа групп решается вопрос об определении интервалов группировки. На основе интервала группировки можно количественно различить одни группы от других и наметить границы выделения их нового качества. Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы. Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения. Ширина интервала – это разность между верхней и нижней границами. Интервалы группировки в зависимости от их ширины бывают равными и неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле: h = R/n = ( х мах – х min ) / n, гдех мах ,х min – максимальное и минимальное значение признака в совокупности; n – число групп. Данную формулу называют шагом интервала. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов. Выбор равных или неравных интервалов зависит от степени заполнения интервалов. Интервалы группировок могут быть закрытыми и открытыми Закрытыми интервалами являются интервалы, в которых указаны верхняя и нижняя границы. Открытые интервалы имеют только одну границу (верхнюю – у первого, нижнюю – у последнего). К количественным признакам можно отнести непрерывный признак, или дискретный. Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1. В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы. Специализированные интервалы – это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях. По роли, которую играют признаки во взаимосвязи изучаемых объектов, процессов или явлений, их можно подразделить на факторные и результативные. Факторные признаки воздействуют на другие признаки, а результативные испытывают на себе влияние других признаков. 10.Научная и статистическая гипотеза. Виды статистических гипотез Научные гипотезы формулируются как предполагаемое решение проблемы. Первична. Ее также называют экспериментальной, т.к. она служит для организации эксперимента. Статистическая гипотеза – утверждение в отношении неизвестного параметра, сформулированное на языке математической статистики. Статистическая гипотеза – это предположение о распределении вероятностей, которое мы хотим проверить по имеющимся данным. Статистические гипотезы подразделяются на нулевые и альтернативные Нулевая гипотеза (Но) – это гипотеза об отсутствии различий. Это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий. Альтернативная гипотеза (Н1) – это гипотеза о значимости различий. Это то, что мы хотим доказать, поэтому ее иногда называют экспериментальной гипотезой. Статистическая гипотеза- это утверждение о виде неизвестного распределения или параметрах известного распределения. Статистические гипотезы проверяются по результатам выборки статистическими методами в ходе эксперимента (эмпирическим путем) с помощью статистических критериев. В тех случаях, когда известен закон, но неизвестны значения его параметров (дисперсия или математическое ожидание) в конкретной ситуации, статистическую гипотезу называют параметрической. Например, предположение об ожидаемом среднем доходе по акциям или разбросе дохода являются параметрическими гипотезами. Когда закон распределения генеральной совокупности не известен, но есть основания предположить, каков его конкретный вид, выдвигаемые гипотезы о виде его распределения называются непараметрическими. Например, можно выдвинуть гипотезу, что число дневных продаж в магазине или доход населения подчинены нормальному закону распределения. По содержанию статистические гипотезы можно классифицировать: 1. Гипотезы о типе вероятностного закона распределения случайной величины, характеризующего явление или процесс. 2. Гипотезы об однородности двух или более обрабатываемых выборок. Изучаемое свойство исследуется с помощью двух или более генеральных совокупностей. Гипотеза в этом случае может заключаться в следующем: исследуемые выборочные характеристики различаются между собой статистически значимо или нет. 3. Гипотезы о свойствах числовых значений параметров исследуемой генеральной совокупности. Больше ли значения параметров некоторого заданного номинала или меньше и т.д. 4. Гипотезы о вероятностной зависимости двух или более признаков, характеризующих различные свойства рассматриваемого явления или процесса. При этом определяется характер этой зависимости. Гипотезы бывают простые (содержащие одно предположение) и сложные (содержащие несколько предположений). Выдвинутую гипотезу называют основной или нулевой и обозначают H0 . Противоречащую ей гипотезу называют альтернативной или конкурирующей и обозначают H1. Под статистическим критерием понимают однозначно определенное правило, устанавливающее условие, при котором проверяемая гипотеза отвергается либо не отвергается. 11.Типы ошибок при проверке гипотез (ошибки первого и второго рода). Уровни статистической значимости. При проверке статистических гипотез возможны следующие ошибки: 1. Отвергнута правильная H0, а принята неправильная гипотеза H1 - ошибка первого рода. 2. Отвергнута правильная альтернативная гипотеза H1 и принята неправильная нулевая гипотеза H0 - ошибка второго рода. Заметим, что уровень значимости - есть вероятность ошибки первого рода. Ошибка первого рода называется -риском. Обычно они задаются некоторыми конкретными значениями: 0,05; 0,01; 0,005; 0,001. Ошибки второго рода называются -риском, а вероятность ее допустить обозначается (вероятность того, что принята гипотеза H0 , когда на самом деле справедлива альтернативная гипотеза H1 . Можно доказать, что с уменьшением ошибок первого рода одновременно увеличиваются ошибки второго рода и наоборот. Поэтому, на практике пытаются подбирать значения параметров и опытным путем в целях минимизации суммарного эффекта от возможных ошибок. При принятии управленческих решений для одновременного уменьшения ошибок первого и второго рода самым действенным средством является увеличение объема выборки, что согласуется с законом больших чисел. На бытовом уровне ошибки второго рода могут иметь более трагические последствия, чем ошибки первого рода. Уровень значимости- вероятность принятия конкурирующей гипотезы, тогда как справедлива основная. С помощью уровня значимости определяются границы критической области. 12.Параметрические и непараметрические критерии: различия, особенности применения (ограничения). Все критерии различий условно подразделены на две группы: параметрические и непараметрические критерии. Критерий различия называют параметрическим, если он основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.). Критерий различия называют непараметрическим, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности. Поэтому для непараметрических критериев предлагается также использовать такой термин как «критерий, свободный от распределения». При нормальном распределении генеральной совокупности параметрические критерии обладают большей мощностью по сравнению с непараметрическими. Иными словами, они способны с большей достоверностью отвергать нулевую гипотезу, если последняя неверна. По этой причине в тех случаях, когда выборки взяты из нормально распределенных генеральных совокупностей, следует отдавать предпочтение параметрическим критериям. Однако, как показывает практика, подавляющее большинство данных, получаемых в психологических экспериментах, не распределены нормально, поэтому применение параметрических критериев при анализе результатов психологических исследований может привести к ошибкам в статистических выводах. В таких случаях непараметрические критерии оказываются более мощными, т.е. способными с большей достоверностью отвергать нулевую гипотезу. Итак, при оценке различий в распределениях, далеких от нормального, непараметрические критерии могут выявить значимые различия, в то время как параметрические критерии таких различий не обнаружат. Важно отметить, что, во-первых, непараметрические критерии выявляют значимые различия и в том случае, если распределение близко к нормальному; во-вторых, при вычислениях вручную непараметрические критерии являются значительно менее трудоемкими, чем параметрические. При подготовке экспериментального исследования психолог должен заранее запланировать характеристики сопоставляемых выборок (прежде всего связность–несвязность и однородность), их величину (объем), тип измерительной шкалы и вид используемого критерия различий. Последовательно это можно представить в виде следующих этапов: 1. Прежде всего, следует определить, является ли выборка связной (зависимой) или несвязной (независимой). 2. Следует определить однородность–неоднородность выборки. 3. Затем следует оценить объем выборки и, зная ограничения каждого критерия по объему, выбрать соответствующий критерий. 4. При этом целесообразнее всего начинать работу с выбора наименее трудоемкого критерия. 5. Если используемый критерий не выявил различия – следует применить более мощный, но одновременно и более трудоемкий критерий. 6. Если в распоряжении психолога имеется несколько критериев, то следует выбирать те из них, которые наиболее полно используют информацию, содержащуюся в экспериментальных данных. 7. При малом объеме выборки следует увеличивать величину уровня значимости (не менее 1%), так как небольшая выборка и низкий уровень значимости приводят к увеличению вероятности принятия ошибочных решений. |