Новиков учебник. Изложение одноименной книги
Скачать 101.59 Kb.
|
Целый ряд приведенных в таблице 6 показателей описательной статистики педагогу-исследователю не понадобятся (далее используются только среднее (формула (1), первая строка таблицы 6), дисперсия (формула (2), шестая строка таблицы 6) и "счет" (объем выборки) – последняя строка таблицы 6). Тем не менее, мы приводим все показатели, которые автоматически выводит "Описательная статистика" в компьютерной программе Microsoft Excel для Windows (таблица 6 экспортирована из Excel), чтобы уважаемый читатель не терялся перед экраном компьютера. Гистограмма в Excel получается применением инструмента анализа данных "Гистограмма" (Сер- вис/Анализ данных/Гистограмма). Гистограмма числа правильно решенных задач в контрольной группе до начала эксперимента (первый столбец таблицы 1) представлена на рисунке 2. Гистограмма 8 Частота 6 4 2 0 5 8 11 14 17 20 Карман Рис. 2. Гистограмма числа правильно решенных задач в контрольной группедо начала эксперимента ("частота" – число элементов выборки,попавшихвзаданныйдиапазон,называемый вExcel"карманом") Рассмотрим теперь показатели описательной статистики для данных, измеренных в порядковой шкале. Длярезультатовизмеренийвпорядковойшкале (задача 2.1 – см. таблицу 5) при небольшом числе градаций единственным информативным показателем описательной статистики является гистограмма20. Для визуального (качественного) сравнения экспериментальной и контрольной групп удобно стро- ить для них совместные гистограммы. Например, по результатам таблицы 4 (см. выше) можно постро- ить несколько парных гистограмм, на которых отложены одновременно частоты для двух групп (на- пример, контрольной и экспериментальной). На рисунках 3 и 4 приведены две из них – позволяющие сравнивать контрольную и экспериментальную группу до начала и после окончания эксперимента (на самом деле визуальный анализ не дает возможности сказать, значимо ли различаются данные выборки – для этого необходимо использовать статистические методы – см. ниже). Для их построения сначала перейдем от таблицы 4 к таблице 7, отличающейся от первой тем, что в ее ячейках стоят не абсолютное 20Есличислоградаций(различныхзначений) велико,тоинформативнымитакжеявляютсямодаимедиана. число членов той или иной группы, набравших соответствующий балл, а доля21 (в процентах) членов группы, получивших данный балл, так как подобное преобразование (деление на одно и то же число – количество членов в данной группе) позволяет качественно сравнивать группы разных размеров (на- пример, разного количества учащихся). Затем строим гистограммы в компьютерной программе Micro- soft Excel для Windows (Меню/Вставка/Диаграмма) – см. рисунки 3 и 4, на которых по вертикали отло- жен процент членов той или иной группы, набравших соответствующий балл. Таблица7 Результаты измерений уровня знаний в контрольной и экспериментальной группах до и после эксперимента
Таким образом, описательная статистика, во-первых, позволяет представить результаты педагоги- ческого эксперимента в компактном и информативном виде, что дает возможность проводить качест- венный анализ исследуемых объектов22. Во-вторых, ряд показателей описательной статистики исполь- зуется в количественном анализе (при применении статистических критериев – см. ниже). 60,00 50,00 40,00 30,00 20,00 10,00 0,00 Низкий Средний Высокий Контрольная группа до начала эксперимента (%) Экспериментальная группа до начала эксперимента (%) Рис.3.Гистограммыконтрольнойиэкспериментальнойгруппдоначала эксперимента 60,00 50,00 40,00 30,00 20,00 10,00 0,00 Контрольная группа после окончания эксперимента (%) Экспериментальная группа после окончания эксперимента (%) Рис.4.Гистограммыконтрольнойиэкспериментальнойгрупппослеокончания эксперимента 21Доляпринимаетзначения отнулядоединицы.Дляпереходакпроцентамследуетдолюумножитьна100%. 22Показателиописательнойстатистики(объемвыборки,среднее,гистограммыит.д.) обычноприводятсявтекстедиссертационныхработиавторефератовпо педагогике. Завершив рассмотрение показателей описательной статистики, перейдем к общей методике опреде- ления степени достоверности совпадений и различий, а затем опишем ее применение сначала для дан- ных, измеренных в шкале отношений, а затем – для данных, измеренных в порядковой шкале. Общие подходы к определению достоверности совпадений и различий. Как отмечалось выше, типовой задачей анализа данных в педагогических исследованиях является установление совпадений или различий характеристик экспериментальной и контрольной группы. Для этого формулируются статистическиегипотезы: гипотеза об отсутствии различий (так называемая нулеваягипотеза); гипотеза о значимости различий (так называемая альтернативнаягипотеза). Для принятия решений о том, какую из гипотез (нулевую или альтернативную) следует принять, используют решающие правила – статистические критерии23. То есть, на основании информации о результатах наблюдений (характеристиках членов экспериментальной и контрольной группы) вычисля- ется число, называемое эмпирическим значением критерия. Это число сравнивается с известным (на- пример, заданным таблично) эталонным числом, называемым критическимзначением критерия. Критические значения приводятся, как правило, для нескольких уровней значимости. Уровнем зна- чимости называется вероятность ошибки, заключающейся в отклонении (не принятии) нулевой гипоте- зы, то есть вероятность того, что различия сочтены существенными, а они на самом деле случайны. Обычно используют уровни значимости (обозначаемые a ), равные 0,05, 0,01 и 0,001. В педагогических исследованиях обычно ограничиваются значением 0,05, то есть, грубо говоря, допускается не более чем 5% возможность ошибки. Если полученное исследователем эмпирическое значение критерия оказывается меньше или равно критическому, то принимается нулевая гипотеза – считается, что на заданном уровне значимости (то есть при том значении a , для которого рассчитано критическое значение критерия) характеристики экспериментальной и контрольной групп совпадают. В противном случае, если эмпирическое значение критерия оказывается строго больше критического, то нулевая гипотеза отвергается и принимается альтернативная гипотеза – характеристики экспериментальной и контрольной группы считаются раз- личными с достоверностью различий 1 – a . Например, если a = 0,05 и принята альтернативная гипоте- за, то достоверностьразличийравна 0,95 или 95%. Другими словами, чем меньше эмпирическое значение критерия (чем левее оно находится от кри- тического значения), тем больше степень совпадения характеристик сравниваемых объектов. И наобо- рот, чем больше эмпирическое значение критерия (чем правее оно находится от критического значе- ния), тем сильнее различаются характеристики сравниваемых объектов. В дальнейшем мы ограничимся уровнем значимости a = 0,05, поэтому, если эмпирическое значе- ние критерия оказывается меньше или равно критическому, то можно сделать вывод, что "ха- рактеристики экспериментальной и контрольной групп совпадают с уровнем значимости 0,05". Если эмпирическое значение критерия оказывается строго больше критического, то можно сде- лать вывод, что "достоверность различий характеристик экспериментальной и контрольной групп равна 95%". Опишем методики расчета эмпирических значений критериев для двух типовых задач анализа дан- ных – сравнения выборок, содержащих данные, измеренные в шкале отношений и порядковой шкале. Методика определения достоверности совпадений и различий для экспериментальных дан- ных, измеренных в шкале отношений. Рассмотрим случай (см. описание исходных данных выше в пятом разделе), когда для измерений используется шкала отношений. Предположим, что имеется экспе- риментальная группа, состоящая из N человек, и контрольная группа, состоящая из M человек. Допус- тим, что в результате измерения одного и того же показателя с помощью одной и той же процедуры измерений были получены следующие данные: x = (x1, x2, …, xN) – выборка для экспериментальной группы и y = (y1, y2, …, yM) – выборка для контрольной группы, где xi– элемент выборки – значение исследуемого показателя у i-го члена экспериментальной группы, i = 1, 2, …, N, а yj– значение иссле- дуемого показателя у j-го члена контрольной группы, j = 1, 2, …, M. Так как измерения производились в шкале отношений, то {xi} и {yj} – положительные, в том числе, возможно – целые, числа, для которых имеют смысл все арифметические операции. В качестве примера будем рассматривать результаты из- мерений уровня знаний в контрольной и экспериментальной группах до и после эксперимента (см. таблицу 1) – количество правильно решенных задач. 23 Заметим,чтовматематическойстатистикеисторическисложилосьназыватьстатистическимикритерияминетолько решающие правила, но и методы расчета определенного числа (используемого в решающих правилах), а также самоэточисло. Для данных, измеренных в шкале отношений, для проверки гипотезы о совпадении характеристик двух групп целесообразно использование либо критерия24 Крамера-Уэлча, либо критерия Вилкоксона-Манна-Уитни. Критерий Крамера-Уэлча предназначен для проверки гипотезы о равенстве средних (строго говоря – математических ожиданий) двух выборок, критерий Вилкоксона-Манна-Уитни25 явля- ется более "тонким" (но и более трудоемким) – он позволяет проверять гипотезу о том, что две выборки "одинаковы" (в том числе, что совпадают их средние, дисперсии и все другие показатели26). Критерий Крамера-Уэлча. Эмпирическое значение данного критерия рассчитывается на основа- нии информации об объемах N и М выборок x и y, выборочных средних xи yи выборочных диспер- сиях Dxи Dyсравниваемых выборок (эти значения могут быть вычислены вручную по формулам (1)-(2) или с помощью инструмента "Описательная статистика" в компьютерной программе Microsoft Excel для Windows – см. выше) по следующей формуле: Tэмп= . Алгоритм определения достоверности совпадений и различий характеристик сравниваемых выбо- рок для экспериментальных данных, измеренных в шкале отношений, с помощью критерия Крамера- Уэлча заключается в следующем: Вычислить для сравниваемых выборок Tэмп– эмпирическое значение критерия Крамера-Уэлча по формуле (3). Сравнить это значение с критическим значением T0.05 = 1,96: если Tэмп1,96, то сделать вывод: "характеристики сравниваемых выборок совпадают на уровне значимости 0,05"; если Tэмп > 1,96, то сделать вывод "достоверность различий характеристик сравниваемых выборок составляет27 95%". В качестве примера применим алгоритм для данных из таблицы 1. Для этого сравним сначала числа правильно решенных задач в контрольной и экспериментальной группе до начала эксперимента. Вычисляем28 по формуле (3) значение Tэмп= 0,04 1,96. Следовательно, гипотеза о совпадении характеристик контрольной и экспериментальной групп до начала эксперимента принимается на уровне значимости 0,05. Теперь сравним характеристики контрольной и экспериментальной групп после окончания экспе- римента. Вычисляем по формуле (3) значение Tэмп= 2,42 > 1,96. Следовательно, достоверность разли- чий характеристик контрольной и экспериментальной групп после окончания эксперимента составляет 95%. Итак, начальные (до начала эксперимента) состояния экспериментальной и контрольной групп сов- падают, а конечные (после окончания эксперимента) – различаются. Следовательно, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментальной методики обучения. Отметим, что мы не рассматриваем вопрос о том, "в какую сторону" экспериментальная группа от- личается от контрольной, то есть, улучшились или ухудшились (с содержательной точки зрения, не имеющей отношения к статистическим методам и являющейся прерогативой педагогики) исследуемые характеристики. |