Новиков учебник. Изложение одноименной книги
Скачать 101.59 Kb.
|
Для данных, измеренных в дихотомической шкале целесообразно использование критерия Фише-ра34, для которого эмпирическое значение j эмпвычисляется по следующей формуле (арксинус может быть вычислен в Excel): jэмп= |2 arcsin( ) – 2 arcsin( )| . Критическое значение j0.05критерия Фишера для уровня значимости 0,05 равно 1,64. Алгоритм определения достоверности совпадений и различий для экспериментальных данных, из- меренных в дихотомической шкале, заключается в следующем: Вычислить для сравниваемых выборок j эмп– эмпирическое значение критерия Фишера по фор- муле (6). Сравнить это значение с критическим значением j 0.05= 1,64: если j эмп1,64, то сделать вывод: "характеристики сравниваемых выборок совпадают с уровнем значимости 0,05"; если j эмп > 1,64, то сделать вывод "достоверность различий характеристик сравниваемых выборок составляет 95%". Применим алгоритм для экспериментальных данных из таблицы 11. Сначала вычисляем по форму- ле (2) эмпирические значения критерия Фишера. Для примера приведем расчет. Параметры экспери- ментальной группы (N=25) после окончания эксперимента: p=0,92, контрольной группы (M= 30): q=0,60 (см. таблицу 11). Подставляя в формулу (6), получаем: jэмп=|2arcsin( ) – 2 arcsin( )| =2,94. Аналогичным образом вычисляются все оставшиеся из 16 возможных результатов парных сравне- ний групп (экспериментальная и контрольная группы, до начала и после окончания эксперимента). Результаты вычислений приведены в таблице 12. Ячейки таблицы 12 содержат эмпирические значения критерия Фишера для сравниваемых групп, соответствующих строке и столбцу. Жирным шрифтом выделены результаты сравнения характеристик экспериментальной и контрольной группы до начала и после окончания эксперимента. Например, эмпирическое значение критерия Фишера, получаемое при сравнении характеристик контрольной группы до начала эксперимента (вторая строка таблицы 12) и экспериментальной группы до начала эксперимента (третий столбец таблицы 12), равно 0,16. Следовательно "состояния экспери- ментальной и контрольной групп до начала эксперимента совпадают с уровнем значимости 0,05". Теперь аналогичным образом сравним характеристики экспериментальной и контрольной групп по- сле окончания эксперимента. Так как j эмп = 2,94 > 1,64 = j кр, то "достоверность различий состояний экспериментальной и контрольной групп после окончания эксперимента составляет 95%". Таблица12 Эмпирические значения критерия Фишера для данных из таблицы 11
34ВматематическойстатистикесуществуетнесколькокритериевФишера. Мыиспользуемодиниз них–такназываемоеугловоепреобразование,поэтому далееподкритерием ФишерабудемпониматьименноугловоепреобразованиеФишера. Итак, начальные (до начала эксперимента) состояния экспериментальной и контрольной групп сов- падают, а конечные (после окончания эксперимента) – различаются. Следовательно, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментальной методики обучения. Отметим, данный вывод (один и тот же) был получен при применении к соответствующим эксперимен- тальным данным всех четырех критериев – Крамера-Уэлча, Вилкоксона-Манна-Уитни, 2 и Фишера35. Планирование педагогического эксперимента. Отметим, что, несмотря на то, что выше обсужда- лось применение статистических методов к уже полученным в результате проведения педагогического эксперимента данным, знание этих методов позволяет планировать эксперимент на стадии его подго- товки. Например, формулы (3)-(6), определяющие эмпирические значения критериев, совместно с фик- сированными критическими их значениями, позволяют заранее (до проведения эксперимента) оцени- вать необходимый объем выборки и другие важные параметры36. Кроме того, если до начала эксперимента выявлено статистически значимое различие характеристик экспериментальной и кон- трольной групп по интересующему исследователя критерию (например, по успеваемости), то проводить эксперимент не имеет смысла, так как никакие результаты сравнения характеристик этих групп после окончания эксперимента, не позволят выявить вклада сравниваемого с традиционным педагогического воздействия. Заключение. Итак, в настоящей работе мы попытались изложить на доступном уровне "рецепты" применения статистических методов при решении типовых задач анализа данных в педагогических исследованиях. В то же время, не следует забывать, что рассмотрены лишь несколько, хотя и наиболее распространенных, но все-таки достаточно простых ситуаций. Арсенал же современных статистических методов гораздо богаче. Быть может, освоение и применение этого арсенала подтолкнет исследователей в области педагогических наук как к расширению соответствующих предметных областей, так и к по- вышению уровня обоснованности научных результатов. Еще раз напомним, что рассмотренные выше инструменты анализа данных имеют программную реализацию в виде свободно распространяемой компьютерной программы "Статистика в педагоги- ке", которую можно загрузить с адреса http://www.mtas.ru/uploads/stat.zip (2.9 Мб). 35 Перечисленные четыре критерия обладают различной "мощностью" – возможны случаи, когда, например, применениекритерия Крамера-Уэлча или критерия Вилкоксона-Манна-Уитни к данным, измеренным в шкале отношений, свидетельст-вует о наличиистатистическизначимых различий, а применение критерияc 2 к тем же эмпирическимрезультатам, пере-веденным в порядковую шкалу, свидетельствует о совпадении характеристик (см. также обсуждение потерь информациипри переходе от шкалы отношений к порядковой шкале выше). Поэтому можно рекомендовать максимально использоватьвсю полученную в результате педагогического эксперимента информацию – если измерения проводились в шкале отноше-ний, тоиобрабатыватьданные следуетв этойшкале. 36 Конечно, чем больше объемы выборок, тем в некотором смысле лучше, то есть тем проще будет обосновать различия,если они есть. Но, с другой стороны, привлечение к педагогическому эксперименту каждого нового участника требует отисследователяопределенных усилий,поэтому целесообразнозаранеепримерноопределитьтребуемыйобъем выборок. |