Статистический анализ учебника иностранного языка (1). Учебника иностранного языка дисциплина Учебная практика, практика по применению математической статистики в исследованиях
Скачать 328.66 Kb.
|
3. Составить для каждого УМК вариационные ряды распределения слов в каждом тексте.Для составления вариационных рядов нужно выделить два признака: Х и N, где Х – это количество слов, а N- частота (т.е. сколько раз было такое количество слов). Пусть для изучения количественного (дискретного или непрерывного) признака X из генеральной совокупности извлечена выборка x1 , x2 ,..., xk объема n. Наблюдаемые значения xi признака X называются вариантами. Последовательность вариант, записанных в возрастающем порядке, называют вариационным рядом В нашем случае x1.1 - 13 (минимальное количество слов в тексте из УМК 1), а x1.10 - 21(максимальное количество слов в тексте УМК 1). В таблице ниже необходимо записать количество слов от минимального до максимального. Числаn1 , n2 ,..., nk называются частотами. Таблица, отображающая зависимость между вариантами xi и частотами ni называется вариационным рядом. Общий формат вариационного ряда: Важно! Если одно и тоже количество слов оказывается в нескольких текстах, то количество слов по признаку Х указываем один раз, а в признаке N указываем сколько раз встретилось такое количество. В нашем случае, 13 слов встретилось в 2х текстах, 17 слов в 3 и т.д. Пример для УМК 1 Мы пишем: Вариационный ряд для УМК Enjoy English 3
Пример для УМК 2 Мы пишем: Вариационный ряд для УМК Enjoy English 8
ЧАСТЬ 3.1. Осуществить расчет статистических характеристик для каждого из вариационных рядов. Вариационные ряды для каждого из текстов представлены выше. 1. Объем выборки вариационного ряда обозначается как n и равняется сумме частот ni для каждого из вариантов xi: где k – количество показателей в таблице вариационных рядов. В нашем случае УМК 1 – 5, а УМК 2 – 6; n – частоты, их значения берем из таблицы вариационных радов (см.выше). Пример для УМК 1 (Мы пишем: Расчет объема выборки для УМК Enjoy English 3) n10n1in1,1n1,2...n1,52132210. i1 6 ПримердляУМК2: n20 n2i n2,1 n2,2 ...n2,6 11221310. i1 Характеристики выборочного среднего значения 2. Выборочная средняя вариационного ряда или выборки объемом nобозначается x и равняется отношению суммы произведений вариантов xi на их частоты ni к объему выборки n: где n0– объем выборки. В нашем случае 10 (см.выше) значения xiи ni – значения из таблицы вариационных рядов. Пример для УМК 1 (Мы пишем: Выборочная средняя для УМК Enjoy English 3) Пример для УМК 2 3. Выборочная медиана вариационного ряда или выборки объемом n обозначается Ex и равняется значению варианта вариационного ряда, для которого одновременно выполняются два неравенства с точки зрения распределения частот слева и справа, включая рассматриваемое значение: где, xm- это текст с центральным значением, которое делит ряд на одинаковые части. В нашем случае, в УМК 1 x1.3 =17. Для УМК 2 нужно взять 2 центральных значений x2.6 и x2.7 (16+17)и делим на 2, округляем в большую сторону. n1–значения частот до центрального nm – значения частот после центрального значения. n–объем выборки (см.выше). Пример для УМК 1(Мы пишем: Выборочная медиана для УМК Enjoy English 3) П ример для УМК 2 Характеристики отклонения от выборочного среднего значения 4 . Выборочная дисперсия вариационного ряда или выборки объемом n обозначается x и равняется отношению суммы произведений квадратов разностей между значениями вариантов и средней выборочной величины на их частоты к объему выборки: где, n0 – объём выборки. В нашем случае 10 (см.выше); k – количество показателей в таблице вариационных рядов. В нашем случае УМК 1 – 5, а УМК 2 – 6; x1–значения вариантов из таблицы вариационных рядов (см.выше); – выборочная средняя ( см.выше) n1 – объем выборки (см.выше) Пример для УМК 1(Мы пишем: Выборочная дисперсия для УМК Enjoy English 3) Пример для УМК 2 вариационного ряда или выборки объемом n обозначается x и равняется квадратному корню из выборочной дисперсии вариационного ряда или выборки объемом n: где, x– выборочная дисперсия (см.выше). Пример для УМК 1 Пример для УМК 2 5. Осуществить сравнительный анализ имеющихся вариационных рядов на выявление взаимосвязей между текстами. Коэффициенты корреляции Выборочный коэффициент корреляции Пирсона На основании исходных данных исходных вариационных рядов составляем ковариационную матрицу:
Пример ковариационной матрицы для УМК 1 и 2:
Числовые характеристики совокупности вариационных рядов 1. Выборочная ковариация совокупности вариационных рядов обозначается k(X1, X 2 ) и равняется отношению суммы произведений разностей между значениями вариантов и средней выборочной величины для каждой из исходных выборок на частоты совместного появления данных значений к объему равных выборок исходных вариационных рядов: где, x1 – значения вариантов из таблицы вариационных рядов (см.выше); – выборочная средняя ( см.выше) n – показатель из ковариационной матрицы (см.выше). В нашем случае, 1 или 0. Пример выборочной корреляции для УМК 1 и 2
2. Коэффициент корреляции Пирсона совокупности вариационных рядов обозначается r(X1,X2) и равняется отношению выборочной ковариации к произведению выборочных средних квадратических отклонений исходных вариационных рядов: где,k(X1,X2) – выборочная ковариация ( см.выше); x- выборочное среднее квадратическое отклонение (см. выше). Пример коэффициента корреляции для УМК 1 и 2 Значение коэффициента корреляции Пирсона отражает степень связи с точки зрения совокупностей значений и частотами их совместного появления для совокупностей вариационных рядов X1 и X 2 с одинаковым объемом выборки: Если значение коэффициента корреляции равно 0, то вариационные ряды X1 и X 2 с одинаковым объемом выборки никак не связаны друг с другом с точки зрения значений, то есть являются некоррелированными. Если значение коэффициента корреляции отлично равно 1, то между вариационными рядами с одинаковым объемом выборки X1 и X 2 существует строго прямая связь, тогда как при значении -1 наблюдается строго обратная связь. Если значение коэффициента корреляции отлично от 0, то вариационные ряды X1 иX 2 с одинаковым объемом выборки никак связаны друг с другом с точки зрения значений, то есть коррелируют друг с другом с определенным характером и силой связи. Если значение коэффициента корреляции отлично от 0 и является отрицательным числом ( 1rX1, X 2 0 ), то существует обратная по характеру связь между вариационными рядами с одинаковым объемом выборки X1 и X 2 связь, тогда как в обратном случае ( 0 rX1, X 21) связь является прямой по характеру. Сила связи выбирается по таблице: Пример коэффициента корреляции для УМК 1 и 2: rX1, X 2 0,55. Так какrX1, X 2 0, то связь между объёмом текстов и этапом обучения (УМК 1 и 2) по характеру связи является прямой. Так как 0,3 rX1, X 2 0,7 , то связь между распределением по силе связи является средней. Вывод: существует прямая связь между обьемом текстов и этапом обучения, но данная связи средняя по силе. ЧАСТЬ 3.2 |