Новая методичка статистика. 1 Расчёт основных статистических показателей для выборочных совокупностей
Скачать 1.22 Mb.
|
Вычисление вспомогательных величин: см м где n – это объём выборочной совокупности (по примеру n = 29) ; ; , Формула расчета коэффициента корреляции: . Например:. Ошибка коэффициента корреляции: . Например: . Значимость корреляции: . Например:. Число степеней свободы: . Например:. Для определения значимости коэффициента корреляции устанавливается стандартное значение t – критерий Стьюдента на 5 % уровне значимости. t – критерий Стьюдента на 5 % уровне значимости (определяется по таблице учебника) исходя из числа степеней свободы t05 = 2,045 t r= 7,36 > t05, значит корреляция значима. Расчет вспомогательных величин для вычисления корреляционного отношения приведен в таблице 5.2. Для расчёта вспомогательных величин необходимо произвести группировку данных по независимой переменной или разбить все данные на классы с равной величиной классового интервала. В курсовой работе данные группируются в ступени толщины с величиной классового интервала 4 см. ступени толщины не пропускаются, при этом число деревьев в ступени должно быть не менее двух. Таблица 5.2 Расчет вспомогательных величин для вычисления корреляционного отношения
yусловное- средняя высота ступени толщины. Например:. Формула расчета корреляционного отношения . Например:. Ошибка корреляционного отношения . Например:. Значимость корреляционного отношения . Например:. Число степеней свободы: . Например:. t – критерий Стьюдента на 5 % уровне значимости (определяется по таблице учебника) исходя из числа степеней свободы t05 = 2,045 (определяется по таблице учебника), t r= 7,36 > t05, значит корреляция значима. Мера линейности корреляции . Например:. Основная ошибка . Например:. По отношению меры линейности к основной ошибке судим о линейности связи. Например:, связь приблизительно можно считать линейной. Степень тесноты связи между изучаемыми признаками производится по величине корреляционного отношения с помощью таблицы 5.3. Таблица 5.3 Таблица для определения тесноты связи
Статистическое заключение По результатам корреляционного анализа можно сделать вывод, что взаимосвязь между диаметром и высотой ствола по направлению – прямая, по тесноте – высокая, по форме – близка к линейной. 6.0 Расчет среднеквадратических ошибок При проведении полевого и других опытов проявляются три вида ошибок. Ошибка – это расхождение между различными значениями выборочной совокупности или отдельных наблюдений от истинных значений измеряемых величин. Основные свойства ошибок и причины их возникновения Случайные ошибки – это ошибки, возникающие под воздействием факторов, действие которых не значительно и их нельзя выделить и учесть отдельно. Случайные ошибки в полевом опыте неизбежны. Математическая статистика дает методы их определения. Случайные ошибки имеют знак «±». Они взаимопогашаются. Систематические ошибки – искажают измеряемую величину в сторону преувеличения или преуменьшения в результате действия вполне определенной постоянной причины. Исключить действие этой причины можно путем применения правильной методики. Систематические ошибки имеют конкретный знак или «+» или «–». Они не взаимопогашаются. Грубые ошибки (промахи) – возникают в результате нарушения основных требований полевого опыта. Грубые ошибки не погашаются, а результат бракуется. Для математической обработки подходят лишь результаты наблюдений без систематических и грубых ошибок. Пример расчета среднеквадратических ошибок при определении запаса древесины глазомерным способом приведен в таблице. Таблица 6.1 Расчет среднеквадратических ошибок. Определение запаса глазомерным способом первым таксатором
Для расчёта отклонения с поправкой поправку взять с противоположным знаком, не зависимо от знака отклонения. Аналогичный расчет ошибок производится по результатам определения запаса глазомерным способом для второго таксатора. На основе сравнения среднеквадратических ошибок (случайных и ошибок для всех случаев) делаем вывод о работе двух таксаторов. Сравнительную оценку по случайной ошибке можно произвести в том случае, если её численное значение не превышает 10 %. В противном случае сравнение лучше сделать по ошибке для всех случаев. Статистическое заключение Работа по определению запаса глазомерным способом на пробных площадях, вторым таксатором выполнена более точно, так как его ошибка для всех случаев меньше, по сравнению с первым таксатором. 7.0 Регрессионный анализ Постановка задачи Математические выражения, отражающие причинно-следственные взаимосвязи и взаимодействия в системах (или модели связи) являются основными типами моделей, применяемых в области лесного дела. В качестве математической формы эмпирических моделей связи, в основном, используют регрессионные уравнения и реже – интерполяционные многочлены. В первом случае применяют различные модификации метода наименьших квадратов, позволяющие просто и достаточно надежно оценить статистическим путем разрабатываемую модель. Второй метод сводится к механической процедуре аналитического выражения числовых массивов. Для вычисления коэффициентов регрессионных уравнений основным методом является метод наименьших квадратов, предложенный в начале XIX в. Лежандром и Гауссом. Требование метода наименьших квадратов заключается в том, что теоретические точки линии регрессии y должны быть получены таким образом, чтобы сумма квадратов отклонений от этих точек эмпирических значений была минимальной, то есть 7.1. Линейное уравнение с логарифмированием факторного признака Для вычисления коэффициентов a и b для уравнения прямой с логарифмированием факторного признака необходимо решить следующую систему уравнений: Решение системы относительно неизвестных a и b дает численные значения искомых коэффициентов: Пример: Найти уравнение регрессии, описывающее фактические значения высот по диаметрам в сосновом древостое, используя линейную модель с логарифмированием факторного признака. Расчет вспомогательных величин для нахождения коэффициентов уравнения приведен в таблице 7.1. Таблица 7.1 Расчет вспомогательных величин для нахождения коэффициентов a и b
Найдя вспомогательные величины по таблице 7.1 подставляем их в исходные выражения или в формулы определения коэффициентов а и в. По приведённому примеру коэффициенты а и в соответственно равны: Полученное уравнение регрессии имеет вид yх = -14,69 + 11,42×ln xi. Далее в 7 колонке таблицы 7.1 вычисляются высоты деревьев по полученному уравнению: например yx = –14,69 + 11,42×2,08 = 9,04 и так далее. В 8 и 9 колонках находят расхождение между высотой опытной (колонка 2) и высотой полученной по уравнению (колонка 7) и квадрат этого отклонения. Проверка значимости уравнения регрессии производим по F – критерию Фишера, который равен отношению общеё дисперсии к дисперсии остаточной. Например: При сравнении фактического значения F – критерия с F – критерием стандартным на 5 или 1 % уровне значимости делаем заключение об адекватности модели. Если Fф > Fst, то предложенная модель (уравнение) адекватно предсказывает изменение высот по диаметрам. Fst берётся из приложения учебника, в зависимости от числа степеней свободы общей дисперсии (большая), и числа степеней свободы остаточной дисперсии (меньшая). Число степеней свободы для общей дисперсии k1=n-2 Число степеней свободы для остаточной дисперсии k2=n-1 Для приведённого примера: k1=n-2=12-2=10 k2=n-1=12-1=11 Fst для 5 % уровня значимости равно 2,86. Так как Fф > Fst, то предложенная модель (уравнение) адекватно предсказывает изменение высот по диаметрам. Представить графически изменение высот от диаметров для оценки адекватности модели по полученному уравнению. Построение графиков по исходным данным пунктирной линией (xi ,yi), по расчетным данным сплошной линией (xi , yx). Статистическое заключение По результатам регрессионного анализа можно сделать заключение, что линейное уравнение с логарифмированием факторного признака, представленное результатами опыта у = -14,69 + 11,42×ln xi в 55,53 раза лучше описывает изменение зависимой переменной чем среднее значение аргумента. 7.2. Уравнение гиперболы Для вычисления коэффициентов a и b гиперболической зависимости: необходимо решить следующую систему уравнений: Результатом решения системы нормальных уравнений являются следующие выражения: Расчет вспомогательных величин для нахождения коэффициентов уравнения приведен в таблице 1.8.2. Таблица 7.2 Расчет вспомогательных величин для нахождения коэффициентов a и b
Полученное уравнение регрессии имеет вид yх = 30,965 – (197 / xi). Дальнейшие расчёты производятся по аналогии с пунктом 7.1. Представить графически изменение высот от диаметров (смотри уравнение гиперболы). Статистическое заключение По результатам регрессионного анализа можно сделать заключение, что уравнение гиперболы, представленное результатами опыта вид yх = 30,965 – (197 / xi) в 8,18 раза лучше описывает изменение зависимой переменной чем среднее значение аргумента. 7.3. Уравнение показательной кривой Для вычисления коэффициентов а и в для уравнения необходимо решить следующую систему нормальных уравнений: Решение системы относительно неизвестных а и в дает численные значения искомых коэффициентов: Пример: Найти уравнение регрессии, описывающее фактические значения высот по диаметрам в сосновом древостое, используя уравнение показательной кривой. Расчет вспомогательных величин для нахождения коэффициентов уравнения приведен в таблице 7.3 Таблица 7.3 Расчет вспомогательных величин для нахождения коэффициентов а и в
Полученное уравнение регрессии имеет вид у=10,35×(1,024хi). Дальнейшие расчёты производятся по аналогии с пунктом 7.1. Представить графически изменение высот от диаметров (смотри линейное уравнение с логарифмированием факторного признака). Статистическое заключение По результатам регрессионного анализа можно сделать заключение, что уравнение показательной кривой, представленное результатами опыта ух = 10,35×(1,024х), в 6,2 раза лучше описывает изменение зависимой переменной, чем среднее значение аргумента.
На практике может сложиться ситуация, когда несколько уравнений адекватно предсказывают значения. В этом случае наиболее подходящим уравнением регрессии является то, которое характеризуется наибольшим фактическим значением F - критерия Фишера. Пример. В таблице приведены три уравнения регрессии, адекватно предсказывающие значения высот по диаметрам в сосновом древостое, т. е. Fф > Fst. Взаимное сравнение показывает, что наилучшие результаты дает уравнение регрессии, выражаемое линейным уравнением с логарифмированием факторного признака (Fф = 109,5). Взаимное сравнение уравнений регрессии приведено в таблице 7.4. Таблица 7.4 Взаимное сравнение уравнений регрессии
При выборе уравнения регрессии следует оперировать погрешностями и ошибками, рассчитываемыми по следующим формулам: абсолютная погрешность уравнения относительная погрешность уравнения систематическая ошибка случайная ошибка где n – число наблюдений; yi – значение функции по уравнению; yx - фактическое значение функции. Чем меньше величина погрешностей и ошибок, тем надежнее уравнение описывает исследуемую взаимосвязь. Библиографический список
Приложения Вопросы для контрольной работы
- размах варьирования - дисперсия - коэффициенты вариации и дифференциации - стандартное отклонение
Дать статистическую характеристику.
Перечислить основные теоремы теории вероятности.
Задачи для контрольной работы
r = + 0.923 η = 0.978 t факт =10.2 tфакт = 13.34 t05 = ? t05 = ? Число наблюдений равно 30 деревьям.
r = 0.00 η = 0.99
r = +0.96 η = 0.98
r = - 0.71 η = 0.81 t05 = 2.045 mr = 0.02 mr = 0.09 n = 30(объем выборки)
Fрасч = 28 F05/01 =2.62/3.9
I таксатор II таксатор Случайная ошибка σ1 =8.17% σ2 = 10.12% |