Теория вероятностей. Вопросы корреляция
Скачать 30.94 Kb.
|
Вопросы корреляция Корреляционная зависимость – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака. Параметры связи двумерной линейной модели - Параметрами связи модели являются: парный линейный коэффициент корреляции и два коэффициента регрессии - Связь меду ними позволяет свести процедуру проверки значимости параметров связи к проверки значимости только коэффициента корреляции Свойства парного линейного коэффициента корреляции Парный коэффициент корреляции принимает значения от -1 до +1 Если парный коэффициент корреляции между признаками х*j и х*k равен нулю, то признаки х*j и х*k являются некоррелированными Парный линейный коэффициент корреляции между признаками х*j и х*k по модулю равен единице, тогда и только тогда, когда признаки х*j и х*k связаны линейной функциональной зависимостью. Положительное значение парного коэффициента корреляции между признаками х*j и х*k указывает на прямую линейную связь, отрицательное значение – на обратную линейную связь признаков. Проверка значимости параметров связи Обратный переход от z к r осуществляют по таблице z – преобразования Получение интервальной оценки для r с надежностью y Таким образом, с вероятностью y гарантируется, что генеральный коэффициент корреляции p будет находиться в интервале от r min до r max С помощью доверительного интервала можно проверить значимость p: если ноль попадает в доверительный интервал, то коэффициент корреляции не значимый. Доверительные интервалы параметров связи Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью. Доверительным называется интервал, в который попадают измеренные в эксперименте значения, соответствующие доверительной вероятности. Задачи регрессионного анализа Задачами регрессионного анализа являются установление формы зависимости между переменными, оценка функции регрессии, оценка неизвестных значений (прогноз значений) зависимой переменной. Переменные могут быть экзогенными (внешними, независимыми, объясняющими) – у, либо эндогенными (внутренними, зависимыми, объясняемыми) – х. Метод наименьших квадратов Суть метода – сумма квадратов отклонений фактических значений функции Y от значений, найденных по уравнению регрессии, должна быть наименьшей. Обеспечение статистической надежности модели Статические модели принципиально отличаются от динамических прежде всего тем, что в них не учитывается время появления ошибок в процессе тестирования и не используется никаких предположений о поведении функции риска. Эти модели строятся на твердом статическом фундаменте. Параметры связи трехмерной модели трехмерная модель распределенная случайная величина определяется девятью параметрами: Тремя математическими ожиданиями Тремя дисперсиями Тремя парными коэффициентами корреляции Нежелательные явления при построении регрессионных моделей Невключение ряда объясняющих переменных: Агрегирование переменных Использование временной информации Ошибки спецификации Ошибки выборки Ошибки измерения В основу построения моделей полагают принципы реализуемости завершенности, независимости реализации от материальной среды, оптимальности и соответствия, конструктивной целостности. Принцип реализуемости и завершенности предполагает, что по модели, которая удовлетворяет заданным требованиям, можно построить реальную систему. Система может быть выполнена с использованием имеющихся у исследователя материальных средств (например, интегральных схем, микропроцессоров и т. п.). Чтобы система оказалась наилучшей, необходимо правильно выбрать целевую функцию и ограничения, учитывающие противоречивые тенденции в анализе проблем, взятых в виде целостной совокупности. Конструктивная целостность подчеркивает, что модель состоит из предикатов, которые могут быть реализованы на практике. |