Статистика. Курс лекций по теории статистики
Скачать 3.05 Mb.
|
9.2.Парная регрессия на основе метода наименьших квадратов и метода группировокПарная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями: прямой гиперболы (8.3) параболы и так далее. Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия. Оценка параметров уравнений регрессии (a0, a1, и a2 - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (a0 , a1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии: Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид: (8.4) где n - объем исследуемой совокупности (число единиц наблюдения). В уравнениях регрессии параметр a0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков; коэффициент регрессии a1 показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения. Например, имеются данные, характеризующие деловую активность закрытого акционерного общества (ЗАО): прибыль (млн. руб.) и затраты на 1 руб. произведенной продукции. Таблица 8.2 Зависимость между прибылью ЗАО и затратами на 1 руб. произведенной продукции
Предположим наличие линейной зависимости между рассматриваемыми признаками. Система нормальных уравнений для данного примера имеет вид: Отсюда: a0 = 4494,06; a1 = -44,8 Следовательно, =4494,06-44,8x. На практике исследования часто проводятся по большому числу наблюдений. В этом случае исходные данные удобнее представлять в сводной групповой таблице. При этом анализу подвергаются сгруппированные данные и по факторному (x) и по результативному (y) признакам, то есть уравнения парной регрессии целесообразно строить на основе сгруппированных данных. Если значения x и y заданы в определенных интервалах (a, b), то для каждого интервала сначала необходимо определить середину (x’/y’ = (a+b)/2), а затем уже коррелировать значения x’ и y’ и строить уравнения регрессии между ними. Например, определим зависимость между величиной уставного капитала и числом занятых на предприятиях, выставивших акции на чековые аукционы в 1996 г. в одном из регионов, который характеризуется следующими данными: Таблица 8.3 Распределение предприятий, выставивших акции на чековые аукционы в 1996 г., по величине уставного капитала и числу занятых в одном из регионов
Предположим наличие линейной зависимости между рассматриваемыми признаками. Система нормальных уравнений для определения коэффициентов уравнения регрессии примет вид: где n=30 - число анализируемых предприятий; fx/fy- число предприятий, согласно распределению, соответственно по факторному и результативному признакам; yfy / xfx- значения результативного и факторного признака по конкретной группе предприятий. Так для первой группы: yfy=1714,515=25717,5; xfx=428=336 xyfy=1714,5442+1714,5698+1714,52154+1714,53210= =2904363 x2fх=42428=14112 Таким образом, подставив в систему суммарные значения, получим: a0=6640; a1=64 Отсюда =6640+64x. |