Страница: 28/38
e - независимая ((М (ei ej ) = 0, при i ¹ j ) нормально распределенная случайная величина – остаток (помеха) с нулевым математическим ожиданием (me = 0) и постоянной дисперсией ( De = s2 ). Она отражает тот факт, что изменение Y будет недостаточно описываться изменением X – присутствуют другие факторы, неучтенные в данной модели.
Параметры модели оцениваются по методу наименьших квадратов, который дает наилучшие (эффективные) линейные несмещенные оценки.
Если записать выражение для определения коэффициентов регрессии в матричной форме, то становится очевидным, что решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экономических показателей это условие выполняется не всегда. Линейная или близкая к ней связь между факторами называется коллиниарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисление параметров либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Чтобы избавиться от коллиниарности, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной.
Проверка качества модели
Качество модели оценивается стандартным для математических моделей образом: по адекватности и точности. Расчетные значения получаются путем подстановки в модель фактических значений всех включенных факторов.
Кроме рассмотренных выше характеристик, целесообразно использовать корреляционное отношение (индекс корреляции), а также характеристики существенности модели в целом и ее коэффициентов.
В качестве характеристики тесноты связи применяется индекс корреляции (Iyx ) переменных Y по X.
Iyx = 1- (se2 / sy2) , ( 21 )
где se2 – это дисперсия параметра Х относительно функции регрессии, то есть остаточная дисперсия, которая характеризует влияние на Y прочих неучтенных факторов в модели;
sy2 – полная дисперсия, она измеряет влияние параметра X и Y.
Из этого следует, что 0 £ Iyx £ 1. При этом Iyx = 0 означает полное отсутствие корреляционной связи между зависимой переменной Y и объясняющей переменной Х. В то же время максимальное значение индекса корреляции (Iyx = 1) соответствует наличию чисто функциональной связи между переменными X и Y и, следовательно, возможность детерминированного восстановления значений зависимой переменной Y по соответствующим значениям объясняющей переменной X.
Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной модели и их линейной зависимости он равен коэффициенту линейной корреляции.
Коэффициент множественной корреляции (индекс корреляции), возведенный в квадрат, называется коэффициентом детерминации. Он показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, то есть определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.
В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты , которая определяется по формуле:
n _
S = S2 / å (xi – x) , ( 22 )
i=1
где S2 – дисперсия зависимой переменной Y.
n _ n
S2 = å (yi – yi)2 / n-2 = å ei2 / n-2 ( 23 )
i=1 i=1
Квадратный корень из этой величины (S) называется стандартной ошибкой оценки:
n _
S а1= S2 / å (xi – x) , ( 24 )
i=1
Коэффициент а1 есть мера наклона линии регрессии. Очевидно, чем больше разброс значений Y вокруг линии регрессии, тем больше в среднем ошибка в определении ее наклона. Кроме того, чем больше число наблюдений n, тем больше сумма å (xi – x)2 и тем, самым меньше стандартная ошибка оценки а1 .
Проверка значимости модели регрессии осуществляется по F-критерию (критерий Фишера), расчетное значение которого определяется по формуле:
Fp = {Q1 * (n - m)} / {Q2 * (m-1)}, ( 25 )
где m – число объясняющих (независимых переменных);
n – число наблюдений;
Q1 - сумма квадратов, объясняемая регрессией, то есть сумма квадратов отклонений обусловленных влиянием признака Х;
Q2 – остаточная сумма квадратов, характеризующая влияние неучтенных факторов.
По заданному уровню значимости l и числу степеней свободы k1 =m-1 и k2 = n-m по таблице F-распределения находится значение Fтабл и сравнивается с расчетным Fp :
Реферат опубликован: 8/03/2006