Разделы

Авто
Бизнес
Болезни
Дом
Защита
Здоровье
Интернет
Компьютеры
Медицина
Науки
Обучение
Общество
Питание
Политика
Производство
Промышленность
Спорт
Техника
Экономика

Этапы построения экономико-статистической модели

Процесс построения регрессионной экономико-статистической модели обычно выполняется в следующей последовательности:

  1.  Постановка задачи.
  2.  Сбор исходных данных и их анализ.
  3.  Отбор факторов для построения модели.
  4.  Выбор вида регрессионной модели и оценка ее параметров.
  5.  Проверка адекватности построенной модели.
  6.  Интерпретация полученных результатов.

ПОСТАНОВКА ЗАДАЧИ

На данном этапе формулируется цель построения модели; определяется показатель () и набор факторов (); для  и  выбирается измеритель; определяется перечень вопросов, на которые должны быть получены ответы в результате моделирования. Для выбранного набора факторов и показателя рекомендуется построить граф связей, с указанием направления влияния и предполагаемую тесноту связи.
Граф связей может иметь следующий вид:

На рисунке стрелками показано  силу влияния:
        (жирная) - сильное влияние,
        (сплошная) - среднее влияние,
        (пунктирная) - слабое влияние.

Знаки над стрелками показывают тип влияния: + (плюс) - прямая связь (при увеличении значения фактора значение показателя увеличивается); -   (минус)  - обратная связь (при увеличении значения фактора значение показателя уменьшается). Граф отражает представление исследователя о возможных связях.

 

СБОР ИСХОДНЫХ ДАННЫХ И ИХ АНАЛИЗ

На данном этапе определяется источник получения информации, период, за который они собираются. Проводится проверка ряда требований, которым должны удовлетворять исходные данные.

Для построения регрессионной модели требуются данные, удовлетворяющие следующим требованиям:
1) и , включенные в модель, должны быть количественно измерены;
2)число наблюдений за  и  должны быть достаточными. Для проверки этого требования используются эмпирические формулы, устанавливающие соотношение между количеством факторов () и числом наблюдений ()   n-p-1>30,     в тех случаях, когда информация представляет собой динамические ряды, соотношение  n/p >=4;
3)наблюдения должны быть независимыми. Наблюдения считаются независимыми, если результаты каждого последующего наблюдения не связаны с предыдущими и не содержат никаких сведений о последующих наблюдениях и не влияет на них. Для оценки независимости наблюдений рассчитывается коэффициент автокорреляции.  Критерий Дарбина - Уотсона() используется для проверки наличия автокорреляции в динамических рядах. Фактическое значение коэффициента вычисляется по формуле

где  и  - соответствующие значения ряда наблюдений;
4) данные должны представлять собой качественно-однородную совокупность. Однородность информации подразумевает отсутствие (или небольшое количество) нетипичных наблюдений. Для проверки однородности используют:
а) “правило трех сигм”: 
где  -  вектор значений (ряд наблюдений);
-    среднее значение данного ряда наблюдений;
 -  среднеквадратическое отклонение данного ряда.
Информация считается однородной, если в этот интервал попадает 97% наблюдений;
б) коэффициент вариации  данные считаются однородными, если

в) подчиняется ли исходный ряд нормальному закону распределения.

 

Если исходная совокупность неоднородна, то на графике появляются волны.
Если обнаружены нетипичные наблюдения, то их следует из дальнейшего анализа исключить и пересчитать статистические характеристики (,) по оставшейся совокупности наблюдений;
 5) факторы, включенные в модель, должны быть независимыми друг о  друга. Обычно это явление проверяется при анализе явления коллинеарности.

 

ОТБОР ФАКТОРОВ ДЛЯ ПОСТРОЕНИЯ МОДЕЛИ

На этом этапе анализируются связи между факторами (наличие коллинеарных зависимостей), а также связи каждого фактора с . Подобный анализ называется корреляционным анализом,  использующим показатели тесноты связи (ТС).

Для интерпретации  ТС приведем следующие схемы (поля корреляции).

Полем корреляции или диаграммой рассеяния называют совокупность значений пар показателей ( и  или и ) в двумерной системе координат.
На рис. (а) разброс точек незначительный, вариация исследуемого показателя  очень сильно связана с вариацией фактора . На рис. (б) связь между  и  незначительна. Если фактор тесно связан с исследуемым показателем, т.е. вариация фактора связана с вариацией , то изменяя в нужном направлении величину фактора можно управлять исследуемым показателем.

Различают парные и многофакторные связи. Соответственно существуют парные и многофакторные показатели ТС.

В зависимости от вида связи - линейная и нелинейная -  различают показатели ТС, характеризующие связь при линейной форме (коэффициент корреляции) и показатели ТС, способные выражать ТС при любой форме связи (корреляционное отношение, индекс корреляции).

При анализе исходных данных различают три вида отклонений:
а) фактических значений от среднего ;
б) расчетных значений от среднего ;
в) фактических значений от расчетного .
Первый тип отклонений возникает под воздействием всех факторов, оказывающих влияние на  ; второй тип отклонений - под воздействием факторов, включенных в модель;  третий тип отклонений - под воздействием факторов, неучтенных в модели, таким образом, =()+().

Среднеквадратическое отклонение, отражающее вариацию исследуемого показателя под воздействием всех факторов, вычисляют по формуле:

аналогично вычисляются вариация показателя под действием факторов, учтенных в модели
 
вариация показателя под действием факторов, неучтенных в модели

Если при расчете показателей вариации в знаменателе учитывается число степеней свободы, то их принято обозначать , ,
Парный коэффициент корреляции служит мерой линейной взаимосвязи между двумя измеренными величинами. Он может принимать значения от -1 до +1. Если он равен нулю, то линейная связь между  и  или между  и   отсутствует. Если он равен +1 или -1, то связь строго линейная. Отрицательный знак у коэффициента корреляции свидетельствует об обратной связи между  и  или   и  , а положительный знак - о прямой линейной зависимости.

Парный коэффициент корреляции можно вычислить по формуле

Взаимосвязь между факторами наглядно можно представить в виде матрицы коэффициентов корреляции

где 0 - индекс исследуемого показателя; 1, 2, ..., p - индексы соответствующих факторов.

Множественный коэффициент корреляцииR является мерой линейной зависимости  между  и набором  факторов.  Границы изменения R от 0 до 1 . Нулевое значение этого коэффициента указывает, что  не зависит (линейно) от набора факторов, а значение 1 указывает на полную линейную зависимость. Расчет коэффициента  множественной корреляции производится по формуле

Корреляционное отношение  является универсальным показателем ТС, характеризующим ТС при любом виде связи (линейная или нелинейная) между  и ,  рассчитывается таким образом

Границы изменения корреляционного отношения такие же: от 0 до 1.

В связи с тем, что показатели ТС рассчитываются по ограниченному числу наблюдений, необходима их проверка на надежность. При этой проверке устанавливается, существенно ли отличается показатель ТС от нуля. Для проверки этой гипотезы используют t-критерий (критерий Стьюдента). Вычисляется расчетное значение этого коэффициента:
                   .
Среднеквадратические ошибки вычисляются соответственно
         ,        ,              .
Расчетное значение t-критерия сравнивается с табличным. Если t-расчетное > t- табличного, то проверяемый показатель считается надежным. Табличное значение t-критерия определяется при уровне значимости  и числе степеней свободы . Уровень значимости, как правило, принимается равным 0,05  или 0,01. При таком  можно с доверительной вероятностью соответственно 0,95 или 0,99 утверждать, статистически значим или нет соответствующий показатель ТС. 

Число степеней свободы равно:
для  r                   k = n - 2
для R                   k = n - p - 1
для                    k = n - 2      .
Коэффициенты парной корреляции  позволяют провести анализ коллинеарности и мультиколлинеарности факторов.  Коллинеарными называются такие факторы, теснота связи между которыми очень высока (значение парного коэффициента для таких факторов >=0,8).  Если тесно связанных факторов несколько, то такие факторы называются  мультиколлинеарными. С экономической точки зрения тесно связанные факторы могут описывать одни и те же условия формирования исследуемого показателя. В регрессионную модель не должны включаться такие факторы, характеризующие одни и те же причины (условия).

Для решения вопроса о том, какой (какие) из факторов следует исключить из дальнейшего анализа, рекомендуется поступать следующим образом:  если имеются факторы, теснота связи между которыми >=0,8 , то нужно сравнить соответствующие значения коэффициентов   и . Если , то -ый фактор следует оставить в модели, а  j-ый исключить.

 

ВЫБОР ВИДА РЕГРЕССИОННОЙ МОДЕЛИ

На данном этапе  устанавливается однофакторная или многофакторная будет строиться модель и вид модели (линейный или нелинейный).
Обоснование вида модели состоит в выборе вида функции (некоторого аналитического выражения), с помощью которого можно будет описать  изменение исследуемого показателя под воздействием факторов.

К обоснованию вида функции идут двумя путями:  теоретическим (анализируя экономическую природу и , выдвигается гипотеза о характере изменения показателя под действием фактора) и эмпирическим (закон изменения результативного показателя под действием фактора устанавливается путем анализа совокупности фактических данных по полям корреляции).

Наиболее употребительными выражениями при описании связи одного фактора и исследуемого показателя являются:
уравнение прямой
уравнение параболы
уравнение гиперболы

После обоснования парных взаимосвязей переходят к записи многофакторных моделей. В экономических исследованиях чаще всего применяется линейная многофакторная модель
 
В качестве нелинейных моделей применяются
полиномиальная модель
мультипликативная модель    или

Для оценки значений параметров регрессионной модели чаще всего используется метод наименьших квадратов (МНК), условие которого записывают так:

где  фактическое (расчетное) значение исследуемого показателя.

Этот метод можно применить как для линейных моделей, так и для нелинейных, допускающих преобразование их  к линейному виду путем замены переменных или дифференцированием.

Следует помнить, что применение  МНК возможно только при соблюдении ряда предпосылок. Вспомните их!!

При выполнении предпосылок коэффициенты регрессии будут эффективными, состоятельными и несмещенными.  Оценка параметра называется несмещенной, если расчетные значения равны их математическим ожиданиям; оценка называется  состоятельной, если при увеличении числа наблюдений она не изменяется; оценка называется эффективной, если она обладает наименьшей дисперсией по сравнению с другими оценками. Невыполнение предпосылок приводит к тому, что коэффициенты не выражают истинного влияния  на .

 

ПРОВЕРКА АДЕКВАТНОСТИ МОДЕЛИ

Такая проверка производится с помощью статистических критериев и на их основе делается вывод о статистической надежности построенного уравнения регрессии, о пригодности модели для анализа и прогнозирования исследуемого показателя.
Для проверки надежности модели в целом используется отношение факторной дисперсии к остаточной  Известно, что отношение этих дисперсий подчиняется распределению Фишера (F-распределение). Расчетное значение F-отношения сравнивается с табличным значением, которое определяется для конкретного уровня значимости . В экономических исследованиях  принимается равным 0,05 (реже 0,01), число степеней свободы  Если  F-расч > Fтабл , то построенная модель считается статистически надежной, а следовательно, отражает закон изменения исследуемого показателя под действием факторов.

Для измерения точности построенной модели используется средняя относительная ошибка аппроксимации

Для экономических исследований применяются следующие уровни ошибки аппроксимации: если  до 10%, то построенное уравнение регрессии достаточно точно выражает закон изменения исследуемого показателя под действием факторов и приемлемо для целей анализа; в случае построения модели для прогнозирования, допустимое значение  до 4%.
Проверку надежности параметров уравнения регрессии проводят с использованием t - критерия. Расчетное значение вычисляется по формуле       Фактическое значение t- критерия сравнивается с табличным и если  то тогда соответствующий коэффициент регрессии значим, т.е. отличен от нуля, а влияние j-го фактора следует считать сильным. Факторы, оказывающие несущественное влияние на исследуемый показатель, из модели исключают.

 

ИНТЕРПРЕТАЦИЯ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ

На этом этапе разрабатываются рекомендации об использовании результатов моделирования. Анализируется уравнение регрессии в натуральном масштабе: коэффициент регрессии  показывает, на сколько своих единиц измерения в среднем изменится исследуемый показатель, при увеличении j-го фактора на единицу своего измерения, при условии, что все остальные факторы находятся на постоянном уровне. Свободный член уравнения характеризует изменение результативного показателя за счет изменения факторов, неучтенных в модели.

В связи с тем, что факторы имеют различный физический смысл и различные единицы измерения, коэффициенты регрессии нельзя сравнивать между собой и, следовательно, трудно определить, какой из факторов оказывает наибольшее влияние. Для устранения различий в единицах измерения  применяют частные коэффициенты эластичности  характеризующие, на сколько % в среднем изменится при увеличении j-го фактора на 1% при фиксированном положении других факторов.
При определении степени влияния отдельных факторов необходим  показатель, который бы учитывал влияние анализируемых факторов с учетом различий в уровне их вариации. Таким показателем является  коэффициент регрессии в стандартизированном масштабе   Коэффициент  показывает, на сколько своих среднеквадратических отклонений изменится  при изменении j-го фактора на одно свое среднеквадратическое отклонение при фиксированном значении остальных факторов. Уравнение регрессии в стандартизированном масштабе :   где
Границы влияния фактора на показатель
 (левая граница)  (правая граница),

где доверительные полуинтервалы () рассчитываются по формуле

Дата публикации:2012-07-25

Просмотров:3298

Вернуться в оглавление:

Комментария пока нет...


Имя* (по-русски):
Почта* (e-mail):Не публикуется
Ответить (до 1000 символов):







 

2012-2018 lekcion.ru. За поставленную ссылку спасибо.