Обнаружение и корректировка ошибок спецификации

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ТВЕРСКОЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
КАФЕДРА «БУХГАЛТЕРСКИЙ УЧЕТ, АНАЛИЗ И АУДИТ»
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Тверь 2009
________________________________________________________________________________
Раздел 4. Спецификация переменных
в уравнениях регрессии
Тематические вопросы: Эконометрические модели: общая характеристика,
различия статистического и эконометрического подхода к моделированию.
Спецификация
переменных
в
уравнениях
регрессии.
Ошибки
спецификации. Обобщенная линейная модель множественной регрессии.
Обобщенный
метод
наименьших
квадратов.
Проблема
гетероскедастичности.
Автокорреляция.
Анализ
линейной
модели
множественной регрессии при гетероскедастичности и автокорреляции.
Фиктивные переменные: общий случай. Множественные совокупности
фиктивных переменных. Фиктивные переменные для коэффициентов
наклона. Тест Чоу. Моделирование: влияние отсутствия переменной,
которая должна быть включена; влияние включения в модель переменной,
которая не должна быть включена. Замещающие переменные.
Минимум содержания в соответствии с ГОС: линейные регрессионные
модели с гетероскедастичными и автокоррелированными остатками;
регрессионные модели с переменной структурой (фиктивные переменные).
4.1.Выбор формы модели регрессии: проблемы спецификации, основные
регрессионные модели………………………………………………………………..2
4.2.Ошибки спецификации: виды, обнаружение, корректировка……………5
4.3.Проблема автокорреляции остатков в моделях регрессии………………..6
4.4.Проблема гетероскедастичности остатков
в моделях регрессии………………………………………………………………….12
4.5.Обобщенный метод наименьших квадратов………………………………..18
4.6.Фиктивные переменные в регрессионных моделях……………………….18
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
4.1.Выбор формы модели регрессии: проблемы спецификации,
основные регрессионные модели
Многообразие и сложность экономических процессов предопределяет
многообразие моделей, используемых для эконометрического анализа. С
другой стороны, это существенно усложняет процесс нахождения
максимально адекватной формулы зависимости. Для случая парной
регрессии подбор модели обычно осуществляется по виду расположения
наблюдаемых точек на корреляционном поле. Однако нередки ситуации,
когда расположение точек приблизительно соответствует нескольким
функциям и необходимо из них выявить наилучшую. Например,
криволинейные зависимости могут аппроксимироваться полиномиальной,
показательной, степенной, логарифмической функциями. Еще более
неоднозначна ситуация для множествен-нои регрессии, так как наглядное
представление статистических данных в этом случае невозможно.
◊Эконометрическая модель – экономико-математическая модель,
параметры которой оцениваются с помощью методов математической
статистики; выступает в качестве средства анализа и прогнозирования
конкретных экономических процессов как на макро-, так и на
микроэкономическом
уровне
на
основе
реальной
статистической
информации. ◊Экономико-статистическая модель – вид экономикоматематической модели; описывает зависимости, носящие вероятностный
(стохастический) характер и возникающие под воздействием множества
причин и следствий в массовых, повторяющихся явлениях; предназначена
прежде всего для выявления тенденций и закономерностей, которые были
в прошлом, чтобы с их помощью оценивать будущее
Стандартная схема эконометрического исследования
осуществлении ряда последовательных процедур:
состоит
в
•
Подбор
начальной
модели:
осуществляется
на
экономической теории, предыдущих знаний об
исследования, опыта исследователя и его интуиции.
•
Оценка
параметров
статистических данных.
•
Осуществление тестов проверки качества модели (обычно
используются t-статистики для коэффициентов регрессии, Fстатистика для коэффициента детерминации и ряд других
тестов).
•
При наличии хотя бы одного неудовлетворительного ответа по
какому-либо тесту модель совершенствуется с целью устранения
выявленного недостатка.
•
При положительных ответах по всем проведенным тестам модель
считается качественной. Она используется для анализа и
модели
2
на
основе
основе
объекте
имеющихся
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
прогноза объясняемой переменной.
Основные проблемы спецификации модели регрессии:
•
Качественная модель является подгонкой спецификации модели
под имеющийся набор данных. Поэтому вполне реальна картина,
когда исследователи, обладающие разными наборами данных,
строят разные модели для объяснения одной и той же
переменной.
•
Использование
модели
для
прогнозирования
значений
объясняемой переменной. Иногда хорошие с точки зрения
диагностических тестов модели обладают весьма низкими
прогнозными качествами.
Признаки «хорошей» модели:
•
Скупость (простота): модель должна быть максимально простой,
т.е. из двух моделей, приблизительно одинаково отражающих
реальность, предпочтение
отдается
модели,
содержащей
меньшее число объясняющих переменных.
•
Единственность: для любого набора статистических данных
определяемые коэффициенты регрессии должны вычисляться
однозначно.
•
Максимальное соответствие: уравнение тем лучше, чем большую
часть разброса зависимой переменной оно может объяснить, т.е.
с максимально возможным скорректированным коэффициентом
детерминации.
•
Согласованность с теорией: модель обязательно должна
опираться на теоретический фундамент, т.к. в противном случае
результат использования регрессионного уравнения может быть
неадекватным.
•
Прогнозные
качества:
модель
может
быть
признана
качественной, если: полученные на ее основе прогнозы
подтверждаются реальностью; модель имеет малое значение
относительной ошибки прогноза ( V = S y ) при отсутствии
автокорреляции остатков.
Основные регрессионные модели:
◊Коэффициент эластичности переменной Y по переменной Х (Э) как
относительное изменение Y вследствие единичного относительного
изменения X, часто на практике, как процентное изменение Y для
однопроцентного изменения X.
3
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
Функционал
ьная форма
Уравнение
Линейная
модель
Y = β 0+ β 1 X 1 + β 2 X 2 +
Двойная
логарифм
ическая
модель
ln Y = β 0 + β 1 ln X 1 +
Логлинейная
модель
ln Y = β 0 + β 1 X 1 +
Линейнологарифм
ическая
модель
Y = β 0 + β 1 ln X 1 +
Обратная
модель
Степенная
модель
+ … + β m X m + ε
+ β 2 ln X 2 + … +
+ β m ln X m + ε
+ β 2 X 2 + … +
+ β mXm + ε
+ β 2 ln X 2 + … +
+ β m ln X m + ε
Y = β0 + β1
1
+
X1
+ β2
1
+ … +
X2
+ βm
1
+ ε
Xm
Интерпретация
коэффициента (ов) регрессии
предельный
эффект
независимого
фактора,
т.е.
прирост зависимой переменной
при изменении независимого
фактора на единицу
процентное
изменение
зависимой
переменной
вследствие
единичного
относительного прироста (напр.,
однопроцентного) независимого
фактора
темп
прироста
зависимой
переменной по объясняющей
переменной, т.е. процентное
изменение
зависимой
переменной
при
изменении
независимого
фактора
на
единицу (при интерпретации
коэффициент следует умножать
на 100%)
изменение
зависимой
переменной
вследствие
единичного
относительного
прироста
(напр.,
однопроцентного) независимого
фактора (при интерпретации
коэффициент следует делить на
100%)
скорость
асимптотического
приближения
зависимой
переменной
к
некоторому
пределу
(напр.,
β0 )
при
увеличении
объясняющей
переменной
Y = β 0 + β 1 X + β 2 X 2 + аналогично
+ … + β m X m + ε
(после
линейной
X = X1, X 2 = X 2 ,
…, X m = X m
Показател
ьная
модель
Y = β 0aβ X eε
модели
замены:
Э= β
X
Y
Э= β ,
эластичность
постоянна
Э = βX,
эластичность
растет
с
ростом Y
Э= β
1
,
Y
эластичность
убывает
с
ростом Y
1 

Э = β−

 XY 
аналогично
линейной
модели
)
аналогично
лог-линейной
модели
(после
логарифмирования)
4
Коэффициент
эластичности,
Э
аналогично
лог-линейной
модели
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
4.2.Ошибки спецификации: виды, обнаружение, корректировка
◊Ошибка спецификации как неправильный выбор функциональной
формы или набора объясняющих переменных в регрессионной модели.
Основные типы ошибок спецификации:
•
Отбрасывание значимой переменной: в результате оценки,
полученные с помощью МНК по уравнению, являются
смещенными и несостоятельными, следовательно, интервальные
оценки и результаты проверки соответствующих гипотез будут
ненадежными.
•
Добавление незначимой переменной: в результате оценки
коэффициентов, найденные с помощью МНК для модели,
остаются, как правило, несмещенными и состоятельными; однако
их точность уменьшится, увеличивая при этом стандартные
ошибки, т.е. оценки становятся неэффективными, что отразится
на их устойчивости; увеличение дисперсии оценок может
привести
к
ошибочным
результатам
проверки
гипотез
относительно значений коэффициентов регрессии, расширению
интервальных оценок.
•
Выбор неправильной функциональной формы: в результате
оценки коэффициентов, найденные с помощью МНК для модели,
как
правило,
являются
смещенными,
либо
ухудшаются
статистические свойства оценок коэффициентов регрессии и
других показателей качества уравнения; прогнозные качества
модели в этом случае очень низки.
•
Проблемы в использовании переменных: невозможно получение
данных по переменной, невозможно измерить количественно
переменную; такие ситуации характерны для переменных
социально-экономического
характера
(напр.,
качество
образования).
Обнаружение и корректировка ошибок спецификации:
Примеры обнаружения ошибок
спецификации
Примерная корректировка ошибок
спецификации
Если в уравнении регрессии В дальнейшем эту переменную
имеется одна несущественная следует
исключить
из
переменная, то она обнаружит рассмотрения
себя по низкой t-статистике
Если в уравнении несколько
статистически
незначимых
объясняющих
переменных,
обнаруженных по низкой tстатистике
Следует
построить
другое
уравнение
регрессии
без
незначимых
переменных
и
провести анализ качества с
помощью F-статистики.
5
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
Проверить
наличие
мультиколлинеарности
и
провести
соответствующие
меры.
Невозможность
получения Подбор
переменной
данных (количественных) по заместителя:
◊Замещающие
переменной.
переменные
переменные,
которые
вводятся
в
эконометрические
модели
вместо
тех
переменных,
которые
не
поддаются
измерению.
Замещающая
переменная
должна
коррелировать с переменной,
которую она замещает.
Существует ряд тестов обнаружения ошибок спецификации, среди
которых можно выделить:
•
Тест Рамсея RESET
•
Тест (критерий) максимального правдоподобия
•
Тест Валда
•
Тест множителя Лагранжа
•
Тест Хаусмана
•
Box-Сох преобразование
Суть данных тестов состоит либо в осуществлении преобразований
случайных отклонений, либо масштаба зависимой переменной с тем,
чтобы можно было сравнить начальное и преобразованное уравнения
регрессии на основе известного критерия. Подробное описание данных
тестов выходит за рамки данного курса и может быть найдено в
дополнительной литературе.
4.3.Проблема автокорреляции остатков в моделях регрессии
Автокорреляция остатков в моделях регрессии как нарушение важной
предпосылки построения качественной регрессионной модели по МНК
(одного из условий Гаусса-Маркова): «Случайные отклонения являются
независимыми друг от друга: cov(εi,εj)=0, i‡j, cov(εi,εj)=σ2, i=j».
◊Автокорреляция
(последовательная
корреляция)
остатков
определяется
как
корреляция
между
остатками
(отклонениями),
6
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
упорядоченными во времени (временные ряды) или в пространстве
(перекрестные данные): cov(εt-1,εt)<>0.
Автокорреляция остатков (отклонений) обычно встречается в
регрессионном анализе при использовании данных временных рядов. При
использовании
перекрестных
данных
наличие
автокорреляции
(пространственной корреляции) крайне редко. В экономических задачах
значительно
чаще
встречается
так
называемая
положительная
автокорреляция (cov(εt-1,εt) > 0), чем отрицательная автокорреляция
(cov(εt-1,εt)< 0).
Примечание:
Порядок автокорреляции определяется периодом (p) прошлых
значений случайного члена εt-p, относительно периода (t) значения
случайного члена εt , между которыми обнаружена корреляция: cov(εtНапример, автокорреляция первого порядка формализуется
p,εt)<>0.
следующим образом: εt=ρεt-1+ ut, где ρ – коэффициент автокорреляции
первого порядка (-1;1).
Основные причины, вызывающие появление автокорреляции:
•
Ошибки спецификации: неучет в модели какой-либо важной
объясняющей переменной либо неправильный выбор формы
зависимости обычно приводит к системным отклонениям точек
наблюдений от линии регрессии, что может привести к
автокорреляции.
•
Инерция:
многие
экономические
показатели
(например,
инфляция, безработица, ВНП и т.п.) обладают определенной
цикличностью,
связанной
с
волнообразностью
деловой
активности.
•
Эффект паутины: во многих сферах экономики экономические
показатели реагируют на изменение экономических условий с
запаздыванием (временным лагом), в связи с чем неадекватно
предполагать случайность отклонений друг от друга.
7
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
• Сглаживание данных: зачастую данные по некоторому
продолжительному временному периоду получают усреднением
данных по составляющим его подынтервалам, что может
привести к определенному сглаживанию колебаний, которые
имелись внутри рассматриваемого периода.
Последствия автокорреляции:
•
Истинная автокорреляция не приводит к смещению оценок
коэффициентов регрессии. Оценки параметров, оставаясь
линейными и несмещенными, перестают быть эффективными.
Следовательно, они перестают обладать свойствами наилучших
линейных несмещенных оценок (BLUE-оценок).
•
Дисперсии оценок являются смещенными. Зачастую дисперсии,
вычисляемые
по
стандартным
формулам,
являются
заниженными, что приводит к увеличению t-статистик. Это
может привести к признанию статистически значимыми
объясняющие
переменные,
которые
в
действительности
таковыми могут и не являться.
•
Оценка дисперсии регрессии S2 является смещенной оценкой
истинного значения, во многих случаях заниженной, что
вызывает
занижение
оценок
стандартных
ошибок
коэффициентов.
•
В силу вышесказанного выводы по t- и F-статистикам,
определяющим
значимость
коэффициентов
регрессии
и
коэффициента детерминации, возможно, будут неверными.
Вследствие этого ухудшаются прогнозные качества модели.
Методы обнаружения автокорреляции:
•
Графический метод: 1) последовательно-временные графики,
увязывающие отклонения с моментами их получения, т.е. по оси
абсцисс обычно откладываются либо момент получения
статистических данных, либо порядковый номер наблюдения, а по
оси ординат отклонения (оценки отклонений); 2) наложение на
график реальных колебаний зависимой переменной графика
колебаний
переменной
по
уравнению
регрессии
и
сопоставление: если эти графики пересекаются редко, то можно
предположить наличие положительной автокорреляции остатков,
и др. варианты.
•
Метод рядов: последовательно определяются знаки отклонений,
причем ряд определяется как непрерывная последовательность
одинаковых знаков, количество знаков в ряду называется
длиной
ряда.
Визуальное
распределение
знаков
свидетельствует о характере связей между отклонениями. Если
рядов слишком мало по сравнению с количеством наблюдений, то
8
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
вполне вероятна положительная автокорреляция. Если же рядов
слишком много, то вероятна отрицательная автокорреляция. Для
более
детального
анализа
имеются
формализованные
процедуры.
•
Критерий Дарбина-Уотсона: суть состоит в вычислении
статистики Дарбина-Уотсона (в случае неприменимости –
статистики Дарбина) и на основе ее величины осуществлении
выводов об автокорреляции.
◊Статистика Дарбина-Уотсона предназначена для обнаружения
автокорреляции первого порядка, основана на изучении остатков
уравнения регрессии:
T
DW =
∑ (e
t=2
− et − 1 )
t
T
∑
2
≈ 2(1 − ret ,et − 1 ) ,
2
t
e
t=1
где T – число наблюдений (обычно временных периодов), et – остатки
уравнения регрессии, ret ,et − 1 – выборочный коэффициент автокорреляции
T
первого порядка:
ret ,et − 1 =
∑
t=1
T
∑
t=1
et et − 1
2
t
e
T
∑
t=1
.
2
t−1
e
Ограничения использования статистики Дарбина-Уотсона:
•
Критерий DW применяется лишь для тех моделей, которые
содержат свободный член.
•
Предполагается, что случайные отклонения определяются по
следующей
итерационной
схеме:
εt=ρ εt-1+ ut, называемой авторегрессионной схемой первого
порядка AR(1), где ut — случайный член.
•
Статистические
данные
должны
иметь
одинаковую
периодичность (т. е. не должно быть пропусков в наблюдениях).
•
Критерий Дарбина-Уотсона не применим для регрессионных
моделей, содержащих в составе объясняющих переменных
зависимую переменную с временным лагом в один период, т. е.
для так называемых авторегрессионных моделей вида:
y t = β 0 + β 1 x t1 + … + β m x tm + γ y t − 1 + ε t .
9
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
Общая схема использования статистики Дарбина-Уотсона:
•
По
построенному
эмпирическому
уравнению
регрессии
ˆt = b0 + b1 x t1 + … + bm x tm определяются значения отклонений
y
ˆt для каждого наблюдения t=1,2…T.
et = y t − y
•
Рассчитывается статистика DW:
T
DW =
∑ (e
t=2
t
− et − 1 )
T
∑
t=1
•
2
et2
По таблице критических точек Дарбина-Уотсона определяются
границы приемлемости (dl,du) и осуществляются выводы по
правилу:
dl < DW < du
вывод о наличии автокорреляции
не определен
du < DW < 4 — du
автокорреляция отсутствует
4 — du < DW < 4 — dl
вывод о наличии автокорреляции
не определен
4 — dl < DW < 4
существует
автокорреляция
отрицательная
Или применяется грубое правило: «автокорреляция остатков
отсутствует, если 1,5 < DW < 2,5».
◊Статистика Дарбина используется для обнаружения автокорреляции
в авторегрессионных моделях вида y t = β 0 + β 1 x t1 + … + β m x tm + γ y t − 1 + ε t :
h = ρˆ
n
n
≈
(
1
−
,
5
DW
)
1 − nSy2t − 1
1 − nSy2t − 1
,
2
где ρˆ — оценка автокорреляции первого порядка, Syt − 1 — выборочная
дисперсия коэффициента при лаговой переменной yt-1 , n -число
наблюдений. При большом объеме выборки n и ρ=0 статистика h имеет
стандартизированное нормальное распределение (h~N(0,1)).
Ограничения использования статистики Дарбина: только одна лаговая
переменная, только автокорреляция первого порядка, невозможность
2
вычисления при nS yt − 1 = 1 .
10
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
Общая схема использования статистики Дарбина:
•
По
построенному
эмпирическому
уравнению
регрессии
y t = β 0 + β 1 x t1 + … + β m x tm + γ y t − 1 + ε t определяются значения для
расчета h-статистики.
•
Рассчитывается h-статистика:
h = (1 − 0,5DW )
•
n
1 − nSy2t − 1
По
таблицам
критических
точек
стандартизированного
нормального распределения (функции Лапласа) по заданному
уровню значимости α определяется критическая точка uα/2 из
условия Ф(uα/2) = (1-α)/2 и сравнивается h с uα/2: если h < uα/2, то
делается вывод об отсутствии автокорреляции, в противном
случае – гипотеза об отсутствии автокорреляции должна быть
отклонена.
Устранение автокорреляции:
•
При установлении автокорреляции необходимо в первую
очередь проанализировать правильность спецификации модели.
Если после ряда возможных усовершенствований регрессии
(уточнения состава объясняющих переменных либо изменения
формы зависимости) автокорреляция по-прежнему имеет место,
то, возможно, это связано с внутренними свойствами ряда
отклонений.
•
В случае, если наличие автокорреляции связано с внутренними
свойствами
ряда
отклонений,
возможны
определенные
преобразования, устраняющие автокорреляцию. Среди них
выделяется авторегрессионная схема первого порядка AR(1),
которая, в принципе, может быть обобщена в AR(p), p = 2, 3, …
•
Для
применения
указанных
схем
необходимо
оценить
коэффициент корреляции между отклонениями. Это может быть
сделано различными методами: на основе статистики ДарбинаУотсона, Кохрана-Оркатта, Хилдрета-Лу и др.
•
В случае наличия среди объясняющих переменных лаговой
зависимой переменной наличие автокорреляции устанавливается
с помощью h-статистики Дарбина. А для ее устранения в этом
случае предпочтителен метод Хилдрета-Лу.
11
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
Авторегрессионная схема первого порядка AR(1):
•
Оценивается регрессия Y = b0 + b1 X + e и находятся остатки et ,
тогда наблюдениям t и (t-1) соответствуют формулам:
y t = b0 + b1 x t + et , y t − 1 = b0 + b1 x t − 1 + et − 1 .
•
По остаткам, подверженным воздействию авторегрессии первого
порядка
εt=ρ εt-1+ ut,
находится
оценка
коэффициента
автокорреляции первого порядка: напр., на основе статистики
Дарбина-Уотсона ρˆ ≈ ret , et − 1 = 1 − 0,5DW .
•
Оценка автокорреляции используется для пересчета данных для
*
*
*
уравнения регрессии: y t = b0 + b1 x t + v t ,
y t* = y t − ρˆy t − 1 ,
x t* = x t − ρˆx t − 1 ,
b0* = b0 (1 − ρˆ) ,
где
v t = et − ρˆet − 1 ; причем для первого наблюдения выборки обычно
используется
y1* =
•
поправка
Прайса-Винстена:
x1* =
1 − ρˆ2 ⋅ x1 ,
1 − ρˆ2 ⋅ y1 .
Цикл повторяется (процесс останавливается, как только
обеспечивается
достаточная
сходимость,
т.е.
результаты
перестают существенно улучшаться).
4.4.Проблема гетероскедастичности остатков
в моделях регрессии
Гетероскедастичность остатков в моделях регрессии как нарушение
важной предпосылки построения качественной регрессионной модели по
МНК (одного из условий Гаусса-Маркова): «Дисперсия случайных
отклонений εi
постоянна для всех наблюдений: D(εi)=D(εj)=σ2».
Выполнимость данной предпосылки называется гомоскедастичностъю
(постоянством
дисперсии
отклонений).
Невыполнимость
данной
предпосылки
называется
гетероскедастичностъю
(непостоянством
дисперсий отклонений).
◊Гетероскедастичность остатков определяется как различные
вероятностные распределения случайных отклонений при различных
наблюдениях, что основывается на априорной причине, вызывающей
большую ошибку (отклонение) при одних наблюдениях и меньшую — при
других.
Проблема гетероскедастичности в большей степени характерна для
перекрестных данных и довольно редко встречается при рассмотрении
временных рядов.
12
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
Виды гетероскедастичности:
•
истинная (вызывается непостоянством дисперсии случайного
члена, ее зависимостью от различных факторов),
•
ложная (вызывается ошибочной спецификацией модели).
Последствия гетероскедастичности:
•
Истинная гетероскедастичность не приводит к смещению оценок
коэффициентов регрессии. Оценки коэффициентов по-прежнему
остаются несмещенными и линейными.
•
Оценки не будут эффективными (т.е. они не будут иметь наименьшую
дисперсию по сравнению с другими оценками данного параметра).
Они не будут даже асимптотически эффективными. Увеличение
дисперсии оценок снижает вероятность получения максимально
точных оценок.
•
Дисперсии
оценок
будут
рассчитываться
со
смещением.
Смещенность появляется вследствие того, что необъясненная
уравнением регрессии дисперсия, которая используется при
вычислении оценок дисперсий всех коэффициентов, не является
более несмещенной. Как правило, гетероскедастичность увеличивает
дисперсию распределения оценок коэффициентов.
•
Гетероскедастичность
вызывает
тенденцию
к
недооценке
стандартных ошибок коэффициентов. Вполне вероятно, что
стандартные
ошибки
коэффициентов
будут
занижены,
а
следовательно, t-статистики будут завышены. Это может привести к
признанию статистически значимыми коэффициентов, таковыми на
самом деле не являющимися.
•
Вследствие вышесказанного все выводы, получаемые на основе
соответствующих t- и F-статистик, а также интервальные оценки
будут ненадежными. Следовательно, статистические выводы,
получаемые при стандартных проверках качества оценок, могут
быть ошибочными и приводить к неверным заключениям по
построенной модели.
Обнаружение гетероскедастичности. В ряде случаев на базе знаний
характера данных появление проблемы гетероскедастичности можно
предвидеть и попытаться устранить этот недостаток еще на этапе
спецификации. Однако значительно чаще эту проблему приходится решать
после построения уравнения регрессии. В последнем случае наиболее
популярные и наглядные методы: графический анализ отклонений, тест
ранговой корреляции Спирмена, тест Парка, тест Глейзера, тест
Голдфелда-Квандта.
Графический анализ остатков: в этом случае по оси абсцисс
откладывается объясняющая переменная X (либо линейная комбинация
13
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
объясняющих переменных Ŷ, в случае множественной регрессии), а по оси
ординат либо отклонения (остатки) et, либо их квадраты e2t; на основе
визуального анализа формируются суждения: напр., если наблюдаются
некоторые систематические изменения в соотношениях между значениями
переменной и квадратами отклонений, то можно с большой вероятностью
предполагать наличие гетероскедастичности остатков.
Тест ранговой корреляции Спирмена: при использовании данного
теста
предполагается,
что
дисперсия
отклонения
будет
либо
увеличиваться, либо уменьшаться с увеличением значения X; поэтому для
регрессии, построенной по МНК, абсолютные величины отклонений
(остатков) и значения переменной X будут коррелированны.
Схема теста ранговой корреляции Спирмена (проверка осуществляется
по каждой объясняющей переменной отдельно):
•
Выборка упорядочивается по фактору X, при этом определяются
ранги (порядковый номер) pXi, i=1,…,n.
•
Оценивается уравнение регрессии и вычисляются остатки ei, i=1,
…,n.
•
Выборка упорядочивается по величине остатков ei, при этом
определяются ранги (порядковый номер) pei, i=1,…,n.
•
Рассчитывается коэффициент ранговой корреляции Спирмена
между рангами фактора и остатков:
n
rx , e = 1 − 6
•
∑
d
i=1
2
n(n − 1)
= 1− 6
∑
i=1
( p Xi − pei )2
rx , e n − 2
1 − rx2, e
.
2
n(n − 1)
Рассчитывается
t-статистика,
имеющая
Стьюдента с числом степеней свободы (n-2):
t =
•
n
2
i
распределение
.
Формируется суждение по правилу: если наблюдаемое значение
t α / 2, n − 2
t-статистики
превышает
критическое
значение
(определяемое по таблице критических точек распределения
Стьюдента), то необходимо отклонить гипотезу о равенстве нулю
коэффициента корреляции, а следовательно, и об отсутствии
гетероскедастичности. В противном случае гипотеза об
отсутствии гетероскедастичности принимается.
Тест
Парка:
дополняет
графический
метод
некоторыми
формальными зависимостями; может приводить к необоснованным
14
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
выводам, поэтому дополняется другими тестами; включает следующие
этапы:
•
Строится уравнение регрессии y i = b0 + b1 x i + ei .
•
ˆi )2 .
Для каждого наблюдения определяются ln ei2 = ln(y i − y
•
ln ei2 = α + β ln x i + υ i ;
Строится
регрессия:
в
случае
множественной регрессии зависимость строится для каждой
объясняющей переменной.
•
Проверяется
статистическая
значимость коэффициента
β
β
уравнения на основе t-статистики t =
. Если коэффициент
Sβ
статистически
значим,
то
это
означает
гетероскедастичности в статистических данных.
наличие
Тест Глейзера: по своей сути аналогичен тесту Парка и дополняет
его анализом других (возможно, более подходящих) зависимостей между
k
дисперсиями отклонений И значениями переменной: ei = α + β x i + υ i , где
k=…,-1,-0.5,0.5,1,… Так же, как и в тесте Парка, в тесте Глейзера для
отклонений υ i может нарушаться условие гомоскедастичности. Однако во
многих случаях предложенные модели являются достаточно хорошими для
определения гетероскедастичности.
Тест Голдфелда-Квандта: предполагается, что СКО отклонения
пропорционально значению переменной X в i-наблюдении, отклонение
имеют нормальное распределение и отсутствует автокорреляция остатков в
i-наблюдении; состоит в следующем:
•
Все n наблюдений упорядочиваются по величине X.
•
Вся упорядоченная выборка после этого разбивается на три
подвыборки размерностей k, (n – 2k), k соответственно. Для
парной регрессии предлагаются следующие пропорции: n=30 и
k=11, n=60 и k=22; для множественной регрессии k>(m+1).
•
Оцениваются отдельные регрессии для первой подвыборки (k
первых наблюдений) и для третьей подвыборки (k последних
наблюдений). Если предположение о пропорциональности
дисперсий отклонений значениям X верно, то дисперсия
регрессии по первой подвыборке S1 =
k
∑
ei2 будет существенно
i=1
меньше
S3 =
•
дисперсии
n
∑
регрессии
по
третьей
подвыборке
ei2 .
i = n− k + 1
Для сравнения соответствующих дисперсий строится следующая
F-статистика:
15
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
S3
S
(k − m − 1)
F =
= 3,
S1
S1
(k − m − 1)
где (k-m-1) — число степеней свободы соответствующих выборочных дисперсий (m- количество объясняющих переменных в
уравнении
регрессии).
При
сделанных
предположениях
относительно случайных отклонений построенная F-статистика
имеет распределение Фишера с числами степеней свободы v1=
v2 = k-m-1.
•
S3
> Fα , k − m − 1, k − m − 1 , то
S1
гетероскедастичности отклоняется
значимости α.
Если
F =
гипотеза
при
об
отсутствии
выбранном
уровне
Для множественной регрессии данный тест обычно проводится для той
объясняющей переменной, которая в наибольшей степени связана с СКО
отклонения. Если нет уверенности относительно выбора переменной, то
данный тест может осуществляться для каждой из объясняющих
переменных. Этот же тест может быть использован при предположении об
обратной пропорциональности между СКО отклонения и значениями
объясняющей переменной; при этом статистика Фишера примет вид: F =
S1/S3.
Устранение проблемы гетероскедастичности. В случае установления
наличия гетероскедастичности ее корректировка представляет довольно
серьезную проблему. Одним из возможных решений является метод
взвешенных наименьших квадратов (при этом необходима определенная
информация либо обоснованные предположения о величинах дисперсий
отклонений). На практике имеет смысл попробовать несколько методов
определения
гетероскедастичности и способов ее корректировки
(преобразований, стабилизирующих дисперсию). Во многих случаях
дисперсии отклонений зависят не от включенных в уравнение регрессии
объясняющих переменных, а от тех, которые не включены в модель, но
играют существенную роль в исследуемой зависимости, в этом случае они
должны быть включены в модель. В ряде случаев для устранения
гетероскедастичности необходимо изменить
спецификацию
модели
(например,
линейную
на
лог-линейную,
мультипликативную
на
аддитивную и т. п.).
Метод взвешенных наименьших квадратов (ВНК): применяется при
2
известных для каждого наблюдения значениях дисперсии отклонения σ i ;
в этом случае можно устранить гетероскедастичность, разделив каждое
наблюдаемое значение на соответствующее ему значение дисперсии.
16
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
Схема метода взвешенных наименьших квадратов:
•
•
•
Каждую из пар наблюдений (хi, yi) делят на известную величину
СКО отклонения σ i в i-наблюдении. Тем самым наблюдениям с
наименьшими дисперсиями придаются наибольшие «веса», а с
максимальными
дисперсиями –
наименьшие
«веса»;
так,
наблюдения с меньшими дисперсиями отклонений будут более
значимыми
при
оценке
коэффициентов
регрессии,
чем
наблюдения с большими дисперсиями, что увеличивает
вероятность получения более точных оценок.
 1 xi yi 
 строится
,
,
По МНК для преобразованных значений 
σ
σ
σ
i
i 
 i
уравнение регрессии без свободного члена с гарантированными
y i* = y i
y i* = β 0 z i + β 1 x i* + υ i , где
качествами оценок:
σi,
z = 1 , υi = εi
x i* = x i
σi
σi , i
σi.
После определения по МНК оценок коэффициентов β0 и β1 для
преобразованного
уравнения
возвращаются
к
исходному
уравнению регрессии y i = β 0 + β 1 x i + ε i .
Для применения ВНК необходимо знать фактические значения дисперсий
отклонений. На практике такие значения известны крайне редко.
Следовательно, чтобы применить ВНК, необходимо сделать реалистические
2
предположения о значениях σ i :
•
дисперсии
отклонений
пропорциональны
значениям
2
2
2
объясняющей переменной: σ i = σ x i , где σ — коэффициент
пропорциональности, тогда уравнение преобразуется по схеме
 1
x
y 

, i , i  . Если в уравнении регрессии присутствует
 x
xi
x i 
i

несколько
объясняющих
переменных,
можно
поступить
 1
x
y 
, i , i  , где ŷ — исходное
следующим образом: 
 y
ˆi
ˆi 
y
y
 ˆi
уравнение
множественной
регрессии
как
комбинация
объясняющих переменных.
•
дисперсии отклонений пропорциональны квадрату значений
σ i2 = σ 2 x i2 ,
объясняющей
переменной:
тогда
уравнение
 1 xi y i
,
,
преобразуется по схеме 
 xi xi xi
17

 .

Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
4.5.Обобщенный метод наименьших квадратов
Невозможность или нецелесообразность использования традиционного
МНК по причине проявляющихся в той или иной степени проблем
автокорреляции или гетероскедастичности обуславливает использование
обобщенного метода наименьших квадратов (ОМНК), при котором
корректируется модель, изменяются ее спецификации, преобразуются
исходные данные для обеспечения несмещенности, эффективности и
состоятельности оценок коэффициентов регрессии.
Обобщенный МНК в чистом виде практически не применяется:
•
Подход к реализации ОМНК в виде авторегрессионных
преобразований является целесообразным при наличии проблем
автокорреляции остатков.
•
Подход к реализации ОМНК в виде взвешенного МНК является
достаточно
практичным
при
наличии
проблем
гетероскедастичности;
иногда
его
называют
доступный
обобщенный МНК.
Суть обобщенного МНК: Пусть ковариационная матрица ошибок имеет
T
следующий вид: E (ε ε ) = λ W , где W-известная матрица (симметричная и
положительно определенная), представленная в виде W = АT А , матрица А
– квадратная невырожденная матрица (напр., разложение Холецкого).
Коэффициенты β в этом случае можно оценить по формуле:
βˆ = ( X T W − 1 X )− 1 X TW − 1Y . Обобщенный МНК эквивалентен следующей
~
~
~
~
вспомогательной регрессии: Y = Xβ + ~
ε , где Y = ( A − 1 )T Y , X = ( A − 1 )T X ,
~
ε = ( A − 1 )T ε . Геометрически задача состоит в том, чтобы найти такой
~
~ , чтобы расстояние было минимальным: Y − Y
→ min .
вектор Y
При этом следует учитывать, что коэффициент детерминации не может
служить удовлетворительной мерой качества подгонки при использовании
ОМНК. На практике достаточную общность имеет критерий стандартных
отклонений (стандартных ошибок) регрессии.
4.6.Фиктивные переменные в регрессионных моделях
◊Фиктивная переменная формализует в регрессионных моделях
влияние качественного фактора, отражая два противоположных состояния
фактора: «фактор действует» — «фактор не действует». Как правило,
фиктивная переменная выражается в двоичной форме:
 0, фактор не действует
D = 
.
 1, фактор действует
Регрессионные модели, содержащие лишь качественные объясняющие
переменные, называются ANOVA-моделями (моделями дисперсионного
18
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
анализа): Y = β 0 + γ D + ε , где γ
указывает величину, на которую
отличаются средние значения зависимой переменной Y при отсутствии или
наличии
фактора,
выраженного
переменной
D:
M(Y | D = 0) = β 0 , M(Y | D = 1) = β 0 + γ .
Модели, в которых объясняющие переменные носят как количественный,
так и качественный характер, называются ANCOVA-моделями (моделями
ковариационного анализа):
•
Правило
формализации
качественного
фактора:
«Если
качественная переменная имеет k альтернативных значений, то
при моделировании используются только (k-1) фиктивных
переменных»; если не следовать данному правилу, то при
моделировании исследователь попадает в ситуацию совершенной
мультиколлинеарности или так называемую ловушку фиктивной
переменной.
•
Значение фиктивной переменной, для которого принимается D=0,
называется базовым или сравнительным. Выбор базового значения
обычно диктуется целями исследования, но может быть и произвольным.
•
При наличии у фиктивной переменной двух альтернатив:
Y = β 0 + β 1X + γ D + ε ,
M(Y | x , D = 0) = β 0 + β 1 x ,
M(Y | x, D = 1) = (β 0 + γ ) + β 1 x ; где коэффициент γ называется
дифференциальным коэффициентом свободного члена, т. к. он
показывает, на какую величину отличается свободный член модели
при значении фиктивной переменной, равном единице, от
свободного члена модели при базовом значении фиктивной
переменной.
•
При наличии у фиктивной переменной более двух альтернатив:
Y = β 0 + β 1 X + γ 1D1 + γ 2 D2 + ε , M(Y | x, D1 = 0, D2 = 0) = β 0 + β 1 x ,
M(Y | x , D1 = 1, D2 = 0) = (β 0 + γ 1 ) + β 1 x ,
M(Y | x , D1 = 1, D2 = 1) = (β 0 + γ 1 + γ 2 ) + β 1 x ,
где
коэффициент
γ 1 , γ 2 — дифференциальные коэффициенты свободного члена.
•
Модель регрессии с одной количественной и двумя качественными
Y = β 0 + β 1 X + γ 1D1 + γ 2 D2 + ε ,
переменными:
M(Y | x, D1 = 0, D2 = 0) = β 0 + β 1 x ,
M(Y | x, D1 = 0, D2 = 1) = (β 0 + γ 2 ) + β 1 x ,
M(Y | x , D1 = 1, D2 = 0) = (β 0 + γ 1 ) + β 1 x ,
M(Y | x , D1 = 1, D2 = 1) = (β 0 + γ 1 + γ 2 ) + β 1 x ,
где
коэффициент
γ 1 , γ 2 — дифференциальные коэффициенты свободного члена.
19
Конспект лекций по дисциплине «Эконометрика» для студентов специальности
«Бухгалтерский учет, анализ и аудит»
Составитель: Коновалова А.С.
Раздел 4. Спецификация переменных в уравнениях регрессии
________________________________________________________________________________
• Модель регрессии, где изменение качественного фактора может
привести как к изменению свободного члена уравнения, так и
Y = β 0 + β 1 X + γ 1D1 + γ 2 D1 X + ε ,
наклона
прямой
регрессии:
M(Y | x, D1 = 0) = β 0 + β 1 x , M(Y | x, D1 = 1) = (β 0 + γ 1 ) + (β 1 + γ 2 )x
, где γ 1 — дифференциальный коэффициент свободного члена, γ 2 дифференциальный угловой коэффициентом соответственно.
Представленные выше схемы могут быть распространены на ситуации с
произвольным числом количественных и качественных факторов.
Модели, в которых фиктивная зависимая переменная:
•
Y = β 0 + β 1X + ε ,
Линейные
вероятностные
модели
(LPM):
M(Y | x ) = P (Y = 1 | x ) = β 0 + β 1 x , применимость МНК к которым
имеет определенные ограничения: случайные отклонения в данных
моделях не являются нормальными случайными величинами, а
скорее всего, имеют биноминальное распределение; случайные
отклонения не обладают свойством постоянства дисперсии
(гомоскедастичности); нарушается неравенство 0 ≤ P(Y =1| х) ≤ 1;
применение модели проблематично с содержательной точки зрения;
так непосредственное использование МНК в модели LPM приводит к
серьезным
погрешностям
и
необоснованным
выводам.
Использование
обыкновенного
МНК
в
данном
случае
нецелесообразно.
•
Logit модель для преодоления недостатков модели LPM: такие
модели, в которых не нарушается неравенство 0 ≤ P(Y=1|х) ≤ 1, и
зависимость между P(Y=1|х) и х не имеет линейный характер
pi
= z i = β 0 + β 1 x i , где
(закон убывающей эффективности): ln
1 − pi
условная
pi = M(Y = 1 | x i ) =
вероятность
1
.
1+ e
Использование
обыкновенного
МНК
в
данном
случае
нецелесообразно в силу проблемы гетероскедастичности. Поэтому
при расчетах коэффициентов обычно используется взвешенный
МНК, устраняющий указанный недостаток.
20
− ( β 0 + β 1xi )

Источник

Во многих практических случаях моделирование экономических зависимостей линейными уравнениями дает вполне удовлетворительный результат и может использоваться для целей анализа и прогнозирования. Однако в силу многообразия и сложности экономических процессов ограничиваться лишь рассмотрением линейных регрессионных моделей невозможно. Многие экономические зависимости не являются линейными по своей сути, и поэтому их моделирование линейными уравнениями регрессии, безусловно, не даст положительного результата. Например, при рассмотрении спроса Y на некоторый товар от цены Х данного товара в ряде случаев можно ограничиться линейным уравнением регрессии: Y = в0 + в1X . Здесь β1 характеризует

абсолютное изменение Y (в среднем) при единичном изменении Х. Если же мы хотим проанализировать эластичность спроса по цене, то приведенное уравнение не позволит это осуществить. В этом случае целесообразно рассмотреть так называемую логарифмическую модель (см. параграф 7.1). При анализе издержек Y от объема выпуска Х наиболее обоснованной является полиномиальная (точнее, кубическая) модель (см. параграф 7.4). При рассмотрении производственных функций линейная модель является нереалистичной. В этом случае обычно используются степенные модели. Например, широкую извест-

ность имеет производственная функция Кобба−Дугласа Y = A Kб Lв (здесь Y – объем выпуска; K и L – затраты капитала и труда соответственно; A, α и β – параметры модели). Достаточно широко применяются в современном эконометрическом анализе и многие другие мо-

дели, в частности обратная и экспоненциальная модели. Построение и анализ нелинейных моделей имеют свою специфику и отличие.

Приведенные выше рассуждения и примеры дают основания более детально рассмотреть возможные нелинейные модели. В рамках вводного курса мы ограничимся рассмотрением нелинейных моделей, допускающих их сведение к линейным. Обычно это так называемые

линейные относительно параметров модели. Для простоты изложе-

ния и графической иллюстрации будем рассматривать модели парной регрессии с последующим естественным переходом к моделям множественной регрессии.

7.1. Логарифмические (лог-линейные) модели

180

Пусть некоторая экономическая зависимость моделируется формулой

где А и β – параметры модели (т. е. константы, подлежащие определению).

Эта функция может отражать зависимость спроса Y на благо от его цены X (в данном случае β < 0) или от дохода Х (в данном случае β > 0; при такой интерпретации переменных Х и Y функция (7.1) называется функцией Энгеля). Функция (7.1) может отражать также зависимость объема выпуска Y от использования ресурса Х (производственная функция), в которой 0 < β < 1, а также ряд других зависимостей. Для упрощения выкладок случайное отклонение ε введем в соотношение позднее. Модель (7.1) не является линейной функцией относительно Х (производная зависимой переменной Y по Х, указывающая на изменение Y по отношению к изменению Х будет зависеть

от Х: dYdX = A в Xв−1 , т. е. не будет константой, что присуще только

нелинейным моделям). Стандартным и широко используемым подходом к анализу функций данного рода в эконометрике является логарифмирование по экспоненте (по основанию e = 2.71828…). Такие логарифмы называются натуральными логарифмами и обозначаются lnY, lnX.

Прологарифмировав обе части (7.1), имеем:

lnY = lnA + вlnX .	(7.2)
После замены lnA = β0, (7.2) примет вид:
lnY = в0 + вlnX .	(7.3)

С целью статистической оценки коэффициентов добавим в модель случайную погрешность ε и получим так называемую двойную логарифмическую модель (и зависимая переменная и объясняющая переменная заданы в логарифмическом виде):

lnY = в0 + вlnX + е.

(7.4)

Не являясь линейным относительно X и Y, данное уравнение является линейным относительно lnX и lnY, а также относительно пара-

метров β0 и β1. Вводя замены Y* = lnY и X* = lnX , (7.4) можно переписать в виде:

181

Y* = в0 + вX* + е .

(7.5)

Модель (7.5) является линейной моделью, подробно рассмотренной в гл. 4, 5. Если все необходимые предпосылки классической линейной регрессионной модели для (7.5) выполнены, то по МНК можно определить наилучшие линейные несмещенные оценки коэффициен-

тов β0 и β.

Отметим, что коэффициент β определяет эластичность переменной Y по переменной Х, т. е. процентное изменение Y для данного процентного изменения Х. Действительно, продифференцировав левую и правую части (7.4) по Х, получим:

1	dY	= в	1	в = dY	X	= ЕX (Y).	(7.6)
Y	x	Y
dX		dX

Отметим, что в данном случае коэффициент β является константой, указывая на постоянную эластичность. Поэтому зачастую двойная логарифмическая модель называется моделью постоянной эластичности. Суть полученных выводов наглядно представлена на рис. 7.1.

Y	ln Y
Y = A Xβ	β	LnY = α + β

Заметим, что в случае парной регрессии обоснованность использования логарифмической модели проверить достаточно просто. Вместо наблюдений (xi, yi) рассматриваются наблюдения (lnxi, lnyi), i = 1, 2, …, n. Вновь полученные точки наносятся на корреляционное поле. Если их расположение соответствует прямой линии, то произведенная замена удачна и использование логарифмической модели обосновано.

Данная модель легко обобщается на большее число переменных. Например,

182

lnY = в0 + в1lnX1 + в2lnX2 + е .

(7.7)

Здесь коэффициенты β1, β2 являются эластичностями переменной Y по переменным Х1 и Х2 соответственно. Зачастую данная модель используется при анализе производительных функций. Например, хорошо известна производственная функция Кобба–Дугласа

Y = A Kб Lв .	(7.8)
После логарифмирования обеих частей (7.8) имеем:
lnY = lnA + бlnK + вlnL .	(7.9)

Здесь α и β – эластичности выпуска по затратам капитала и труда соответственно. Сумма этих коэффициентов является таким важным экономическим показателем, как отдача от масштаба. При б + в =1

мы имеем постоянную отдачу от масштаба (во сколько раз увеличиваются затраты ресурсов, во столько же раз увеличивается выпуск).

При б + в <1 мы имеем убывающую отдачу от масштаба (увеличе-

ние объема выпуска меньше увеличения затрат ресурсов). При б + в > 1 мы имеем возрастающую отдачу от масштаба (увеличе-

ние объема выпуска больше увеличения затрат ресурсов).

7.2. Полулогарифмические модели
Модели вида
lnY = в0 + вX + е ,	(7.10)
Y = в0 + вlnX + е	(7.11)

называются полулогарифмическими моделями.

Такие модели обычно используют в тех случаях, когда необходимо определять темп роста или прироста каких-либо экономических показателей. Например, при анализе банковского вклада по первоначальному вкладу и процентной ставке, прироста объема выпуска от относительного (процентного) увеличения затрат ресурса, бюджетный дефицит от темпа роста ВНП, темп роста инфляции от объема денежной массы и т. д.

7.2.1. Лог-линейная модель

183

Рассмотрим зависимость, хорошо известную в банковском и финансовом анализе

Y = Y (1 + r)t ,	(7.12)
t 0

где Y0 – начальная величина переменной Y (например, первоначальный вклад в банке); r – сложный темп прироста величины Y (процентная ставка); Yt – значение величины Y в момент времени t (вклад в банке в момент времени t). Модель (7.12) легко сводится к полулогарифмической модели (7.10). Действительно, прологарифмировав

(7.12), имеем:

lnYt = lnY0 + t ln(1+ r) .

(7.13)

Введем обозначения: lnY0 = в0 , ln(1+ r) = в . Тогда (7.13) примет вид:

lnYt = в0 + вt + еt .

(7.14)

В (7.14) мы использовали дополнительно случайное слагаемое εt

всилу возможной изменчивости процентной ставки. Полулогарифмическая модель (7.10) легко сводится к линейной

модели заменой Y* = lnY .

Коэффициент β в модели (7.10) имеет смысл темпа прироста переменной Y по переменной Х, т. е. характеризует отношение относительного изменения Y к абсолютному изменению Х. Действительно, продифференцировав (7.10) по Х, имеем:

1	dY			dY		относительное изменение Y .
= в	в =	Y		=
Y dX			dX		абсолютное изменение X

Умножив полученное β на 100, мы получим процентное изменение переменной Y (темп прироста переменной Y). Поэтому полулогарифмическая модель (7.10) обычно используется для измерения темпа прироста экономических показателей. Заметим, что из соотношения в = ln(1+ r) определяется темп прироста r показателя Y:

1+ r = eв r = eв −1.

(7.15)

Отметим, что коэффициент β в (7.14) определяет мгновенный темп прироста, а r в (7.15) определяет обобщенный (сложный) темп прироста. Поэтому в общем случае они отличаются друг от друга.

7.2.2. Линейно-логарифмическая модель

184

Рассмотрим так называемую линейно-логарифмическую модель

Y = в0 + вlnX + е .

(7.16)

Она сводится к линейной модели заменой X* = lnX . В данной модели коэффициент β определяет изменение переменной Y вследствие единичного относительного прироста Х (например, на 1%), т. е. характеризует отношение абсолютного изменения Y к относительному изменению Х. Действительно, продифференцировав (7.16), имеем:

dY	= в	1	в = dY	=	абсолютный прирост Y
dX		X		dX		относительный прирост X
				X

dY = в dXX ДY ≈ в ДXX .

Умножив последнее соотношение на 100, получим абсолютный

прирост Y при процентном изменении Х. Таким образом, если ДX

изменилось на 1% (0.01), то Y изменилось на 0.01 в .

Модель (7.11) используется обычно в тех случаях, когда необходимо исследовать влияние процентного изменения независимой переменной на абсолютное изменение зависимой переменной.

Например, если положить Y = GNP (валовой национальный продукт), а X = M (денежная масса), то получим следующую формулу:

GNP = б + в lnM + е ,

из которой следует, что если увеличить предложение денег M на 1%, то ВНП в среднем вырастет на 0.01 в .

7.3. Обратная модель
Модель вида	1
Y = в0 + в1	+ е	(7.17)
X

называется обратной моделью. Эта модель сводится к линейной заменой X * = X1 . Данная модель обычно применяется в тех случаях, когда

неограниченное увеличение объясняющей переменной Х асимптотически приближает зависимую переменную Y к некоторому пределу (в

185

данном случае к β0). В зависимости от знаков β0 и β1 характерны следующие ситуации:

Y	β0>0	Y	β0>0		Y	β0<0
	β1>0	β0	β1<0			β1>0

					0
					0	X
β0

0		X 0		X	β0
	−β1/β0


	а		б			в

Рис. 7.2

График 7.2, а может отражать зависимость между объемом выпуска (Х) и средними фиксированными издержками (Y). График 7.2, б может отражать зависимость между доходом Х и спросом на блага Y (например, на товары первой необходимости, либо товары относительной роскоши) – так называемые функции Торнквиста (в этом слу-

чае X =	−	в1	– минимально необходимый уровень дохода). Важным
в0

приложением графика, изображенного на рис. 7.2, в является кривая Филлипса, отражающая зависимость между уровнем безработицы (Х) в процентах и процентным изменением заработной платы (Y). При этом точка пересечения кривой с осью 0X определяет естественный уровень безработицы.

7.4. Степенная модель

Степенная функция вида

Y = в0 + в1X + в2X2 + L+ вmXm + е

(7.18)

зачастую отражает ту или иную экономическую зависимость. Например, кубическая функция

Y = в0 + в1X + в2X2 + в3X3 + е

(7.19)

в микроэкономике моделирует зависимость общих издержек (Y) от объема выпуска (Х) (рис. 7.3, а).

Аналогично квадратичная функция

Y = в0 + в1X + в2X2 + е	(7.20)
186

может отражать зависимость между объемом выпуска (Х) и средними либо предельными издержками (Y) (рис. 7.3, б); или между расходами на рекламу и прибылью (рис. 7.3, в) и т. д.

0	Q 0	Q 0	C
а	б		в
	Рис. 7.3

Как и ранее рассмотренные модели, модель (7.18) является линейной относительно коэффициентов регрессии β0, β1, …, βm. Следовательно, ее можно свести к линейной регрессионной модели. Заменяя

X на X1, X2 на Х2, …, Xm на Хm, получаем вместо (7.18) модель множественной линейной регрессии с m переменными X1,X2 ,K,Xm :

Y = в0 + в1X1 + в2X2 + L+ вmXm + е.

(7.21)

7.5. Показательная модель

Показательная функция

также достаточно широко применяется в эконометрическом анализе. Здесь е = 2.7182818… . Наиболее важным ее приложением является ситуация, когда анализируется изменение переменной Y с постоянным темпом прироста во времени. В этом случае переменная Х символически заменяется переменной t:

Данная функция путем логарифмирования (ln eβt = βt) сводится к логлинейной модели (7.14):

lnY = lnβ0 + βt .	(7.24)
187

Заметим, что в общем виде показательная функция имеет вид:

где а − произвольная положительная константа (а ≠1). Но данная функция сводится к (7.22) вследствие тождества аβX = еβХlna.

Ряд экономических показателей моделируется через функции, являющиеся композицией перечисленных функций, что позволяет также свести их к линейным. Например, широко известна производственная функция Кобба –Дугласа с учетом научно-технического прогресса:

Y = A Kб Lв eгt .	(7.26)
Прологарифмировав данную функцию, получим соотношение:
LnY = lnA + αlnK + βlnL + γt,	(7.27)

которое сводится к линейному заменами a = lnA, k = lnK, l = lnL, y = LnY.

7.6. Преобразование случайного отклонения

Как отмечалось ранее, существенную роль для получения качественных оценок имеет выполнимость определенных предпосылок МНК для случайных отклонений. Наиболее важные из них требуют, чтобы отклонения εi являлись нормально распределенными случайными величинами с нулевым математическим ожиданием и постоянной дисперсией σ2, а также не коррелировали друг с другом (εi N(0, σ2), сov( εi, εj) = 0 при i ≠ j). При невыполнимости указанных предпосылок оценки, полученные по МНК, не будут обладать свойствами BLUEоценок, и проводимые для них тесты окажутся ненадежными.

В случаях, не требующих совокупного логарифмирования, с аддитивным случайным членом выполнимость предпосылок МНК имеет место, а следовательно, проблем с оцениванием не возникает.

Для описания возможных проблем со случайным отклонением воспользуемся моделью (7.1) Y = A Xв , дополнив ее случайным членом. При этом случайный член ε может входить в соотношение в различных видах. Рассмотрим три возможных случая:

Y = A Xв eе ,	(7.28)
Y = A Xв е ,	(7.29)
Y = A Xв + е .	(7.30)
188

Данные модели являются нелинейными относительно параметров (точнее, параметра β). Прологарифмировав каждое из этих соотношений, соответственно получим:

lnY = a + β lnX + ε,	(7.31)
lnY = a + β lnX + lnε,	(7.32)
lnY = ln(A Xβ + ε).	(7.33)

Здесь a = lnA.

Использование (7.31) для оценки параметров в (7.28) не вызывает осложнений, связанных со случайным отклонением.

Преобразование (7.29) в (7.32) приводит к преобразованию случайных отклонений εi в lnεi. Использование МНК в (7.32) для нахождения BLUE-оценок параметров требует, чтобы отклонения νi = lnεi удовлетворяли предпосылкам МНК: νi N(0, σ2). Но это возможно только в случае логарифмически нормального распределения СВ εi с

М(εi) = eу22 и D(εi) = eу2 (eу2 −1).

Логарифмирование соотношения (7.30) не привело к линеаризации соотношения относительно параметров. В этом случае для нахождения оценок необходимо использовать определенные итерационные процедуры оценки нелинейных регрессий.

Таким образом, при использовании преобразований с целью нахождения оценок необходимо особое внимание уделять рассмотрению свойств случайных отклонений, чтобы полученные в результате оценки имели высокую статистическую значимость.

7.7. Выбор формы модели

Многообразие и сложность экономических процессов предопределяет многообразие моделей, используемых для эконометрического анализа. С другой стороны, это существенно усложняет процесс нахождения максимально адекватной формулы зависимости. Для случая парной регрессии подбор модели обычно осуществляется по виду расположения наблюдаемых точек на корреляционном поле. Однако нередки ситуации, когда расположение точек приблизительно соответствует нескольким функциям и необходимо из них выявить наилучшую. Например, криволинейные зависимости могут аппроксимироваться полиномиальной, показательной, степенной, логарифмической функциями. Еще более неоднозначна ситуация для множествен-

189

ной регрессии, так как наглядное представление статистических данных в этом случае невозможно.

В данной главе перечислены базовые модели, используемые в эконометрическом моделировании, а также практические задачи, вызывающие необходимость их использования. Правильный выбор вида модели является отправной точкой для качественного анализа экономической модели. Безусловно, на практике неизвестно, какая модель является верной, и зачастую подбирают такую модель, которая наиболее точно соответствует реальным данным. При этом необходимо учитывать, что идеальной модели не существует. Поэтому, чтобы выбрать качественную модель, необходимо ответить на ряд вопросов, возникающих при ее анализе.

1.Каковы признаки “хорошей” (качественной) модели?

2.Какие ошибки спецификации встречаются, и каковы последствия данных ошибок?

3.Как обнаружить ошибку спецификации?

4.Каким образом можно исправить ошибку спецификации и перейти

клучшей (качественной) модели?

7.7.1.Признаки “хорошей” модели

Вряде случаев достаточно очевидно, какая модель лучше. В других случаях для принятия обоснованного решения приходится проводить достаточно кропотливый сравнительный анализ. Для этого необходимо выбрать критерии, которые позволят сделать обоснованный вывод. Обычно для построения «хорошей» работоспособной модели и сравнения ее с другими возможными моделями необходимо учитывать следующие свойства (критерии).

Скупость (простота). Модель должна быть максимально простой. Данное свойство определяется тем фактом, что модель не отражает действительность идеально, а является ее упрощением. Поэтому из двух моделей, приблизительно одинаково отражающих реальность, предпочтение отдается модели, содержащей меньшее число объясняющих переменных.

Единственность. Для любого набора статистических данных определяемые коэффициенты должны вычисляться однозначно.

Максимальное соответствие. Уравнение тем лучше, чем боль-

шую часть разброса зависимой переменной оно может объяснить. По-

190

этому стремятся построить уравнение с максимально возможным скорректированным коэффициентом детерминации R 2 .

Согласованность с теорией. Никакое уравнение не может быть признано качественным, если оно не соответствует известным теоретическим предпосылкам. Например, если в функции спроса коэффициент при цене положителен, то даже значительная величина коэффициента детерминации R2 (например, 0,7) не позволит признать уравнение удовлетворительным. Другими словами, модель обязательно должна опираться на теоретический фундамент, т. к. в противном случае результат использования регрессионного уравнения может быть весьма плачевным.

Прогнозные качества. Модель может быть признана качественной, если полученные на ее основе прогнозы подтверждаются реальностью.

Другим критерием прогнозных качеств оцененной модели регрессии может служить следующее отношение:

		V =	S	,	(7.34)
			y
где S =	∑ei2	– стандартная ошибка регрессии,	y – среднее зна-
	n − m −1

чение зависимой переменной уравнения регрессии. Если величина V мала (а она определяет относительную ошибку прогноза в процентах) и отсутствует автокорреляция остатков (определяемая по величине статистики DW Дарбина–Уотсона), то прогнозные качества модели высоки.

Если уравнение регрессии используется для прогнозирования, то величина V обычно рассчитывается не для того периода, на котором оценивалось уравнение, а для некоторого следующего за ним временного интервала, для которого известны значения зависимой и объясняющих переменных. Тем самым на практике проверяются прогнозные качества модели. В случае положительного решения, если можно спрогнозировать значения объясняющих переменных на некоторый последующий период, построенная модель обоснованно может быть использована для прогноза значений объясняемой переменной Y. При этом следует помнить, что период прогнозирования должен быть, по крайней мере, в 3 раза короче периода, по которому оценивалось уравнение регрессии.

191

Поскольку не существует какого-либо единого правила построения регрессионных моделей, анализ перечисленных свойств позволяет строить более качественные эконометрические модели.

7.7.2. Виды ошибок спецификации

Одним из базовых предположений построения качественной модели является правильная (хорошая) спецификация уравнения регрессии. Правильная спецификация уравнения регрессии означает, что оно в целом правильно отражает соотношение между экономическими показателями, участвующими в модели. Это является необходимой предпосылкой дальнейшего качественного оценивания.

Неправильный выбор функциональной формы или набора объясняющих переменных называется ошибками спецификации. Рассмотрим основные типы ошибок спецификации.

1. Отбрасывание значимой переменной

Суть данной ошибки и ее последствия наглядно иллюстрируются следующим примером. Пусть теоретическая модель, отражающая рассматриваемую экономическую зависимость, имеет вид:

Y = в0 + в1X1 + в2X2 + е.

(7.35)

Данной модели соответствует следующее эмпирическое уравнение регрессии:

Y = b0 + b1X1 + b2X2 + e.

(7.36)

Исследователь по каким-то причинам (недостаток информации, поверхностное знание о предмете исследования и т. п.) считает, что на переменную Y реально воздействует лишь переменная Х1. Он ограничивается рассмотрением модели (7.37):

При этом он не рассматривает в качестве объясняющей переменную Х2, совершая ошибку отбрасывания существенной переменной.

Пусть эмпирическое уравнение регрессии, соответствующее теоретическому уравнению (7.37), имеет вид:

Y = g0 + g1X1 + v .

(7.38)

192

большом числе испытаний. Следовательно, возможные интервальные оценки и результаты проверки соответствующих гипотез будут ненадежными.

Покажем, что коэффициент g1 является смещенной оценкой параметра β1. Действительно, g1 вычисляется по формуле (4.14):

Sxy

cov(X ,Y)

cov(X ,в

+ в

+ е)

g1 =

≈

D(X

)

D(X )

= D(X1 1) [cov(X1, в0 ) + cov(X1, в1X1) + cov(X1, в2X2 ) + cov(X1, е)] = = D(X1 1) [0 + в1D(X1) + в2cov(X1, X2 ) + cov(X1, е)] =

= в1	+ в2	cov(X1, X2 )	+	cov(X1, е)	.	(7.39)
D(X1 )
			D(X1)

Исходя из предпосылки 40 МНК (см. параграф 5.1), cov(X1, ε) = 0. Тогда очевидна справедливость следующего соотношения:

			cov(X1, X2 )			cov(X1	, X2 )

M(g1) = M	в1	+ в2		= в1	+ в2			. (7.40)
D(X1)	D(X1)

Здесь учитывается тот факт, что выражение, стоящее в скобках, является константой. Это означает, что оценка g1 обладает смещением относительно истинного значения параметра, выражаемым величиной

в2 cov(X1, X2 ) . Этот вывод позволяет определить направление сме- D(X1)

щения. Очевидно, оно связано со знаками величин β2 и cov(X1, X2). Например, при положительном β2 и положительной коррелированности между X1 и X2 оценка g1 будет завышать истинное значение β1.

Кроме того, соотношение (7.40) позволяет объяснить причину завышения оценки при указанных условиях. В уравнении (7.36) коэффициенты b1 и b2 отражают степень индивидуального воздействия на Y каждой из объясняющих переменных Х1 и Х2. В уравнении (7.38) через коэффициент g1 отражается, кроме прямого воздействия переменной Х1, воздействие коррелированной с ней (в нашем случае положительно) и не учтенной переменной Х2. Таким образом, косвенная

193

роль переменной Х2 в уравнении (7.38) отражается на оценке парамет-

ра β1, изменяя ее в среднем на величину в2 cov(X1, X2 ) . D(X1)

Единственно возможным условием получения несмещенной оценки для коэффициента β1 является некоррелированность X1 и X2 (cov(X1, X2) = 0). Но при этом не произойдет и ошибки отбрасывания значимой переменной в силу реальной незначимости переменной Х2 (почему?).

Отметим, что ошибка данного рода существенно отражается и на коэффициенте детерминации R2. В нашей ситуации при использовании уравнения (7.38) значение коэффициента детерминации будет завышать роль переменной Х1 в объяснении дисперсии переменной Y. Это связано с косвенным “присутствием” в уравнении через коэффициент g1 переменной Х2, что повышает объясняющую способность уравнения в целом.

Другие соотношения между знаками коэффициента регрессии, направлениями коррелированности объясняющих переменных и направлением смещения оценки рекомендуется рассмотреть в качестве упражнения.

2. Добавление незначимой переменной

В некоторых случаях в уравнения регрессии включают слишком много объясняющих переменных, причем не всегда обоснованно. Например, пусть теоретическая модель имеет следующий вид:

Y = в0 + в1X1 + е.	(7.41)
Пусть исследователь подменяет ее более сложной моделью:
Y = г0 + г1X1 + г2X2 + е,	(7.42)

добавляя при этом не оказывающую реального воздействия на Y объясняющую переменную Х2. В этом случае совершается ошибка добавления несущественной переменной.

Последствия данной ошибки будут не столь серьезными, как в предыдущем случае. Оценки g0, g1 коэффициентов, найденные для модели (7.42), остаются, как правило, несмещенными (M(g0) = β0, M(g1) = β1) и состоятельными. Однако их точность уменьшится, увеличивая при этом стандартные ошибки, т. е. оценки становятся неэффективными, что отразится на их устойчивости. Данный вывод логи-

194

чески вытекает из формул (5.12), (6.24) расчета дисперсий оценок коэффициентов регрессии для этих уравнений:

;

∑ (x

−x)2

∑ (x

−x

(1−r2

)

Здесь r12 − коэффициент корреляции между объясняющими переменными Х1 и Х2. Следовательно, S2b1 ≤ Sg21 , причем знак равенства возмо-

жен лишь при r12 = 0.

Увеличение дисперсии оценок может привести к ошибочным результатам проверки гипотез относительно значений коэффициентов регрессии, расширению интервальных оценок.

3. Выбор неправильной функциональной формы

Суть ошибки проиллюстрируем следующим примером. Пусть правильная регрессионная модель имеет вид:

Y = в0 + в1X1 + в2X2 + е.

(7.43)

Любое эмпирическое уравнение регрессии с теми же переменными, но имеющее другой функциональный вид, приводит к искажению истинной зависимости. Например, в следующих уравнениях

lnY = a0 + a1X1 + a2X2 + e ,	(7.44)
Y = c0 + c1lnX1 + c2lnX2 + u	(7.45)

совершена ошибка выбора неправильной функциональной формы уравнения регрессии. Последствия данной ошибки будут весьма серьезными. Обычно такая ошибка приводит либо к получению смещенных оценок, либо к ухудшению статистических свойств оценок коэффициентов регрессии и других показателей качества уравнения. В первую очередь это вызвано нарушением условий Гаусса–Маркова для отклонений. Прогнозные качества модели в этом случае очень низки.

7.7.3. Обнаружение и корректировка ошибок спецификации

При построении уравнений регрессии, особенно на начальных этапах, ошибки спецификации весьма нередки. Они допускаются обычно из-за поверхностных знаний об исследуемых экономических процессах, либо из-за недостаточно глубоко проработанной теории, или из-за погрешностей при сборе и обработке статистических данных при построении эмпирического уравнения регрессии. Важно уметь

195

1 − R12

обнаружить и исправить эти ошибки. Сложность процедуры определяется типом ошибки и нашими знаниями об исследуемом объекте.

Если в уравнении регрессии имеется одна несущественная переменная, то она обнаружит себя по низкой t-статистике. В дальнейшем эту переменную исключают из рассмотрения.

Если в уравнении несколько статистически незначимых объясняющих переменных, то следует построить другое уравнение регрессии без этих незначимых переменных. Затем с помощью F-статистики

(6.41) сравниваются коэффициенты детерминации R12 и R 22 для первоначального и дополнительного уравнений регрессий:

F = R12 − R22 n − m −1 . k

Здесь n – число наблюдений, m – число объясняющих переменных в первоначальном уравнении, k – число отбрасываемых из первоначального уравнения объясняющих переменных. Возможные рассуждения и выводы для данной ситуации приведены в разделе 6.7.2.

При наличии нескольких несущественных переменных, возможно, имеет место мультиколлинеарность. Рекомендуемые выходы из этой ситуации подробно рассмотрены в главе 10.

Однако осуществление указанных проверок имеет смысл лишь при правильном подборе вида (функциональной формы) уравнения регрессии, что можно осуществить, если согласовывать его с теорией. Например, при построении кривой Филлипса, указывающей, что зависимость между заработной платой Y и безработицей Х является обратной, возможны следующие модели:

Y = б + в X + е, в < 0; ln Y= б +в lnX+ е, в < 0;

Y = б +в	1	+ е, в > 0;
X + г

Y = б + aвx + е, в < 0	и т. п.

196

Последствия данной ошибки достаточно серьезны. Оценки, полученные с помощью МНК по уравнению (7.38), являются смещенными (M(g0) ≠ β0, M(g1) ≠ β1) и несостоятельными даже при бесконечно большом числе испытаний. Следовательно, возможные интервальные оценки и результаты проверки соответствующих гипотез будут ненадежными.

Sxy

cov(X ,Y)

cov(X ,в

+ в

+ е)

g1 =

≈

S2x

D(X1 )

= D(X1 1 ) [cov(X1, в0 ) + cov(X1, в1X1 ) + cov(X1, в2X2 ) + cov(X1, е)] = = D(X1 1 ) [0 + в1D(X1 ) + в2cov(X1, X2 ) + cov(X1, е)] =

= в1	+ в2	cov(X1, X2 )	+	cov(X1, е)	.	(7.39)
D(X1 )
			D(X1 )

Исходя из предпосылки 40 МНК (см. параграф 5.1), cov(X1, ε) = 0. Тогда очевидна справедливость следующего соотношения:

			cov(X1, X2 )			cov(X1	, X2 )

M(g1) = M	в1	+ в2		= в1	+ в2			. (7.40)
D(X1 )	D(X1 )

в2 cov(X1, X2 ) . Этот вывод позволяет определить направление сме- D(X1 )

193

помним, что при определении качества модели обычно анализируются следующие параметры:

а) скорректированный коэффициент детерминации R2 (см. пара-

граф 6.7);

б) t-статистики (см. параграф 6.6);

в) статистика Дарбина–Уотсона DW (см. параграф 6.8); г) согласованность знаков коэффициентов с теорией;

д) прогнозные качества (ошибки) модели (см. раздел 7.7.1).

Если все эти показатели удовлетворительны, то данная модель может быть предложена для описания исследуемого реального процесса. Если же какая-либо из описанных выше характеристик не является удовлетворительной, то есть основания сомневаться в качестве данной модели (неправильно выбрана функциональная форма уравнения; не учтена важная объясняющая переменная; имеется объясняющая переменная, не оказывающая значимого влияния на зависимую переменную).

Для более детального анализа адекватности модели может быть предложено исследование остаточного члена модели.

7.7.4. Исследование остаточного члена модели

Графическое представление поведения остаточного члена e (т. е. графическое представление случайных отклонений ei, i = 1, 2, …, n) позволяет прежде всего проанализировать наличие автокорреляции и гетероскедастичности (непостоянства дисперсий отклонений). Данные проблемы будут обсуждены в следующих главах.

0	i 0	i
	Функциональная	Случайная
	связь	связь
	а	б

Рис. 7.4

Кроме того, с помощью графического представления отклонений ei может быть также обнаружена неправильная спецификация уравне-

197

ния. Для этого строится график зависимости величин отклонений e от номера наблюдения i. Если зависимость, изображенная на этом графике, имеет регулярный (неслучайный) характер (рис. 7.4, а), то это означает, что исследуемое уравнение регрессии неверно специфицировано.

Существует и ряд других тестов обнаружения ошибок спецификации, среди которых можно выделить:

1.Тест Рамсея RESET (Regression specification error test).

2.Тест (критерий) максимального правдоподобия (The Likelihood Ratio test).

3.Тест Валда (The Wald test).

4.Тест множителя Лагранжа (The Lagrange multiplier test).

5.Тест Хаусмана (The Hausman test).

6.Box–Cox преобразование (Box−Cox trasformation).

Подробное описание данных тестов выходит за рамки вводного курса. Отметим, что суть данных тестов состоит либо в осуществлении преобразований случайных отклонений, либо масштаба зависимой переменной с тем, чтобы можно было сравнить начальное и преобразованное уравнения регрессии на основе известного критерия.

Например, суть теста Рамсея (RESET) состоит в следующем: а) Оценивают линейную регрессию между переменными задачи

Y= b0 +) b1X1 + b2 X2 + L+ bm Xm + e

Y = a 0 + a1X1 + L+ a m Xm .

б) Анализируют графически зависимость ei( yi ). Так, если она может быть представлена явной функциональной зависимостью e = = f( Y ), то данную зависимость вводят в исходное уравнение регрессии и затем оценивают уравнение

Y = a0 + a1X1 + L + a m X m + f( Y. ) + e .

в) Сравнивают коэффициенты детерминации для начального и вновь построенного уравнений регрессии на основе следующей F-ста- тистики:

F =	R2	− R2		n − k	.	(7.46)
2	1
	1− R22		r

Здесь n – число наблюдений, k – число параметров в новой модели, r – число новых регрессоров (одночленов уравнения). Статистика F имеет распределение Фишера с числами степеней свободы ν1 = r, ν2

198

= = n – k. Если F-статистика окажется статистически значимой, то это означает, что исходное уравнение регрессии было неправильно специфицировано.

В качестве примера приведем анализ зависимости суммарных издержек от объема выпуска. В общем случае такая зависимость выражается кубической функцией:

yi = в0 + в1xi + в2 xi2 + в3xi3 + ei .

(7.47)

Пусть на начальном этапе эта же зависимость моделируется линейной функцией:

yi = г0 + г1xi + ei .

(7.48)

Модель (7.48), скорее всего, будет неудовлетворительной по ряду статистических показателей. В частности, изменение отклонений еi будет носить системный характер, который найдет отражение на графике e = = f( Y ), вероятный вид которого приведен на рис. 7.5.

Рис. 7.5

Ломаная линия графика в большой степени соответствует кубической функции. Поэтому в модель (7.48) целесообразно ввести два до-

)2 )3

полнительных регрессора yi и yi :

= л

+ л x

+ л

)

+ л

)

+ e

(7.49)

Сравнивают коэффициенты детерминации R 22 и R12 для уравнений

(7.49) и (7.48) на основе F-статистики (7.46) (при этом k = 4; r = 2). Ес-

ли Fнабл. > Fкр. = Fα;2;n−4, тогда есть основания считать, что модель (7.48) неверно специфицирована.

199

К сожалению, тест Рамсея не указывает напрямую спецификацию модели лучшую, чем исследуемая. Поэтому подбор лучшей спецификации требует определенных усилий.

Дополнением либо альтернативой к тесту Рамсея может служить тест множителя Лагранжа, суть которого легко пояснить на предыдущем примере.

По виду зависимости e = f( Y ) высказывается предположение о необходимых направлениях уточнения модели. В нашем примере линейная зависимость должна быть заменена кубической, что потребует

введения двух дополнительных регрессоров xi2 и x3i . Следовательно,

строится модель (7.47). Для вновь построенной модели определяется коэффициент детерминации R2. Доказано, что при большом объеме выборки n произведение nR2 имеет χ2-распределение с числом степеней свободы r, равным числу добавленных регрессоров модели. В на-

шем примере nR2 ч22 (при n → ∞). Построенная статистика сравнивается с соответствующей критической точкой ч2r . Если nR2 > ч2r , то

первоначально выбранная модель должна быть отклонена в пользу вновь построенной.

Описание других методов выходит за рамки вводного курса и может быть найдено в [ 6, 9].

7.8. Проблемы спецификации

Итак, стандартная схема анализа зависимостей состоит в осуществлении ряда последовательных процедур.

•Подбор начальной модели. Он осуществляется на основе экономической теории, предыдущих знаний об объекте исследования, опыта исследователя и его интуиции.

•Оценка параметров модели на основе имеющихся статистических данных.

•Осуществление тестов проверки качества модели (обычно используются t-статистики для коэффициентов регрессии, F-статистика для коэффициента детерминации, статистика Дарбина–Уотсона для анализа отклонений и ряд других тестов).

•При наличии хотя бы одного неудовлетворительного ответа по ка- кому-либо тесту модель совершенствуется с целью устранения выявленного недостатка.

200

•При положительных ответах по всем проведенным тестам модель считается качественной. Она используется для анализа и прогноза объясняемой переменной.

Однако необходимо предостеречь от абсолютизации полученного результата. Проблема заключается в том, что даже качественная модель является подгонкой спецификации модели под имеющийся набор данных. Поэтому вполне реальна картина, когда исследователи, обладающие разными наборами данных, строят разные модели для объяснения одной и той же переменной. Другой проблемой является использование модели для прогнозирования значений объясняемой переменной. Иногда хорошие с точки зрения диагностических тестов модели обладают весьма низкими прогнозными качествами.

Одним из главных направлений эконометрического анализа является постоянное совершенствование моделей. Здесь следует отметить, что какого-то глобального подхода, определяющего заранее возможные пути совершенствования, нет и, скорее всего, быть не может. Исследователь должен помнить, что совершенной модели не существует. В силу постоянно изменяющихся условий протекания экономических процессов не может быть и постоянно качественных моделей. Новые условия требуют пересмотра даже весьма устойчивых моделей.

До сих пор достаточно спорным является вопрос, как строить модели:

а) начинать с самой простой и постоянно усложнять ее; б) начинать с максимально сложной модели и упрощать ее на ос-

нове проводимых исследований.

И тот и другой подход имеют как достоинства, так и недостатки. Например, если следовать схеме а), то происходит обыкновенная подгонка модели под эмпирические данные. При теоретически более оправданном подходе б) поиск возможных направлений совершенствования модели зачастую сводится к полному перебору, что делает проводимый анализ неэффективным. Возможно также на этапах упрощения модели отбрасывание объясняющих переменных, которые были бы весьма полезны в упрощенной модели. В итоге, построение модели является индивидуальным подходом к конкретной ситуации, опирающимся на серьезные знания экономической теории и статистического анализа.

При этом отметим, что при всех недостатках моделей принятие на их основе решений приводит в целом к гораздо более высоким или

201

ка F имеет распределение Фишера с числами степеней свободы ν1 = r, ν2 = n – k. Если F-статистика окажется статистически значимой, то это означает, что исходное уравнение регрессии было неправильно специфицировано.

yi = в0 + в1xi + в2 xi2 + в3xi3 + ei .

(7.47)

Пусть на начальном этапе эта же зависимость моделируется линейной функцией:

yi = г0 + г1xi + ei .

(7.48)

= f( Y ), вероятный вид которого приведен на рис. 7.5.

Рис. 7.5

Ломаная линия графика в большой степени соответствует кубической функции. Поэтому в модель (7.48) целесообразно ввести два

дополнительных регрессора

)

yi2 и yi3 :

= л

+ л x

+ л

)

+ л

)

+ e

(7.49)

Сравнивают коэффициенты детерминации R 22 и R12

для уравне-

ний (7.49) и (7.48) на основе F-статистики (7.46) (при этом k = 4; r = 2).

Если Fнабл. > Fкр. = Fα;2;n−4, тогда есть основания считать, что модель (7.48) неверно специфицирована.

199

введения двух дополнительных регрессоров xi2 и x3i . Следовательно,

первоначально выбранная модель должна быть отклонена в пользу вновь построенной.

Описание других методов выходит за рамки вводного курса и может быть найдено в [ 6, 9].

7.8. Проблемы спецификации

Итак, стандартная схема анализа зависимостей состоит в осуществлении ряда последовательных процедур.

•Оценка параметров модели на основе имеющихся статистических данных.

200

ожидаемым результатам, чем при принятии решений лишь на основе интуиции и экономической теории.

Вопросы для самопроверки

1.Что понимается под спецификацией модели?

2.Приведите примеры использования логарифмических регрессионных моделей.

3.Каков смысл коэффициентов регрессии в логарифмических регрессионных моделях?

4.Приведите примеры использования обратных и степенных моделей.

5.Изменятся или нет свойства случайного отклонения при преобразовании уравнения регрессии?

6.Каковы признаки качественной регрессионной модели?

7.Назовите основные виды ошибок спецификации.

8.Как можно обнаружить ошибки спецификации?

9.Можно ли обнаружить ошибки спецификации с помощью исследования остаточного члена?

10.В чем суть теста Рамсея?

11.Обрисуйте схему построения эконометрической модели.

12.Определите, какое из следующих утверждений истинно, какое − ложно, а какое − не определено.

а) Двойная логарифмическая модель является линейной относительно ее переменных.

б) Коэффициенты двойной логарифмической модели определяют эластичность зависимой переменной по соответствующим объясняющим перемен-

ным.

в) Уравнения Y = A Kα Lβ ε и lnY = lnA + α lnK + β lnL + lnε, построенные по одним и тем же статистическим данным, имеют приблизительно одинаковые коэффициенты детерминации.

г) Общее качество уравнений регрессии lnY = β0 + β1 lnX1 + β2 lnX2 + ε и lnY = β0 + β1 X1 + β2 X2 + ε, построенных по одной выборке, может сравниваться на основе коэффициентов детерминации.

д) При оценке производственной функции по уравнению

lnY = β0 + β1 lnX1 + β2 lnX2 + ε

все коэффициенты регрессии должны быть положительными.

е) При рассмотрении функции Кобба –Дугласа Y = A Kα Lβ ε с мультипликативным случайным членом для получения качественных оценок необходимо, чтобы ε имело лог-нормальное распределение.

ж) Включение в уравнение незначимой объясняющей переменной не увеличивает коэффициент детерминации R2.

з) Ошибки спецификации приводят к получению смещенных оценок.

13.Пусть оценена регрессия Y = b0 + b1X1 + b2X2, причем b1 > 0. При отбрасывании переменной X2 и оценке регрессии Y = a0 + a1X1 коэффициент a1 оказался

202

отрицательным (a1 < 0). Возможно ли это? Если да, то при каких обстоятельствах?

14. Пусть реальная регрессионная модель имеет вид:

Y = β1X + ε.

Пусть коэффициенты регрессии определяются исходя из модели

Y = β0 + β1X + ε.

Совершается ли при этом ошибка спецификации? Если да, то каковы ее последствия? Что можно сказать, если указанные модели поменять ролями?

15. Пусть истинная регрессия имеет вид:

Y = β0 + β1X1 + β2X2.

Совершается ли ошибка спецификации при использовании следующей регрессии:

Y= β0 + β1(X1 + Х2)?

16.Пусть реальная регрессионная модель имеет вид:

yi = β1xi εi,

где случайные отклонения εi имеют лог-нормальное распределение. Регрессия оценена исходя из уравнения

yi = γ1xi + εi .

Совершается ли при этом ошибка спецификации и каковы ее последствия?

17.Какие из указанных моделей и каким образом могут быть сведены к линейной модели:

а) Y = β0 + β1ln2X + ε;

б) Y = β0 + β1	1		;

			x
в) Y =	1		+ е ;


		в0 + в1X
г) Y =	в0 (X + 5)2		+ ε;

		в1X
д) Y =		X		.
	в0 + в1X2

18. Предложена следующая регрессионная модель:

Y = α + βX1X3 + γX2X3 + βλ X1 + γλX2 + ε.

а) Является ли данная модель линейной относительно параметров либо переменных?

б) Можно ли получить оценки параметров уравнения при имеющемся наборе данных (хi1, хi1, хi1, yi), i = 1, 2, …, n?

19.Пусть объем выпуска моделируется производственной функцией Кобба– Дугласа

203

Y = A Kα Lβ ε ,

где случайное отклонение ε имеет лог-нормальное распределение с математическим ожиданием М(ε) = 1.

а) Что означает, что ε имеет лог-нормальное распределение? Почему желательно, чтобы ε имело именно это распределение с математическим ожидани-

ем М(ε) = 1?

б) Как проверить гипотезу о том, что производство имеет постоянную отдачу от масштаба?

Упражнения и задачи

1.По 40 точкам оценена следующая модель производственной функции:

y = 0.6 + 0.46 l + 0.32 k,	R2 = 0.75; DW = 2.45;
t = (2.6) (0.75) (1.81)

где y, l, k − темпы прироста объема выпуска, затрат труда и капитала соответственно.

Какие из следующих выводов представляются вам верными?

а) Нужно ввести новую объясняющую переменную, т. к. доля объясненной дисперсии слишком мала; б) имеет место автокорреляция остатков первого порядка, поэтому нужно

изменить формулу зависимости;

в) нужно исключить фактор l, т. к. он оказался статистически незначимым; г) в модели не учтена важная объясняющая переменная − научнотехнический прогресс. Ее необходимо включить; д) модель имеет удовлетворительные статистики, поэтому нет смысла ее совершенствовать.

Свой ответ обоснуйте соответствующими тестами. Какие изменения можно ожидать в результате предложенного вами преобразования?

2.По 26 наблюдениям получена следующая модель производственной функции

y =	0.46 l + 0.32 k	R2 = 0.41; DW = 0.67;
t =	(1.81) (2.87),

где y, l, k − темпы прироста объема выпуска, затрат труда и капитала соответственно.

Какие из следующих выводов представляются вам верными?

а) Нужно исключить фактор l, т. к. он оказался статистически незначимым; б) имеет место автокорреляция остатков первого порядка, поэтому нужно изменить формулу зависимости;

в) нужно исключить фактор k, т. к. он оказался статистически незначимым; г) модель имеет удовлетворительные статистики, поэтому нет смысла ее совершенствовать; д) нужно перейти от переменных к их логарифмам;

204

е) в модели не учтена важная объясняющая переменная − научнотехнический прогресс. Ее необходимо включить; ж) необходимо включить в модель свободный член.

3.Базируясь на статистических данных некоторой страны за 20 лет, построена модель макроэкономической производственной функции:

lnY = −3.52 +1.53lnK + 0.47lnL + e ,	R2 = 0.875;
t = (−1.45) (2.76)	(5.321),

где Y − реальный ВНП (млн $), K − объем затрат капитала (млн $), L − объем затрат труда (человеко-дни).

а) Оцените качество построенной модели. б) Возможно ли ее совершенствование?

в) Проинтерпретируйте коэффициенты регрессии и оцените их статистическую значимость.

г) Можно ли утверждать, что прирост ВНП в большей степени связан с приростом затрат капитала, нежели с приростом затрат труда?

д) Будет ли ВНП эластично по затратам рассматриваемых в модели ресурсов?

4.Анализируется прибыль предприятия Y(млн $) в зависимости от расходов на рекламу Х(млн $). По наблюдениям за 9 лет получены следующие данные:

Y	5	7	13	15	20	25	22	20	17
X	0.8	1.0	1.8	2.5	4.0	5.7	7.5	8.3	8.8

а) Постройте корреляционное поле и выдвиньте предположение о формуле зависимости между рассматриваемыми показателями.

б) Оцените по МНК коэффициенты линейной регрессии Y = β0 + β1X + ε. в) Оцените качество построенной регрессии.

г) Оцените по МНК коэффициенты квадратичной регрессии

Y = β0 + β1X + β1X2 + ε.

д) Оцените качество построенной регрессии. Какую из моделей вы предпочтете?

5.По имеющимся статистическим данным оцените параметры β и γ следую-

щей регрессионной модели (e = exp): Y = β eγt + ε.

t	1	4	16

Y	0.85	0.45	0.4

6.По данным за 15 лет построены два уравнения регрессии:

а) Y = 3.435 − 0.5145X + e,

R2 = 0.6748;

t = (20.5) (−4.3),

205

б) lnY = 0.851 − 0.2514X + e,	R2 = 0.7785;
t = (43.6) (−5.2),

где Y − ежедневное среднедушевое потребление кофе (в чашках по 100 г), Х − среднегодовая цена кофе (в руб./кг).

а) Проинтерпретируйте коэффициенты каждой из моделей.

б) Можно ли по указанным моделям определить, является ли спрос на кофе эластичным?

в) Какая модель, с вашей точки зрения, предпочтительнее? Можно ли обосновать вывод по коэффициентам детерминации?

7.Анализируется индекс потребительских цен Y(1990 = 100) по объему денежной массы Х (млрд $) на основании данных с 1981 по 1998 г.


Годы	81		82		83	84	85		86		87		88	89	90
Y	65	68	72.5	77.5	82	85.5	88.5	91	95	100
X	110	125	132	137	160	177		192		215	235	240
Годы	91		92		93		94	95		96	97
Y	106.5	112	115.5	118.5	120	120.5	121

X245 250 275 285 295 320 344

Необходимо а) построить корреляционное поле.

б) Построить регрессии 1) Y на Х; 2) Y на lnX; 3) lnY на Х; 4) lnY на lnX.

в) Проинтерпретировать коэффициенты регрессии для каждой из моделей. г) По каждой из моделей определить эластичность Y по Х.

д) Определить целесообразность выбора предложенных моделей.

8.Анализируются данные по объему экспорта за 16 лет. Подбирается модель, наилучшим образом соответствующая приведенным ниже статистическим данным:

Год	81	82	83	84	85	86	87	88	89	90	91	92	93	94	95	96	97
EX	54.1	35.4	56.6	46.6	46.7	52.1	56.6	44.8	68.3	36.3	75.0	57.2	69.0	55.5	73.3	64.1	60.0
	а) Постройте корреляционное поле.
	б) Постройте линейное уравнение регрессии EX = β0 + β1t + ε.
	в) Постройте квадратичное уравнение регрессии EX = β0 + β1t + β2t2 + ε.
	г) Постройте кубическое уравнение регрессии EX = β0 + β1t + β2t2	+ β3t3 + ε.

д) Сравните качество построенных уравнений. Какую бы из моделей вы выбрали?

е) Начертите на корреляционном поле найденные кривые.

9.Пусть оценена функция издержек от объема выпуска:

LnC = b0 + b1lnQ + b2 ln2Q + e.

206

Каким образом можно проверить гипотезу о том, что эластичность издержек по выпуску равна нулю?

10.По имеющимся статистическим данным исследуется зависимость между

темпом	прироста заработной	платы	щt	=		щt − щt −1		100%		и уровнем
											&			щt

безработицы ut.
	Год					70	71	72	73	74	75		76	77		78	79

	щt					1.61	1.66	1.80	1.95	2.05 2.12 2.25	2.45 2.55 2.67
	ut					1.0	1.38	1.15	1.50	1.55	1.20		1.1	1.0		1.35	1.8

	Год			80	81	82	83	84	85		86	87		88

	щt			2.73	2.80	2.93	3.02	3.15	3.27		3.45	3.60	3.80
	ut				1.9	1.45	1.85	1.2	1.5	1.25		1.4	1.3		1.6

Для отражения рассматриваемой зависимости рекомендуется использовать

		1
&			+ еt .

кривую Филлипса щt = в0	+ в1
	ut

а) По МНК найдите оценки b0, b1 коэффициентов β0, β1.

б) Совпадают ли знаки b0, b1 с предполагаемыми по теории. Каков экономический смысл коэффициента β1?

в) Постройте корреляционное поле, отложив значения ut по горизонтальной оси, а значения щ& t − по вертикальной.

г) Определите 95%-ные доверительные интервалы для коэффициентов β0, β1. д) Найдите оценку естественного уровня безработицы u0 для рассматриваемой страны (естественный уровень безработицы u0 − это такой уровень, при котором щ& t = 0).

е) Найти оценки для производной dщ& при u = 1 и при u = 3. Каков экономиdu

ческий смысл указанной производной? Какие выводы по найденным оценкам можно сделать?

ж) По расположению точек на корреляционном поле попытайтесь подобрать другую модель для описания зависимости между щ& t и ut. Найдите

оценки параметров предложенной модели. з) Сравните качество построенных моделей.

11.В следующей таблице приведены данные по объемам выпуска Q, затрат капитала K и труда L в некоторой отрасли за 20 лет.

Qt 46000 59000 37500 107000 130000 128000 154000 226500 146500 31500

207

Kt	2	5.6	2	5.6	2	10.4	5.6	10.4	10.4	2
Lt	2	2	4	4	6	2	6	4	6	2
Qt		70500 70500 108000	90500	74000	160000 225000 167500 88500 54000

Kt		2	5.6	5.6	2	10.4	5.6	10.4	10.4	5.6	2
Lt		4	2	4	6	2	6	4	6	4	2

Используя эти данные, оцените производственную функцию Кобба – Дугла-

са Qt = A Kбt Lвt .

а) Сведите данную модель к линейной модели: qt = β0 + β1kt + β2lt + ε. Как это можно осуществить?

б) Оцените коэффициенты β0, β1, β2.

в) Дайте экономическую интерпретацию β1, β2, β1 + β2.

г) Спрогнозируйте объем выпуска, используя интервальную оценку для Q при уровне значимости α = 0.05 и затратах ресурсов K = 8 и L = 3.

д) проверьте при уровне значимости α = 0.05 гипотезы:

1) β1 = 0, β2 = 0; 2) β1 = β2; 3) β1 = β2 = 0; 4) β1 + β2 =1.

Какими критериями вы пользовались и почему?

е) Будет ли построенная модель качественной с точки зрения основных критериев качества регрессионной модели? Если нет, то какие направления ее совершенствования вы могли бы предложить?

208

Источник

Нелинейные модели

Нелинейные модели, являющиеся линейными относительно параметров, сводятся к линейным простой заменой переменных. Нелинейные модели, которые сводятся к линейным после некоторых преобразований с последующей заменой переменных, называются внутренне линейными. Нелинейные модели, которые нельзя преобразовать к линейной форме, называются внутренне нелинейными. С помощью t- и F-статистики исследуют линеаризованную модель.

Примеры исследования нелинейных моделей

Степенные модели
Гиперболические модели

Пример расчета параметров нелинейных моделей

Выбор формы нелинейной модели

Многообразие и сложность экономических процессов предопределяет многообразие моделей, используемых для эконометрического анализа. Это существенно усложняет процесс нахождения максимально адекватной формулы зависимости. Для случая парной регрессии подбор модели обычно осуществляется по виду расположения наблюдаемых точек на корреляционном поле. Однако нередки ситуации, когда расположение точек приблизительно соответствует нескольким функциям и необходимо из них выявить наилучшую. Еще более неоднозначна ситуация для множественной регрессии, так как наглядное представление статистических данных в этом случае невозможно.

На практике неизвестно, какая модель является верной, и зачастую подбирают такую, которая наиболее точно соответствует реальным данным. При этом необходимо учитывать, что идеальной модели не существует. Поэтому, чтобы выбрать качественную модель, необходимо ответить на ряд вопросов, возникающих при ее анализе.

Обычно выделяют следующие признаки «хорошей» модели.

Скупость (простота). Из двух моделей, приблизительно одинаково отражающих реальность, предпочтение отдается содержащей меньшее число объясняющих переменных.
Единственность. Для любого набора статистических данных определяемые коэффициенты должны вычисляться однозначно.
Максимальное соответствие. Уравнение тем лучше, чем большую часть разброса зависимой переменной оно может объяснить. Поэтому стремятся построить уравнение с максимально возможным скорректированным коэффициентом детерминации R².
Согласованность с теорией. Никакое уравнение не может быть признано качественным, если оно не соответствует известным теоретическим предпосылкам. Вообще говоря, теория тоже может оказаться ошибочной.
Прогнозные качества. Модель может быть признана качественной, если полученные на ее основе прогнозы подтверждаются реальностью.
Другим критерием прогнозных качеств оцененной модели регрессии может служить следующее отношение: V = S/yср, где S — стандартная ошибка регрессии, y — среднее значение зависимой переменной уравнения регрессии. Если величина V мала (а она определяет относительную ошибку прогноза в процентах) и отсутствует автокорреляция остатков (определяемая по величине статистики DW Дарбина-Уотсона), то прогнозные качества модели высоки.

Если уравнение регрессии используется для прогнозирования, то величина V обычно рассчитывается не для того периода, на котором оценивалось уравнение, а для некоторого следующего за ним временного интервала, для которого известны значения зависимой и объясняющих переменных. Тем самым на практике проверяются прогнозные качества модели. В случае положительного решения, если можно спрогнозировать значения объясняющих переменных на некоторый последующий период, построенная модель обоснованно может быть использована для прогноза значений объясняемой переменной Y. Следует помнить, что период прогнозирования должен быть, по крайней мере, в три раза короче периода, по которому оценивалось уравнение регрессии.

Рассмотрим виды ошибок спецификации. Одним из базовых предположений построения качественной модели является правильная (хорошая) спецификация уравнения регрессии. Правильная спецификация уравнения регрессии означает, что оно в целом верно, отражает соотношение между экономическими показателями, участвующими в модели. Это является необходимой предпосылкой дальнейшего качественного оценивания.

Ошибки спецификации

Отбрасывание значимой переменной. Последствия данной ошибки достаточно серьезны. Оценки, полученные с помощью МНК, являются смещенными и несостоятельными даже при бесконечно большом числе испытаний. Следовательно, возможные интервальные оценки и результаты проверки соответствующих гипотез будут ненадежными.
Добавление незначимой переменной. В некоторых случаях в уравнения регрессии включают слишком много объясняющих переменных, причем не всегда обоснованно. Последствия данной ошибки будут не столь серьезными, как в предыдущем случае. Оценки коэффициентов модели остаются, как правило, несмещенными и состоятельными. Однако их точность уменьшается, увеличивая при этом стандартные ошибки, т. е. оценки становятся неэффективными, что отразится на их устойчивости.
Выбор неправильной функциональной формы. Последствия такой ошибки будут весьма серьезными. Обычно ошибка приводит либо к получению смещенных оценок, либо к ухудшению статистических свойств оценок коэффициентов регрессии и других показателей качества уравнения. В первую очередь это связано с нарушением условий Гаусса-Маркова для отклонений. Прогнозные качества модели в этом случае очень низки.

При построении уравнений регрессии, особенно на начальных этапах, ошибки спецификации весьма нередки. Они допускаются обычно из-за поверхностных знаний об исследуемых экономических процессах либо из-за недостаточно глубоко проработанной теории, или из-за погрешностей сбора и обработки статистических данных при построении эмпирического уравнения регрессии. Важно уметь обнаружить и исправить эти ошибки. Сложность процедуры определяется типом ошибки и нашими знаниями об исследуемом объекте.

сравниваются коэффициенты детерминации для первоначального и дополнительного уравнений регрессий. Здесь n — число наблюдений, m — число объясняющих переменных в первоначальном уравнении, k — число отбрасываемых из первоначального уравнения объясняющих переменных. Возможные рассуждения и выводы для данной ситуации приведены ранее.

При наличии нескольких несущественных переменных, возможно, имеет место мультиколлинеарность. Рекомендуемые выходы из этой ситуации подробно рассмотрены ранее.

Отметим, что выбор модели далеко не всегда осуществляется однозначно, и в дальнейшем требуется сравнивать модель как с теоретическими, так и с эмпирическими данными, совершенствовать ее. Напомним, что при определении качества модели обычно анализируются следующие параметры:

скорректированный коэффициент детерминации R²;
t-статистики;
критерий Дарбина-Уотсона (DW);
согласованность знаков коэффициентов с теорией;
прогнозные качества (ошибки) модели.

Исследование остаточного члена модели

Графическое представление поведения остаточного члена e (т. е. графическое представление случайных отклонений ei, (i = 1, 2,…, n) позволяет, прежде всего, проанализировать наличие автокорреляции и гетероскедастичности (непостоянства дисперсий отклонений). Кроме того, с помощью графического представления отклонений ei может быть также обнаружена неправильная спецификация уравнения. Для этого строится график зависимости величин отклонений ei от номера наблюдения i.

Если зависимость, изображенная на этом графике, имеет регулярный (неслучайный) характер, то это означает, что исследуемое уравнение регрессии неверно специфицировано.

Существует и ряд других тестов обнаружения ошибок спецификации, среди которых можно выделить:

Тест Рамсея RESET (Regression specification error test).
Тест (критерий) максимального правдоподобия (The Likeli¬hood Ratio test).
Тест Валда (The Wald test).
Тест множителя Лагранжа (The Lagrange multiplier test).
Тест Хаусмана (The Hausman test).
Преобразование Бокса-Кокса (Box–Cox transformation).

Подробное описание данных тестов выходит за рамки вводного курса. Отметим, что суть указанных тестов состоит либо в осуществлении преобразований случайных отклонений, либо в масштабировании зависимой переменной, с тем чтобы можно было сравнить начальное и преобразованное уравнения регрессии на основе известного критерия.

Стандартная схема анализа зависимостей состоит в осуществлении ряда последовательных процедур.

Подбор начальной модели осуществляется на основе экономической теории, предыдущих знаний об объекте исследования, опыта исследователя и его интуиции.
Оценка параметров модели на основе имеющихся статистических данных.
Осуществление тестов проверки качества модели (обычно используются t-статистики для коэффициентов регрессии, F-статистика для коэффициента детерминации, статистика Дарбина-Уотсона для анализа отклонений и ряд других тестов).
При наличии хотя бы одного неудовлетворительного ответа по какому-либо тесту модель совершенствуется с целью устране¬ния выявленного недостатка.
При положительных ответах по всем проведенным тестам модель считается качественной. Она используется для анализа и прогноза объясняемой переменной.

Однако необходимо предостеречь от абсолютизации полученного результата, поскольку даже качественная модель является подгонкой спецификации модели под имеющийся набор данных.

Одно из главных направлений эконометрического анализа — постоянное совершенствование моделей. Совершенной модели не существует. В силу постоянно изменяющихся условий протекания экономических процессов не может быть и постоянно качественных моделей. Новые условия требуют пересмотра даже весьма устойчивых моделей.

Достаточно спорным является вопрос, как строить модели: а) начинать с самой простой и постоянно усложнять ее; б) начинать с максимально сложной модели и упрощать ее на основе проводимых исследований.

Оба подхода имеют как достоинства, так и недостатки. Например, если следовать схеме (а), то происходит обыкновенная подгонка модели под эмпирические данные. При теоретически более оправданном подходе (б) поиск возможных направлений совершенствования модели зачастую сводится к полному перебору, что делает проводимый анализ неэффективным. На этапах упрощения модели возможно также отбрасывание объясняющих переменных, которые были бы весьма полезны в упрощенной модели. Итак, построение модели является индивидуальным в каждой конкретной ситуации и опирается на серьезные знания экономической теории и статистического анализа.

Однако отметим, что при всех недостатках моделей принятие на их основе решений приводит в целом к гораздо более точным результатам, чем при принятии решений лишь на основе интуиции и экономической теории.

Перейти на страницу решения контрольных по эконометрке можно тут

Источник

4.
Использование
предварительной информации о значениях некоторых параметров. Иногда значения некоторых неизвестных параметров
модели могут быть определены по пробным выборочным наблюдениям, тогда
мультиколлинеарность может быть устранена путем установления значений параметра
у одной коррелирующих переменных. Ограниченность метода – в сложности получения
предварительных значений параметров с высокой точностью.

5.
Преобразование переменных. Для устранения мультиколлинеарности можно
преобразовать переменные, например, путем линеаризации или получения
относительных показателей, а также перехода от номинальных к реальным
показателям (особенно в макроэкономических исследованиях).

При построении модели множественной регрессии с точки
зрения обеспечения ее высокого качества возникают следующие вопросы:

1.
Каковы признаки качественной
модели?

2.
Какие ошибки спецификации могут
быть?

3.
Каковы последствия ошибок
спецификации?

4.
Какие существуют методы
обнаружения и устранения ошибок спецификации?

Рассмотрим основные признаки качественной модели
множественной регрессии:

1.
Простота. Из двух моделей примерно одинаковых статистических
свойств более качественной является та, которая содержит меньше переменных, или
же более простая по аналитической форме.

2.
Однозначность. Метод вычисления коэффициентов должен быть одинаков
для любых наборов данных.

3.
Максимальное соответствие. Этот признак говорит о том, что основным критерием
качества модели является коэффициент детерминации, отражающий объясненную
моделью вариацию зависимой переменной. Для практического использования выбирают
модель, для которой расчетное значение F-критерия для
коэффициента детерминации б четыре раза больше табличного.

4.
Согласованность с теорией. Получаемые значения коэффициентов должны быть
интерпретируемы с точки зрения экономических явлений и процессов. К примеру,
если строится линейная регрессионная модель спроса на товар, то соответствующий
коэффициент при цене товара должен быть отрицательным.

5.
Хорошие прогнозные качества.
Обязательным условием построения
качественной модели является возможность ее использования для прогнозирования.

Одной из основных ошибок, допускаемых при построении
регрессионной модели, является ошибка спецификации (рис. 4.3).
Под ошибкой спецификации понимается неправильный выбор функциональной формы
модели или набора объясняющих переменных.

Различают следующие виды ошибок спецификации:

1.
Невключение в модель полезной
(значимой) переменной.

2.
Добавление в модель лишней
(незначимой) переменной

3.
Выбор неправильной функциональной
формы модели

Последствия ошибки первого вида (невключение в
модель значимой переменной) заключаются в том, что полученные по МНК оценки
параметров являются смещенными и несостоятельными, а значение коэффициента
детерминации значительно снижаются.

При добавлении в модель лишней переменной
(ошибка второго вида) ухудшаются статистические свойства оценок
коэффициентов, возрастают их дисперсии, что ухудшает прогнозные качества модели
и затрудняет содержательную интерпретацию параметров, однако по сравнению с
другими ошибками ее последствия менее серьезны.

Если же осуществлен неверный выбор
функциональной формы модели, то есть допущена ошибка третьего вида, то
получаемые оценки будут смещенными, качество модели в целом и отдельных
коэффициентов будет невысоким. Это может существенно сказаться на прогнозных
качествах модели.

Ошибки спецификации первого вида можно обнаружить только
по невысокому качеству модели, низким значениям R².

Обнаружение ошибок спецификации второго вида, если лишней
является только одна переменная, осуществляется на основе расчета t — статистики для коэффициентов. При лишней переменной коэффициент
будет статистически незначим.