Ошибка спецификации эконометрической модели это - Не ошибается лишь тот, кто ничего не делает!

Спецификация
эконометрической модели, реально
отражающей действительность, тонкая и
сложная задача. Модель – это всегда –
упрощенное, схематичное описание
реальности, которая намного порядков
сложнее любой модели. Не существует
простых моделей, которые могут адекватно
отразить сущность реальных детерминант
из интересующего нас множества.

Цель построения
модели –достижение такой её простой
формулировки, которая не противоречит
лежащей в её основе сложной реальности.
Хотя простая форма модели определенно
лучше для работы, существенные расхождения
модели с реальностью могут иметь
следствием серьезные ошибки в заключениях
о поведении изучаемого объекта.

Важный аспект
спецификации модели – выбор функциональной
формы, соединяющей зависимую и независимые
переменные. Если принять за основу для
модели функциональную форму существенно
отличающуюся от истинной, то любые
заключения по оцениваемой модели будут
иметь сомнительную ценность. Другая
важная часть спецификации модели состоит
в предположении о статистических
свойствах в терминах ошибок уравнения
регрессии. (об этом мы уже так же говорили).
Мы всегда начинаем анализ (построение
модели) в предположении, что эти ошибки
имеют постоянную вариацию, некоррелированны
друг с другом. Если эти предположения
верны, то мы используя МНК и подходящую
для нашей задачи процедуру оценивания,
делаем и заключения об изучаемом
процессе. Однако, если эти предположения
серьезно нарушаются, то заключения наши
так же будут расходиться с реальностью.

Обсудим одну
специфическую форму ошибочной спецификации
модели и прольем свет на возможные
последствия этого явления. При формулировке
регрессионной модели исследователь
обычно делает попытку соотнести зависимую
переменную интересующую его со всеми
важными детерминантами. Отсюда, если
как подходящая форма, принята линейная
модель, то мы желаем включить в число
независимых переменных все величины,
которые могут заметно воздействовать
на зависимую переменную.

В
формулировке регрессионной модели
неявно предполагается, что набор
независимых переменных содержит все
величины, существенно влияющие на
поведение зависимой переменной. Ясно,
что в любой практической проблеме будут
другие факторы, которые так же влияют
на зависимые переменные. Совместное
влияние этих факторов и отражено в
термине ошибки
.
Однако, потенциально очень важным
является допущение, что в перечне
независимых переменных нет пропущенных
из числа тех, что существенно влияют на
зависимую переменную.

Исключая очень
специальный (и редкий) случай, когда
пропущенные переменные некоррелируют
с независимыми переменными, включенными
в регрессионную модель, очень важные
последствия может иметь следующий из
этого тип ошибочной спецификации. В
частности оценки МНК будут смещенными
и обычные заключения, которые мы
производим из доверительных интервалов
или проверок гипотез могут быть весьма
ошибочными.

Для иллюстрации
этого частного типа ошибочной спецификации
обсудим пример из параграфа 3.2. Заключение,
которое мы сделали в результате анализа
задачи, состоит в том, что для заданного
числа кредитных учреждений увеличение
на один процент годовой ставки по
депозитам ведет к ожидаемому увеличению
на 0.237 процентов в годовом доходе этих
учреждений.

Теперь
предположим, что нас интересует только
эффект влияния процентной ставки по
депозитам на годовой доход кредитных
учреждений. Один из подходов к этой
проблеме может состоять в том, что мы
оценим регрессионное уравнение с двумя
переменными, где зависимая переменная
– как и прежде — годовой доход кредитных
учреждений, а независимая – процентная
ставка по депозитам. Мы используем тот
же набор значений за 25 лет. Результатом
анализа будет модель:
.
Значение стандартной ошибки для
коэффициента регрессии составило
0,0356. ЗначениеR²
для этой модели заметно уменьшилось и
составило 0,59. Однако здесь есть и более
серьезные последствия. Полученная
модель предполагает, что однопроцентное
увеличение по долларовым депозитам
ведет к ожидаемому снижению на 0,169
процента годового дохода. Более того,
сравнение коэффициента оценки с оценкой
стандартной ошибки показывает, что нуль
гипотеза о нелинейной связи между этими
переменными отклоняется в пользу
альтернативной, состоящей в том, что
увеличение процента по депозитам ведет
к ожидаемому снижению годового дохода.
Но такое заключение, несомненно, не
соответствует нашему интуитивному
пониманию проблемы, состоящему в том,
что, при прочих равных, мы можем ожидать,
что рост ставок депозитов повлечет за
собой увеличение годового дохода
кредитной организации. Однако за 25
летний период, для которого мы оценивали
модель условие «при прочих равных» не
выполнялось. В частности, другая
потенциально важная переменная – число
кредитных учреждений – заметно изменялась
в течение этого периода. Когда эта важная
переменная была включена в регрессионный
анализ, мы пришли к противоположному
заключению. Выяснилось, как мы и
предполагали, что связь между прибылью
и процентом по депозиту – положительная,
если число кредитных учреждений
принимается в расчет.

Этот пример очень
хорошо иллюстрирует обсуждаемую
ситуацию. Если важная объясняющая
переменная не была включена в регрессионную
модель, любые заключения об эффекте
других независимых переменных могут
быть абсолютно ложными. В этом частном
случае мы видим, что добавление необходимой
переменной, может изменить связь от
существенной негативной на существенную
позитивную.

Дальнейшее
осмысление может быть достигнуто
проверкой исходных данных. Во второй
части периода годовой доход уменьшался,
а ставки депозитов росли, что предполагает
негативную связь между переменными.
Однако дальнейший взгляд в данные
обнаруживает рост числа кредитных
учреждений в этот период. Мы предполагали
возможность того, что этот фактор может
быть причиной уменьшения годового
дохода. Разумный путь выхода из запутанной
ситуации — разделение эффекта двух
независимых переменных на зависимую
переменную в модели с совместным их
влиянием в регрессионном уравнении.
Этот пример иллюстрирует важность
использования множественной регрессии
вместо парной в случае, когда изучаемое
явление существенно детерминирует
несколько независимых переменных.

Фиктивные
переменные в моделях множественной
регрессии

Как
известно, одним из условий, лежащих в
основе стандартных регрессионных
моделей, является то, что переменные
должны быть непрерывного типа. Значительная
часть переменных в социально-экономических
исследованиях таковыми не является.
Так, например, среди переменных, имеющих
значительное влияние на величину
заработной платы, мы анализируем пол,
образование, профессию и ряд других
переменных дискретного типа. Обойти
это препятствие в регрессионной модели
позволяет введение двоичных или, как
еще называют, фиктивных (dummy) переменных.
При введении таких переменных в модель
мы преобразуем их в атрибутивные и
присваиваем значение единицы в случае
наличия признака и нуля – при его
отсутствии.

Поясним
наш подход на следующем простом примере.
Пусть y_i
– заработная плата
i-го работника
(или функция от заработной платы), x_i
– пол работника. Предположим, что
заработная плата распределена согласно
нормальному закону с дисперсией ²
и средней ₀
в случае если работник — женщина, и ₁,
если работник — мужчина. Эта ситуация
описывается регрессионной моделью, в
которой зависимая переменная – заработная
плата (Y), а пол работника (X) – объясняющая
переменная.

(3.13),

где
,
если работник мужчина,

,
в других случаях,

 – случайная
переменная, удовлетворяющая основным
условиям классической нормальной
регрессионной модели.

Средняя
оценка y
корреспондирует
с двумя оценками x
так, что:

e(yx=0)
=,

e(yx=1)
=+.

Отсюда
=₀
и +=
₁или
=₁-₀.

Это
означает, что свободный член модели –
мера средней заработной платы при
условии, что работник – женщина, а
коэффициент 
– разница между заработной платой
мужчины и женщины.

Коэффициенты
регрессионного уравнения (3.13) оцениваются
методом наименьших квадратов. Напомним:

Пусть

— число мужчин в выборке,

—
число женщин.

—
средняя заработная плата мужчин,

—
средняя заработная плата женщин.

Тогда

Следовательно,

То
есть оценка МНК коэффициентов регрессии
равна разности между выборочной средней
заработной платой мужчин и женщин, а
свободный член, полученный МНК равен
средней заработной плате женщин. Проверка
гипотезы о равенстве
эквивалентна t-статистике о равенстве
двух средних.

Если
нам необходимо ввести в уравнение в
качестве объясняющей переменной
полихотомические характеристики такие,
например, как образование, профессия и
так далее, то необходимо каждую из
категорий преобразовать в двоичную
переменную. Например, если шкала видов
образования работника имеет следующие
характеристики: высшее, среднее и
неполное среднее, то необходимые для
модели двоичные переменные будут иметь
вид x_i1=1,
если работник имеет высшее образование,
и равна 0 во всех других случаях, x_i2=1,
если работник имеет среднее образование,
и равна 0 во всех других случаях, x_i₃=1,
если у работника неполное среднее
образование, равна 0 во всех других
случаях.

Обозначим
среднюю заработную плату работников с
различным типом образования ₁,
₂,
₃
соответственно. Подходящее регрессионное
уравнение может быть записано так:

y_i=₁+₂x_i2+₃x_i3+_i,
(3.14)

где
Y—
заработная плата.

Заметим,
что когда x_i2=0,
x_i3
должен быть равен 1 и наоборот. Средняя
оценка y_i
корреспондирует с различными оценками
регрессора как

e(y_i
x_i2=1,
x_i3=0)
= ₁+₂,

e(y_i
x_i2=0,
x_i3=1)
= ₁+₃,

e(y_i
x_i2=0,
x_i3=0)
= ₁.

Из этого следует,
что

₁=₁,

₂=₂-₁,

₃=₃-₁.

Такой результат
аналогичен полученному для дихотомической
переменной в уравнении (3.13). Модели,
описанные в уравнениях (3.13) и (3.14),
аналогичны моделям дисперсионного
анализа, но более компактны и легки в
интерпретации.

Модели
довольно просто расширить на случай
нескольких качественных объясняющих
переменных. Для пояснения воспользуемся
предыдущими переменными, описанными в
уравнениях (3.13) и (3.14). Предположим, что
заработная плата работника зависит не
только от его пола, но и от того какое
он имеет образование. Мы вновь допускаем,
что заработная плата – нормально
распределенная величина с дисперсией
²
и наблюдения независимы. Пусть:

_11

– средняя
заработная плата в случае, если работник
– мужчина с высшим образованием;

₁₀– средняя
заработная плата в случае, если работник
– женщина с высшим образованием;

₂₁– средняя
заработная плата в случае, если работник
– мужчина со средним образованием;

_20

– средняя
заработная плата в случае, если работник
– женщина со средним образованием;

_31

– средняя
заработная плата в случае, если работник
– мужчина с неполным средним образованием;

_30

– средняя
заработная плата в случае, если работник
– женщина с неполным средним образованием.

Регрессионная
модель формулируется так:

y_i=₁+₂x_i2+₃x_i3+z_i+_i,
(3.15)

где
y_i,
x_i2,
x_i3– определены
как в уравнениях (3.13) и (3.14), а z_i=1,
если работник мужчина, z_i=0,
если – женщина. Заметим вновь, что когда
x_i2=0,
то x_i3=1
и наоборот. Средние оценки y_i,
корреспондирующие с различными оценками
регрессора, следующие:

e(y_i
x_i2=1,
x_i3=0,
z_i=1)
= ₁+₂+,

e(y_i
x_i2=1,
x_i3=0,
z_i=1)
= ₁+₃+,

e(y_i
x_i2=1,
x_i3=0,
z_i=1)
= ₁+,

e(y_i
x_i2=1,
x_i3=0,
z_i=0)
= ₁+₂,

e(y_i
x_i2=1,
x_i3=0,
z_i=0)
= ₁+₃,

e(y_i
x_i2=1,
x_i3=0,
z_i=0)
= ₁.

Вследствие чего:

₁=
₁₀,

₂=
₂₀-₁₀
= ₂₁-₁₁,

₃=
₃₀-₁₀= ₃₁-₁₁,

 =
₁₁-₁₀= ₂₁-₂₀= ₃₁-₃₀.

Это
значит, что ₁
– мера средней заработной платы, если
работник – женщина с высшим образованием,
₂
– разница между средними заработками
в случае, если работник имеет высшее
или среднее образование независимо от
пола, ₃
– разница между средней заработной
платой в случае, если работник имеет
неполное среднее образование и если
работник с высшим образованием независимо
от пола, 
– разница между средними заработками
в зависимости от того мужчина это или
женщина.

Увеличение
числа объясняющих переменных не меняет
принципа интерпретации результатов
регрессионных моделей с двоичными
переменными. Необходимо лишь строго
соблюдать ряд правил. Так, мы не можем
представить трихотомическую переменную
тремя двоичными переменными, необходимо
использовать две переменные, иначе мы
пропустим константу в регрессионном
уравнении. Например, если мы запишем
уравнение (3.14) в виде:

y_i=₁+₂x_i2+₃x_i3+₄x_i4+_i,

где
x_i4=1,
если работник имеет высшее образование,
а x_i4=0
во всех других случаях, то решение для
b₁,
b₂,
b₃,
b₄будут
неопределенными. Причина этого в том,
что x_i4=1-x_i2—x_i3и система
нормальных уравнений не будет независима.
Таким образом, когда объясняющие
характеристики предполагают классификацию
по G типам,
мы используем (G-1)
двоичных переменных для их представления.

Следующее
обстоятельство связано с интерпретацией
эффекта двоичных переменных в
полулогарифмических уравнениях. Это
уравнения, зависимая переменная в
которых представлена в логарифмической
форме. Как правило, при оценке заработной
платы мы исходим из того, что она
подчиняются логарифмически-нормальному
распределению, поэтому во всех уравнениях
мы используем значение логарифма
заработной платы. Общая форма уравнения
может быть записана в следующем виде:

,
(3.16)

где
x_i
– представляет непрерывные (количественные)
переменные, а D_j
представляет двоичные переменные.
Коэффициенты количественных переменных:

(3.17)

Следовательно,
_i,
умноженное на сто, показывает на сколько
процентов изменяется y
при малых изменениях в x,
то есть интерпретируется как коэффициент
эластичности.

Поскольку
двоичные переменные входят в уравнение
в дихотомической форме, то производная
от зависимой переменной по отношению
к двоичной переменной не существует.
Подходящую интерпретацию коэффициента
двоичных переменных можно продемонстрировать
путем трансформации регрессионного
уравнения. Предположим для простоты,
что в уравнении одна двоичная переменная.
Уравнение запишется так:

где
g – относительный эффект присутствия
фактора, представленного двоичной
переменной. Тогда g=(y₁—y₀)/y₀,
где y₁
и y₀
– оценки зависимой переменной, когда
двоичная переменная равна 1 или 0
соответственно. Отсюда коэффициент при
двоичной переменной =Ln(1+g).
Относительный эффект на y:
g=exp()-1,
а процентный эффект: 100g=100(exp()-1).
Для малых g

приблизительно равно g.
Когда g
положительно, 
меньше, чем g,
а когда 
отрицательно, то 
алгебраически меньше, чем g,
но больше по абсолютной величине.

Модель множественной
регрессии может включать в себя и
переменные, называемые “интерактивными
терминами”. В предыдущем примере мы
обсуждали зависимость заработной платы
от пола и образования работника. Мы
условно предполагали, что средняя
заработная плата зависела от уровня
образования работника и его пола и что
разница между средней заработной платой
мужчин и женщин – одинакова для всех
уровней образования. Предположим, что
мы не уверены в правильности такого
допущения. Тогда регрессионная модель
(3.15) может быть модифицирована так:

(3.18),

где
все переменные определены как в (3.14).
Среднее значение ,
корреспондирующее с различными значениями
регрессора есть:

Это
означает, что мы можем определить
регрессионные коэффициенты в терминах
средней заработной платы следующим
образом:

₁=₁₀

₂=₂₀—₁₀

₃=₃₀—₁₀

=₁₁—₁₀

₂=(₃₁—₃₀)
–(₁₁—₀)

₃=(₂₁—₂₀)
–(₁₁—₀)

Различия
в средней заработной плате для мужчин
и женщин, имеющих различный уровень
образования составит:

Высшее образование	₁₁—₁₀=
Среднее образование	₂₁—₂₀=+₃
Не имеет среднего образования	₃₁—₃₀=+₂

В эконометрических
моделях не так часты ситуации, когда к
качестве объясняющих переменных
выступают только фиктивные или только
количественные переменные. Чаще в модели
присутствуют и те, и другие переменные.
Традиционный пример – функция потребления,
оцениваемая из данных, которые включают
различные периоды времени, например,
военное и мирное время. В этой модели
предполагается, что среднее потребление
зависит от дохода и от того какой период
мы рассматриваем: войну или мир. Простой
путь представления такой модели есть:

где
С представляет потребление, Y – доход,
а Z – фиктивная переменная, такая, что

Z_t
= 1, если период войны,

Z_t=
0, в другом случае.

Тогда мы имеем:

—
война,

—
мир.

Таким
образом, мы фактически постулируем, что
в военное время пересечение (свободный
член модели) функции потребления
изменяется от до
.
Графическая иллюстрация этого дана на
рисунке 9

Военное
время

Мирное
время

отребление

Доходы

Рис. 9

Если
представить свободный член модели как
прожиточный минимум, то эта модель
показывает, как прожиточный минимум
изменяется в период войны. Существенность
этих изменений можно проверить, выдвигая
гипотезу:

H₀:
=0

H₁:
0.

Эффект войны можно
учесть в функции потребления различно,
например, если мы постулируем, что
военные условия влияют на наклон линии
регрессии, но не на пересечение с функцией
потребления (то есть прожиточный
минимум). В соответствии с такой
теоретической формулировкой регрессионная
модель есть:

(3.19).

где переменные
определены так же. В этом случае мы
имеем:

—
война

—
мир.

Уравнение (3.19)
показывает, что эффект войны изменяет
предельную склонность к потреблению,
как показано на рисунке 10.

Военное время

отребление

Мирное
время

Доходы

Рис. 10

Это
значение может быть проверено при помощи
гипотезы о равенстве нулю .

Третья,
последняя возможность оценки различий
между потреблением в военное и мирное
время состоит в предположении, что и
свободный член и наклон линии регрессии
изменяются для военного времени.
Регрессионное уравнение примет вид:

(3.20).

Тогда имеем:

—
война

—
мир.

Эти
взаимоотношения иллюстрируются рисунком
11. Интересным в уравнении является то,
что оценка МНК регрессионных коэффициентов
совершенно та же как и те, что были бы
получены из двух отдельных регрессий
C_t
и Y_{t ,}
одна из которых получена для данных
военного времени, а другая для данных
мирного времени. Это можно доказать
путем преобразования формул МНК, но мы
не будем это делать. Разница в двух
подходах заключается только оценке
относительно .
Если мы предполагаем нормальное
распределение, то вариация не
изменяется в течение периода, тогда их
оценка из (3.19?) основанная на всех
наблюдениях, будет эффективной. Тогда
как две оценки, полученные из двух
различных подвыборок не будут таковыми.
Это происходит вследствие того, что
оценка
основана на любой повыборке и не
использует информацию о ,
содержащуюся в другой подвыборке.

Военное
время

Потребление

Мирное
время

Доходы



Источник

Возможные ошибки спецификации модели:

1. Неправильный выбор вида уравнения
регрессии

2. В уравнение регрессии включена лишняя
(незначимая) переменная

3. В уравнении регрессии пропущена
значимая переменная

Неправильный выбор вида функции в
уравнении

Пусть на первом этапе была сделана
спецификация модели в виде:

в
которой функция f_F(x,a₀,a₁)
выбрана не верно. Предположим, что
y_T=f_T(x,a₀,a₁)+v
– правильный вид функции регрессии.
Тогда справедливо выражение:

Из
выражения следует:

Иными словами, математические ожидания
эндогенной переменной, полученные с
помощью функций f_T
и f_F
не совпадают, т.е. первая предпосылка
теоремы Гаусса-Маркова M(ulx)=0
не выполняется

Следовательно, в результате оценивания
такой модели параметры а₀ и а₁
будут смещенными

Симптомы наличия ошибки спецификации
первого типа:

1. Несоответствие диаграммы рассеяния,
построенной по имеющейся выборке виду
функции, принятой в спецификации

2. В динамических моделях длительно
сохраняется знак значений оценок
случайных возмущений у смежных (по
номеру t ) уравнений
наблюдений

Именно этот симптом и улавливается
статистикой DW Дарбина–Уотсона!

В силу данного обстоятельства тесту
Дарбина–Уотсона в эконометрике придается
большое значение.

Способ устранения: выбор другой формы
спецификации модели. Например, нелинейная
вместо линейной и т.д.

2. В уравнение регрессии включена
лишняя переменная

Пусть
на этапе спецификации в модель включена
«лишняя» переменная, например, X₂

«Правильная»
спецификация должна иметь вид:

Последствия:

1.
Оценки параметров а₀, а₁, а₂останутся несмещенными, но потеряют
свою эффективность (точность)

2. Увеличивается ошибка прогноза по
модели

как за счет ошибок оценок коэффициентов
и σ_u,
так и за счет последнего слагаемого.
Это особенно опасно при больших абсолютных
значениях регрессора

Диагностика:

В моделях множественной регрессии
необходимо для каждого коэффициента
уравнения проверять статистическую
гипотезу H₀: a_i=0.
Вспомним, что для этого достаточно
оценить дробь Стьюдента и сравнить ее
значение с критическим значением
распределения Стьюдента, которое
вычисляется по значению доверительной
вероятности и значению степени свободы
n₂ = n – (k+1)

3.
В модели не достает важной переменной

Последствия такие же, как и в первом
случае: получаем смещенные оценки
параметров модели

Для устранения необходимо вернуться к
изучению особенностей поведения
экономического объекта, выявить опущенные
переменные и дополнить ими модель

29. Фиктивные переменные и особенности их использования в моделях.

На практике приходится учитывать в
моделях факторы, носящие качественный
характер, значения которых в наблюдениях
не возможно измерить с помощью числовой
шкалы.

Примеры.

Моделирование влияния пола специалистов
на уровень зарплаты.

Моделирование доходов граждан от типа
учебного заведения, в котором он получил
образование (государственное, частное,
специализированное,…)

Модель инфляции с учетом различных
видов регулирования со стороны государства

Возможны два подхода к решению задачи:

— построить несколько моделей отдельно
для каждого значения (градации)
качественной переменной

— учесть влияние качественного фактора
в одной модели

Второй способ представляется более
прогрессивным, т.к в этом случае появляется
возможность оценить статистическую
значимость влияния данного фактора на
поведение эндогенной переменной на
фоне других факторов, внесенных в
спецификацию модели

Пример. Изучается зависимость
расходов на образование «С» в «обычных»
и «специализированных» школах в
зависимости от числа учащихся N

Предположим:

Зависимость затрат на обучение от
количества учащихся N в
обоих типах школ одинакова

2. Разница в затратах объясняется
необходимостью приобретения
специализированного оборудования для
обучения специальным дисциплинам

Тогда если строить различные модели
для каждого типа школ, то спецификацию
моделей можно записать в виде:

Y^o
= a₀ +
a₁N +u

Y^s
= b₀ +
a₁N +
v

Обе
модели можно объединить, если ввести
переменную d, область
определения которой два целых числа :
0 и 1. При этом:

Спецификация такой модели имеет вид:

Y = a₀
+ a₁N
+ δd + u

Тогда при d=0 получим Y^o
= a₀ + a₁N
+ u

при d=1 получим Y^s
= (a₀+δ)
+a₁N +
v

d – фиктивная переменная
сдвига

Фиктивные переменные часто применяются
при построении динамических моделей,
когда с определенного момента времени
начинает действовать какой-либо
качественный фактор

Пусть некоторый качественный фактор
имеет несколько градаций (более 2-х)

Введение в модель фиктивных переменных
с несколькими градациями рассмотрим
на примере шанхайских школ, где имеются
4 категории школ: общеобразовательные,
технические, ПТУ и специализированные

Казалось достаточно ввести фиктивную
переменную сдвига d, придав
ей четыре различных значения и проблема
будет решена

Такой подход мало эффективен, т.к не
удается оценить статистическую значимость
влияния каждой градации на значения
эндогенной переменной

В этом случае имеет смысл ввести отдельную
переменную для каждой градации фактора

Например:

Однако, если взять спецификацию модели
в виде:

Y=a₀
+ a₁d₁+a₂d₂+a₃d₃+a₄d₄+a₅N+u

при этом всегда верно тождество
d₁+d₂+d₃+d₄=1

Это означает, что матрица Х коэффициентов
системы уравнений наблюдений будет
коллинеарной т.к в ней присутствует
столбец из 1, и как следствие отсутствует
возможность применения МНК для оценки
параметров модели.

Предлагается в спецификацию ввести
(к-1) фиктивную переменную (к- кол-во
градаций), сделав одну из градаций
базовой, относительно которой изучать
влияние остальных градаций. Проблемы
мультиколинеарности в этом случае не
возникает

Для учета возможного изменения наклона
графика модели при изменении градации
качественного фактора предлагается
ввести в спецификацию модели еще одно
слагаемое вида «d умноженное
на x»

Вернемся к примеру изучения зависимости
расходов на образование в различных
школах. Для простоты ограничимся лишь
двумя градациями фактора «тип школы»:
d=0 – обычная школа;

d=1 – профессиональная
школа

Спецификацию модели следует записать
в виде:

Y = a₀
+ a₁N
+ a₂*d
+ a₃dN
+U

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

анастасия александровна янченко

Эксперт по предмету «Эконометрика»

Задать вопрос автору статьи

Проблема спецификации эконометрической модели

Проблема спецификации эконометрической модели предполагает определение:

конечной цели моделирования;
набора эндогенных и экзогенных переменных;
состава и структуры системы уравнений, набора переменных;
первоначальных ограничений стохастических составляющих.

Спецификация в эконометрике является важнейшим этапом исследования, эффективность решения влияет на успех исследования в целом. В основе спецификации — имеющиеся теории, интуиция и специальные знания.

Проблема идентифицируемости

В эконометрике проблема идентифицируемости сводится к следующему: нас интересует такие эндогенные переменные, которые относятся к случайным величинам.

Уравнение структурной формы является точно идентифицируемым тогда, когда каждый участвующий неизвестный коэффициент однозначно восстанавливается по коэффициентам приведенной формы, не ограничивая значения последних.

Учим создавать игры

Создавай 3D-графику и концепты, придумывай персонажей, учись программировать с нуля

Записаться на курс

Определение 1

Эконометрическую модель можно назвать точно идентифицируемой, если каждое уравнение ее структурной формы является точно идентифицируемым.

Если какой-либо коэффициент не может быть восстановлен, не идентифицируемо и уравнение, и модель. Проблемы идентификации сводятся к «настройкам» модели по реальным статистическим данным.

Проблема верификации

Замечание 1

Проблема верификации применительно к эконометрическим моделям заключается в разрешении вопросов относительно возможностей использования модели.

Иными словами эта проблема сводится к точности имитационных и прогнозных расчетов. Верификация подразумевает статистическую проверку гипотез и анализ параметров точности оценки. Зачастую применяется ретроспективный расчет: исходные данные делятся на части: обучающая выборка и экзаменующая выборка.

«Проблемы эконометрики» 👇

Обучающая выборка позволяет определить значения неизвестных параметров и получить модельные значения для экзаменующей выборки, которые затем подлежат сравнению с реальными значениями.

Недостаточный набор данных

Замечание 2

Проблема недостаточности данных заключается в том, что имеющиеся данные могут быть недостаточны для определения функциональной связи между переменными, или они мало варьируются для выявления отличий влияния одних факторов от влияния других.

Последнюю проблему в эконометрическом моделировании часто называют «мультиколлинеарностью».

В отличие от экспериментальной науки, отдельный исследователь, изучающий экономические процессы обычно не имеет возможности заметно повлиять на них.

Для восполнения недостатка данных, исследователь должен принимать определенные априорные допущения, которые часто могут быть недостаточно обоснованными.

Обычно функциональная форма эконометрической модели неизвестна заранее. В таком случае целесообразно использовать непараметрические методы оценивания. Но применение подобных методов требует достаточно значительного набора данных. На практике поэтому, как правило, предполагается, что зависимость двумя переменных линейна. Это связано с тем, что линейная зависимость подразумевает хороший уровень аппроксимации гладкой зависимости в определенной окрестности. Однако нет никаких гарантий, что истинная зависимость не будет нелинейной в интервале, к которому отнесены данные.

В случае применении методов эконометрики следует понимать, что обычно постулируемые свойства имеют асимптотический характер, или проявляются при стремлении числа наблюдений к бесконечности. Например, если линейная регрессия подразумевает использование в качестве регрессоров лагов (запаздывания) зависимых переменных, то, даже при выполнении стандартных предположений регрессионного анализа, итоговые оценки будут смещенными, но состоятельными.

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Шпоры по эконометрике.

№ 1. СПЕЦИФИКАЦИЯ МОДЕЛИ

Простая регрессия представляет собой регрессию между двумя переменными у и х, т.е. модель вида , где у результативный признак; х — признак-фактор.

Множественная регрессия представляет собой регрессию результативного признака с двумя и большим числом факторов, т. е. модель вида

Спецификация модели — формулировка вида модели, исходя из соответствующей теории связи между переменными. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. где yj фактическое значение результативного признака;

yxj -теоретическое значение результативного признака.

случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.

Случайная величина ε называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения.

От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака подходят к фактическим данным у.

К ошибкам спецификации относятся неправильный выбор той или иной математической функции для, и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной.

Ошибки выборки — исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками.

Ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.

В парной регрессии выбор вида математической функции может быть осуществлен тремя методами: графическим, аналитическим и экспериментальным.

Графический метод основан на поле корреляции. Аналитический метод основан на изучении материальной природы связи исследуемых признаков.

Экспериментальный метод осуществляется путем сравнения величины остаточной дисперсии Dост, рассчитанной при разных моделях. Если фактические значения результативного признака совпадают с теоретическими у =, то Docm =0. Если имеют место отклонения фактических данных от теоретических (у ) то .

Чем меньше величина остаточной дисперсии, тем лучше уравнение регрессии подходит к исходным данным. Число наблюдений должно в 6 7 раз превышать число рассчитываемых параметров при переменной х.

№ 2 ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ: СМЫСЛ И ОЦЕНКА ПАРАМЕТРОВ.

Линейная регрессия сводится к нахождению уравнения вида или .

Уравнение вида позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора х.

Построение линейной регрессии сводится к оценке ее параметров а и в.

Оценки параметров линейной регрессии могут быть найдены разными методами.

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу.

Формально а значение у при х = 0. Если признак-фактор
не имеет и не может иметь нулевого значения, то вышеуказанная
трактовка свободного члена, а не имеет смысла. Параметр, а может
не иметь экономического содержания. Попытки экономически
интерпретировать параметр, а могут привести к абсурду, особенно при а < 0.

Интерпретировать можно лишь знак при параметре а. Если а > 0, то относительное изменение результата происходит медленнее, чем изменение фактора.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существуют разные модификации формулы линейного коэффициента корреляции.

Линейный коэффициент корреляции находится и границах: -1≤.rxy ≤ 1. При этом чем ближе r к 0 тем слабее корреляция и наоборот чем ближе r к 1 или -1, тем сильнее корреляция, т.е. зависимость х и у близка к линейной. Если r в точности =1или -1 все точки лежат на одной прямой. Если коэф. регрессии b>0 то 0 ≤.rxy ≤ 1 и наоборот при b<0 -1≤.rxy ≤0. Коэф. корреляции отражает степени линейной зависимости м/у величинами при наличии ярко выраженной зависимости др. вида.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака y, объясняемую регрессией. Соответствующая величина характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.

№ 3. МНК.

МНК позволяет получить такие оценки параметров а и b, которых сумма квадратов отклонений фактических значений результативного признака (у) от расчетных (теоретических) минимальна:

Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной. Решается система нормальных уравнений

№ 4. ОЦЕНКА СУЩЕСТВЕННОСТИ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ И КОРРЕЛЯЦИИ.

Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т. е. b = 0, и следовательно, фактор х не оказывает влияния на результат у.

Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от средне го значения у на две части — «объясненную» и «необъясненную»:

— общая сумма квадратов отклонений

— сумма квадратов отклонения объясненная регрессией — остаточная сумма квадратов отклонения.

Любая сумма квадратов отклонений связана с числом степеней свободы, т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности nис числом определяемых по ней констант. Применительно к исследуемой проблеме число cтепеней свободы должно показать, сколько независимых отклонений из п возможных требуется для образования данной суммы квадратов.

Дисперсия на одну степень свободы D.

F-отношения (F-критерий):

Ecли нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным, если о больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: Fфакт > Fтабл Н0 отклоняется.

Если же величина окажется меньше табличной Fфакт ‹, Fтабл , то вероятность нулевой гипотезы выше заданного уровня и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Но не отклоняется.

Стандартная ошибка коэффициента регрессии

Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t-критерия Стьюдентa: которое

затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы (n- 2).

Стандартная ошибка параметра а:

Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции тr:

Общая дисперсия признака х:

Коэф. регрессии Его величина показывает ср. изменение результата с изменением фактора на 1 ед.

Ошибка аппроксимации:

№ 5. ИНТЕРВАЛЫ ПРОГНОЗА ПО ЛИНЕЙНОМУ УРАВНЕНИЮ

РЕГРЕССИИ

Оценка стат. значимости параметров регрессии проводится с помощью t статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигается гипотеза Н0 о статистически значимом отличие показателей от 0 a = b = r = 0. Рассчитываются стандартные ошибки параметров a,b, r и фактич. знач. t критерия Стьюдента.

Определяется стат. значимость параметров.

ta ›Tтабл — a стат. значим

tb ›Tтабл — b стат. значим

Находятся границы доверительных интервалов.

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что п

Источник

Тема 2: Отбор факторов, включаемых в модель множественной регрессии

Тема 1: Спецификация эконометрической модели

1. Ошибки спецификации эконометрической модели имеют место вследствие …

неправильного выбора математической функции или недоучета в уравнении регрессии какого-то существенного фактора

недостоверности или недостаточности исходной информации

неоднородности данных в исходной статистической совокупности

недостаточного количества данных

Решение:

Спецификацией модели называется отбор факторов, включаемых в модель, и выбор математической функции для . Поэтому к ошибкам спецификации относятся не только неправильный выбор той или иной математической функции для , но и недоучет в уравнении регрессии какого-то существенного фактора, то есть использование парной регрессии вместо множественной.

2. Для регрессионной модели вида необходим минимальный объем наблюдений, содержащий _____ объектов наблюдения.

Решение:

Считается, на каждый оцениваемый коэффициент регрессии необходимо не менее 5–7 объектов статистических наблюдений. Так как представленная модель содержит 3 независимые переменные, то на каждый из параметров регрессии при независимой переменной необходимо по 5–7 наблюдений, то есть в совокупности не менее 15–21 наблюдения. Берем нижнюю границу интервала, тогда правильный вариант ответа – «15».

3. Нелинейным по объясняющим переменным, но линейным по параметрам уравнением регрессии является …

Решение:

Из приведенных функций только в функции параметры имеют степень 1, а объясняющая переменная х имеет степень, отличную от 1.

4. В модели вида количество объясняющих переменных равно …

Решение:

Эконометрическая модель уравнения регрессии может быть представлена линейным уравнением множественной регрессии в виде выражения , где y – зависимая переменная; x_j – объясняющая независимая переменная (j = 1,…, k; k – количество независимых переменных); a, b_j – параметры (a – свободный член уравнения, b_j – коэффициент регрессии); – случайные факторы. Независимые переменные x_j называются также факторами, объясняющими переменными. На количество объясняющих переменных в линейном уравнении указывает также количество коэффициентов регрессии b_j. Поэтому количество объясняющих переменных в модели равно 3.

5. При идентификации модели множественной регрессии количество оцениваемых параметров равно …

Решение:

При оценке модели множественной регрессии рассчитываются следующие параметры: свободный член a и четыре параметра при независимых переменных х. Итого 5 параметров.

Тема 2: Отбор факторов, включаемых в модель множественной регрессии

1. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к единице. Это означает, что факторы , и …

Решение:

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если факторы не коррелированы между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной. Поскольку все недиагональные элементы были бы равны нулю.
, поскольку = = и = = =0.
Если между факторами существует полная линейная зависимость и все коэффициенты парной корреляции равны единице, то определитель такой матрицы равен нулю.

Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

2. При моделировании линейного уравнения множественной регрессии вида необходимо, чтобы выполнялось требование отсутствия взаимосвязи между …

Решение:

Эконометрическая модель уравнения регрессии может быть представлена линейным уравнением множественной регрессии в виде выражения , где y – зависимая переменная; x_j – независимая переменная (j = 1,…, k; k – количество независимых переменных); a, b_j – параметры (a – свободный член уравнения, b_j – коэффициент регрессии); – случайные факторы. При построении модели множественной регрессии необходимо исключить возможность существования тесной линейной зависимости между независимыми (объясняющими) переменными, которая ведет к проблеме мультиколлинеарности. Поэтому в данной модели необходимо, чтобы выполнялось требование отсутствия взаимосвязи между x₁ и x₂.

Ошибка спецификации эконометрической модели уравнения регрессии

Ошибка спецификации

К ошибкам спецификации будут относиться не только неправильный выбор той или иной математической функции для ух, но и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной. Так, спрос на конкретный товар может определяться не только ценой, но и доходом на душу населения. [c.36]

Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики. [c.36]

Наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки — увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Особенно велика роль ошибок измерения при ис- [c.36]

Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели. [c.37]

В чем состоят ошибки спецификации модели [c.88]

Под системой эконометрических уравнений обычно понимается система одновременных, совместных уравнений. Ее применение имеет ряд сложностей, которые связаны с ошибками спецификации модели. Ввиду большого числа факторов, влияющих на экономические переменные, исследователь, как правило, не уверен в точности предлагаемой модели для описания экономических процессов. Набор эндогенных и экзогенных переменных модели соответствует теоретическому представлению исследователя о [c.204]

Иллюстрация возможного появления ошибки спецификации приводится на рис. 5.4. [c.239]

Рис. 5.4. Ошибка спецификации при выборе уравнения тренда

Ошибкой спецификации называются неправильный выбор типа связей и соотношений между элементами модели, а также выбор в качестве существенных таких переменных и параметров, которые на самом деле таковыми не являются, и наконец, отсутствие в модели некоторых существенных переменных. [c.338]

Следовательно, шаг 4 заключается в вычислении (50), (53), (59) — (60). Таким образом, для регрессионных уравнений первого порядка с запаздывающей переменной продолжение итеративного процесса от первичных обобщенных оценок наименьших квадратов приводит к асимптотическим оценкам наибольшего правдоподобия, а последующее применение техники оценки ошибки спецификации дает возможность получить оценки и доверительные интервалы прогноза также и при наличии ошибок в переменных. [c.80]

Даже если бы удалось получить программы, свободные от ошибок, то возникает необходимость учитывать некоторый переходный период, в течение которого структура системы не должна основываться на предположении об отсутствии ошибок в отдельных модулях, но должна допускать возможность неправильного функционирования компонентов ПО вследствие внутренней ошибки. Спецификации модуля должны закреплять за каждым из них функцию выполнения определенных проверок модулей, с которыми последний взаимодействует. Кроме того, если даже ПО было написано корректно, более ранние ошибки оборудования могли сделать его некорректным. [c.15]

Оценки с ограниченной информацией оказываются более устойчивыми к ошибкам спецификации модели. Наоборот, оценки с полной информацией весьма чувствительно реагируют на изменения структуры. [c.424]

Какие ошибки спецификации встречаются, и каковы последствия данных ошибок [c.190]

Как обнаружить ошибку спецификации [c.190]

Каким образом можно исправить ошибку спецификации и перейти к лучшей (качественной) модели [c.190]

Неправильный выбор функциональной формы или набора объясняющих переменных называется ошибками спецификации. Рассмотрим основные типы ошибок спецификации. [c.192]

При построении уравнений регрессии, особенно на начальных этапах, ошибки спецификации весьма нередки. Они допускаются обычно из-за поверхностных знаний об исследуемых экономических процессах, либо из-за недостаточно глубоко проработанной теории, или из-за погрешностей при сборе и обработке статистических данных при построении эмпирического уравнения регрессии. Важно уметь [c.195]

Как можно обнаружить ошибки спецификации [c.202]

Можно ли обнаружить ошибки спецификации с помощью исследования остаточного члена [c.202]

Совершается ли при этом ошибка спецификации Если да, то каковы ее последствия Что можно сказать, если указанные модели поменять ролями [c.203]

Совершается ли при этом ошибка спецификации и каковы ее последствия [c.203]

Среди основных причин, вызывающих появление автокорреляции, можно выделить ошибки спецификации, инерцию в изменении экономических показателей, эффект паутины, сглаживание данных. [c.228]

Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводит к системным отклонениям точек наблюдений от линии регрессии, что может привести к автокорреляции. [c.228]

PiQ + выбрать линейную модель МС = ро + PiQ + s, то совершается ошибка спецификации. Ее можно рассматривать как неправильный выбор формы модели или как отбрасывание значимой переменной при линеаризации указанных моделей. Последствия данной ошибки выразятся в системном отклонении точек наблюдений от прямой регрессии (рис. 9.3) и существенном преобладании последовательных отклонений одинакового знака над соседними отклонениями противоположных знаков. Налицо типичная картина, характерная для положительной автокорреляции. [c.228]

Однако необходима определенная осмотрительность при применении данного метода. В этой ситуации возможны ошибки спецификации. Например, при исследовании спроса на некоторое благо в качестве объясняющих переменных можно использовать цену данного блага и цены заменителей данного блага, которые зачастую коррелируют друг с другом. Исключив из модели цены заменителей, мы, скорее всего, допустим ошибку спецификации. Вследствие этого возможно получение смещенных оценок и осуществление необоснованных выводов. Таким образом, в прикладных эконометрических моделях желательно не исключать объясняющие переменные до тех пор, пока коллинеарность не станет серьезной проблемой. [c.252]

Выбор правильной формы модели регрессии является в данной ситуации достаточно серьезной проблемой, т. к. в этом случае вполне вероятны ошибки спецификации. Наиболее рациональной практической стратегией выбора модели является следующая схема. [c.267]

Однако применение этого метода весьма ограничено в силу постоянно уменьшающегося числа степеней свободы, сопровождающегося увеличением стандартных ошибок и ухудшением качества оценок, а также возможности мультиколлинеарности. Кроме этого, при неправильном определении количества лагов возможны ошибки спецификации. [c.279]

Мы видим, что квадраты остатков регрессии е2, которыми оперируют тесты на гетероскедастичность, зависят от значения переменной xt, и, соответственно, тесты отвергают гипотезу гомоскедастичности, что в данном случае является следствием ошибки спецификации модели. [c.181]

Теперь оба коэффициента значимо отличаются от нуля и имеют правильные знаки . Тест Уайта показывает отсутствие гетероскедастичности. Из последнего уравнения можно также получить, что возраст, при котором достигается максимальная зарплата, равен примерно 54 годам, что согласуется со здравым смыслом. По-видимому следует заключить, что в первом уравнении результат теста указывал на ошибку спецификации. Пример показывает, что при эконометрическом анализе полезна любая дополнительная информация (в нашем случае — механизм формирования зарплаты). [c.183]

Следовательно, влияние ошибочной спецификации на смещение и среднеквадратичное отклонение оценки ш /З проявляется через величину с /ф2 72> которая, конечно, неизвестна. Заметим, что абсолютная величина смещения оценки и ее среднеквадратичное отклонение в результате ошибки спецификации могут как возрасти, так и уменьшиться. [c.430]

Другой важный вопрос связан с устойчивостью оценок по отношению к ошибкам спецификации, т. е. к неправильно выбранной форме связи, автокоррелированности или гетеро-скедастичности отклонений, нарушениям гипотезы о нормальности возмущений и т. д. [c.423]

Совершается ли ошибка спецификации при использовании следующей ре грессии [c.203]

Из таблицы видно, что коэффициенты при интересующих нас переменных AGE и AGE2 не значимы. Тест Уайта показывает наличие гетероскедастичности. Прежде чем начать коррекцию гетероскедастичности, вспомним, что тест может давать такой результат при ошибке спецификации функциональной формы. В самом деле, поскольку, как правило, все надбавки к зарплате формулируются в мультипликативной форме ( увеличение на 5% ), то более естественно взять в качестве зависимой переменной логарифм зарплаты InW. Результаты регрессии In W на остальные переменные приведены в таблице 6.4. [c.183]

Этот разрыв между теорией и практикой имеет довольно интересные последствия. Одно из них то, что прикладные эконо-метристы чувствуют необходимость проверки гипотез, потому что они проходили курс Теория эконометрики и хотят использовать свои знания. Однако они редко могут объяснить, почему они тестируют конкретную гипотезу, скажем, однородность или выпуклость. Если гипотеза отклоняется, как и происходит в большинстве случаев, они видят в этом свидетельство ошибки спецификации. Зачем же тогда проводить тестирование, если его логические следствия игнорируются Размышление о последствиях тестирования перед его выполнением было бы разумным, но редко встречается в эконометрической практике. [c.477]

В этой книге мы будем различать понятия спецификация ошибки i ошибка спецификации. Первое понятие относится к выбору неко-горого типа ошибок при спецификацииУмодели, подлежащей оцени-занию, а второе понятие означает, властности, ошибку спецификации матрицы X1. Предположим, как обычно, что истинная модель шеет вид [c.168]

Рассмотрим оценку Ъг параметра 32, полученную простой регрес сией у на xz на основе таблицы, построенной в результате классифи кации данных по переменной Xz, и оценку Ь3 параметра р3, получен ную в результате простой регрессии у на ха на основе таблицы, соот ветствующей классификации по Xs. Обе оценки окажутся смещенными поскольку в каждом случае допущена ошибка спецификации из-з исключения из регрессии существенной переменной. Поэтому [c.234]

Любое ранжирование остальных четырех методов должно рассматриваться как пробное. Первым рассмотрим наименее противоречивый случай. В экспериментах, содержащих ошибку спецификации, двухшаговый метод наименьших квадратов показывает заметно худшие результаты по сравнению с остальными тремя методами, если предопределенные переменные не сильно коррелированы друг с другом, и его качества становятся относительно лучшими, когда такая корреляция присутствует. В итоге представляется правильным присвоение этому методу наименьшего рангового значения. Неожиданно метод максимального правдоподобия с полной информацией оказался лучше других. Можно было ожидать, что он более других методов пострадает от ошибочной спецификации. Конечно, для достаточно больших значений у21 это вполне может произойти. Также неожиданным оказалось и то, что метод наименьших квадратов, без ограничений не проявил себя в этих экспериментах. Это произошло потому, что при работе с малыми выборками использование априорной информации «о модели, которое достигается с помощью метода максимального правдоподобия с полной информацией и метода ограниченной информации для отдельного урав нения, дает больший вклад в качество оценок, чем уменьшение ошибок спецификации этой модели. Метод наименьших квадратов без ограничений не введен нас в заблуждение из-за неправильных ограничений на элементы матрицы П, не в то же время он не способен воспринять верные ограничения. В результате ov. не выдерживает конкуренции с двумя методами, использующими априорнук информацию, когда степень неточности ограничений не очень велика. [c.422]

Смотреть страницы где упоминается термин Ошибка спецификации

Экономико-математический словарь Изд.5 (2003) — [ c.338 ]

Тема 1 Спецификация эконометрической модели Ошибки спецификации эконометрической модели имеют место вследствие

Название	Тема 1 Спецификация эконометрической модели Ошибки спецификации эконометрической модели имеют место вследствие
Дата	02.02.2019
Размер	1.2 Mb.
Формат файла
Имя файла	Baza_po_ekonometrike.doc
Тип	Документы #66133
страница	1 из 4

Подборка по базе: Биология тема 13.docx, КР Моделирование.docx, 4 тема.docx, ВКР тема 7.docx, 6 Тема занятия «Практикум по разработке учебных заданий для форм, LAB моделирование роботов.docx, Военная топография Тема 1 Занятие 1.docx, уэф тема 2.pptx, Задания для практического занятия. Тема 2.pdf, Представлен основной учебный материал по темам.docx

1. Ошибки спецификации эконометрической модели имеют место вследствие …

неправильного выбора математической функции или недоучета в уравнении регрессии какого-то существенного фактора
2. Для регрессионной модели вида необходим минимальный объем наблюдений, содержащий _____ объектов наблюдения.

3. Нелинейным по объясняющим переменным, но линейным по параметрам уравнением регрессии является …

4. В модели вида количество объясняющих переменных равно …

5. При идентификации модели множественной регрессии количество оцениваемых параметров равно …

Тема 2: Отбор факторов, включаемых в модель множественной регрессии

3. Дана матрица парных коэффициентов корреляции.

Коллинеарными являются факторы …

и
4. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к нулю. Это означает, что факторы , и …

5. Для эконометрической модели линейного уравнения множественной регрессии вида построена матрица парных коэффициентов линейной корреляции (y – зависимая переменная; х (1) , х (2) , х (3) , x (4) – независимые переменные):

Коллинеарными (тесно связанными) независимыми (объясняющими) переменными не являются …

Тема 3: Фиктивные переменные

1. Дана таблица исходных данных для построения эконометрической регрессионной модели:

Фиктивными переменными не являются …

2. При исследовании зависимости потребления мяса от уровня дохода и пола потребителя можно рекомендовать …

использовать фиктивную переменную – пол потребителя

разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола

3. Изучается зависимость цены квартиры (у) от ее жилой площади (х) и типа дома. В модель включены фиктивные переменные, отражающие рассматриваемые типы домов: монолитный, панельный, кирпичный. Получено уравнение регрессии: ,
где ,
Частными уравнениями регрессии для кирпичного и монолитного являются …

для типа дома кирпичный

для типа дома монолитный

для типа дома кирпичный

для типа дома монолитный

Требуется узнать частное уравнение регрессии для кирпичного и монолитного домов. Для кирпичного дома значения фиктивных переменных следующие , . Уравнение примет вид: или для типа дома кирпичный.
Для монолитного дома значения фиктивных переменных следующие , . Уравнение примет вид
или для типа дома монолитный.

4. При анализе промышленных предприятий в трех регионах (Республика Марий Эл, Республика Чувашия, Республика Татарстан) были построены три частных уравнения регрессии:

для Республики Марий Эл;

для Республики Чувашия;

для Республики Татарстан.

Укажите вид фиктивных переменных и уравнение с фиктивными переменными, обобщающее три частных уравнения регрессии.

Итоговое уравнение будет

5. В эконометрике фиктивной переменной принято считать …

переменную, принимающую значения 0 и 1

Тема 4: Линейное уравнение множественной регрессии

1. Для регрессионной модели зависимости среднедушевого денежного дохода населения (руб., у) от объема валового регионального продукта (тыс. р., х₁) и уровня безработицы в субъекте (%, х₂) получено уравнение . Величина коэффициента регрессии при переменной х₂ свидетельствует о том, что при изменении уровня безработицы на 1% среднедушевой денежный доход ______ рубля при неизменной величине валового регионального продукта.

2. В уравнении линейной множественной регрессии: , где – стоимость основных фондов (тыс. руб.); – численность занятых (тыс. чел.); y – объем промышленного производства (тыс. руб.) параметр при переменной х₁, равный 10,8, означает, что при увеличении объема основных фондов на _____ объем промышленного производства _____ при постоянной численности занятых.

на 1 тыс. руб. … увеличится на 10,8 тыс. руб.
3. Известно, что доля остаточной дисперсии зависимой переменной в ее общей дисперсии равна 0,2. Тогда значение коэффициента детерминации составляет …

4. Построена эконометрическая модель для зависимости прибыли от реализации единицы продукции (руб., у) от величины оборотных средств предприятия (тыс. р., х₁): . Следовательно, средний размер прибыли от реализации, не зависящий от объема оборотных средств предприятия, составляет _____ рубля.

5. F-статистика рассчитывается как отношение ______ дисперсии к ________ дисперсии, рассчитанных на одну степень свободы.

Тема 5: Оценка параметров линейных уравнений регрессии

1. Для эконометрической модели уравнения регрессии ошибка модели определяется как ______ между фактическим значением зависимой переменной и ее расчетным значением.

3. В эконометрической модели уравнения регрессии величина отклонения фактического значения зависимой переменной от ее расчетного значения характеризует …

4. Известно, что доля объясненной дисперсии в общей дисперсии равна 0,2. Тогда значение коэффициента детерминации составляет …

0,2
5. При методе наименьших квадратов параметры уравнения парной линейной регрессии определяются из условия ______ остатков .

минимизации суммы квадратов

1. Для обнаружения автокорреляции в остатках используется …

статистика Дарбина – Уотсона

критерий Гольдфельда – Квандта

2. Известно, что коэффициент автокорреляции остатков первого порядка равен –0,3. Также даны критические значения статистики Дарбина – Уотсона для заданного количества параметров при неизвестном и количестве наблюдений , . По данным характеристикам можно сделать вывод о том, что …

автокорреляция остатков отсутствует

3. Значение критерия Дарбина – Уотсона можно приблизительно рассчитать по формуле , где – значение коэффициента автокорреляции остатков модели. Минимальная величина значения будет наблюдаться при ________ автокорреляции остатков.

4. Из перечисленного условием выполнения предпосылок метода наименьших квадратов не является ____ остатков.

5. Значение критерия Дарбина – Уотсона можно приблизительно рассчитать по формуле , где – значение коэффициента автокорреляции остатков модели. Максимальная величина значения будет наблюдаться при ________ автокорреляции остатков.

Тема 7: Свойства оценок параметров эконометрической модели, получаемых при помощи МНК

1. Пусть – оценка параметра регрессионной модели, полученная с помощью метода наименьших квадратов; – математическое ожидание оценки . В том случае если , то оценка обладает свойством …

2. Из несмещенности оценки параметра следует, что среднее значение остатков равно …

3. Несмещенность оценок параметров регрессии означает, что …
математическое ожидание остатков равно нулю

4. Если оценка параметра является смещенной, то нарушается предпосылка метода наименьших квадратов о _________ остатков.

нулевой средней величине
5. Состоятельность оценок параметров регрессии означает, что …

точность оценок выборки увеличивается с увеличением объема выборки
Тема 8: Обобщенный метод наименьших квадратов (ОМНК)

1. В случае нарушений предпосылок метода наименьших квадратов применяют обобщенный метод наименьших квадратов, который используется для оценки параметров линейных регрессионных моделей с __________ остатками.

автокоррелированными и/или гетероскедастичными

2. При нарушении гомоскедастичности остатков и наличии автокорреляции остатков рекомендуется применять _____________ метод наименьших квадратов.

3. Пусть y – издержки производства, – объем продукции, – основные производственные фонды, – численность работников. Известно, что в уравнении дисперсии остатков пропорциональны квадрату численности работников .После применения обобщенного метода наименьших квадратов новая модель приняла вид . Тогда параметр в новом уравнении характеризует среднее изменение затрат …

на работника при увеличении производительности труда на единицу при неизменном уровне фондовооруженности труда

4. Обобщенный метод наименьших квадратов не может применяться для оценки параметров линейных регрессионных моделей в случае, если …

средняя величина остатков не равна нулю

5. Пусть y – издержки производства, – объем продукции, – основные производственные фонды, – численность работников. Известно, что в уравнении дисперсии остатков пропорциональны квадрату объема продукции .Применим обобщенный метод наименьших квадратов, поделив обе части уравнения на После применения обобщенного метода наименьших квадратов новая модель приняла вид . Тогда параметр в новом уравнении характеризует среднее изменение затрат на единицу продукции при увеличении …

1. Для эконометрической модели вида показателем тесноты связи между переменными и является парный коэффициент линейной …

2. Самым коротким интервалом изменения коэффициента корреляции для уравнения парной линейной регрессии является …

3. Самым коротким интервалом изменения показателя множественной корреляции для уравнения множественной линейной регрессии , если известны парные коэффициенты корреляции , является интервал …

4. Для регрессионной модели вида получена диаграмма

Такое графическое отображение называется …

Тема 10: Оценка качества подбора уравнения

1. Известно, что доля остаточной регрессии в общей составила 0,19. Тогда значение коэффициента корреляции равно …

0,9
2. Известно, что общая сумма квадратов отклонений , а остаточная сумма квадратов отклонений, . Тогда значение коэффициента детерминации равно …

3. Для регрессионной модели вида , где рассчитаны дисперсии: ; ; . Тогда величина характеризует долю …

остаточной дисперсии
4. Если общая сумма квадратов отклонений , и остаточная сумма квадратов отклонений , то сумма квадратов отклонений, объясненная регрессией, равна …

источники:

http://economy-ru.info/info/15273/

http://topuch.ru/tema-1-specifikaciya-ekonometricheskoj-modeli-oshibki-specifik-v2/index.html

Источник

Ошибкой спецификации эконометрической модели уравнения регрессии является …

расчет показателей качества модели
использование парной регрессии вместо множественной
учет случайных факторов
оценка параметров при помощи МНК

Тип вопроса: Вопрос с одним правильными вариантом

Ответ на этот вопрос уже получили: 288 раз(а)

Помогли ответы? Ставь лайк 👍

Вопрос задал(а): Анонимный пользователь, 09 Январь 2017 в 20:42
На вопрос ответил(а): Астафьева Любовь, 09 Январь 2017 в 20:42

Источник

29. Фиктивные переменные и особенности их использования в моделях.

Проблема спецификации эконометрической модели

Проблема идентифицируемости

Проблема верификации

Недостаточный набор данных

Тема 2: Отбор факторов, включаемых в модель множественной регрессии

Ошибка спецификации эконометрической модели уравнения регрессии

Ошибка спецификации

Смотреть страницы где упоминается термин Ошибка спецификации

Тема 1 Спецификация эконометрической модели Ошибки спецификации эконометрической модели имеют место вследствие

Не пропустите эти материалы по теме: