Учебник+

7.3. Эндогенность из-за двусторонней причинно-следственной связи

Следующая важная ситуация, которая приводит к эндогенности — одновременная причинно-следственная связь (её также называют двусторонней или двунаправленной).

Снова воспользуемся примером. Представим, что нас интересует, насколько эффективно работает полиция в некотором городе. Мы полагаем, что увеличение числа полицейских в определенном районе должно приводить к уменьшению числа преступлений в этом районе:

\(y_{i} = \beta_{1} + \beta_{2}*x_{i} + \varepsilon_{i},\ \ {\ \beta}_{2} < 0,\)

где \(y_{i}\) — количество преступлений в i-ом районе, \(x_{i}\) — число полицейских в i-ом районе. Если в какой-то район мы отправили много полицейских, то количество преступлений в нём должно сокращаться. Говоря совсем кратко, получается, что чем больше x, тем меньше y. Поэтому мы и ожидаем, что \({\ \beta}_{2} < 0\). Предположим, что городской департамент полиции планирует количественно оценить указанный эффект и нанял для этого нас. Для достижения указанной цели мы нуждаемся в состоятельной оценке коэффициента \({\ \beta}_{2}\).

Проблема, однако, в том, что кроме влияния числа полицейских на число преступлений наверняка существует и обратная причинно-следственная связь. Скорее всего, чем более криминогенным является данный район, тем больше туда будет направлено служителей правопорядка. В виде уравнения это влияние можно описать, например, вот так:

\(x_{i} = \alpha_{1} + \alpha_{2}*y_{i} + u_{i},\ \ \ \ \ \ \alpha_{2} > 0\)

Положительный коэффициент \(\alpha_{2}\) отражает гипотезу о том, что чем выше в районе преступность, тем больше туда будет отправлено полицейских.

В нашем примере не только x влияет на y, но и y влияет на x. Поэтому мы имеем дело не с отдельным уравнением, а с системой одновременных уравнений:

\(\left\{ \begin{matrix} y_{i} = \beta_{1} + \beta_{2}*x_{i} + \varepsilon_{i},\ \ \ \ \ \ \beta_{2} < 0 \\ x_{i} = \alpha_{1} + \alpha_{2}*y_{i} + u_{i},\ \ \ \ \ \ \alpha_{2} > 0 \\ \end{matrix} \right.\ \ \ (7.2)\)

Покажем, что, даже если случайные ошибки двух уравнений не связаны друг с другом: \(\text{cov}\left( u_{i},\varepsilon_{i} \right) = 0\), регрессор в нашей модели все равно будет эндогенным. Для этого вычислим его ковариацию со случайной ошибкой в первом уравнении системы. Чтобы это сделать, удобно провести следующее преобразование: выразить эндогенные переменные \(x_{i}\ и\ y_{i}\) через экзогенные \(\varepsilon_{i}\ и\ u_{i}\).

Подставим первое уравнение системы во второе:

\(x_{i} = \alpha_{1} + \alpha_{2}*(\beta_{1} + \beta_{2}*x_{i} + \varepsilon_{i}) + u_{i}\)

Выразив \(x_{i}\), получаем:

\(x_{i} = \frac{\alpha_{1} + \alpha_{2}\beta_{1} + \alpha_{2}\varepsilon_{i} + u_{i}}{1 - \alpha_{2}\beta_{2}},\)

Аналогичную операцию можно проделать со второй переменной. Получим новую систему:

\(\left\{ \begin{matrix} x_{i} = \frac{\alpha_{1} + \alpha_{2}\beta_{1} + \alpha_{2}\varepsilon_{i} + u_{i}}{1 - \alpha_{2}\beta_{2}} \\ y_{i} = \frac{\beta_{1} + \alpha_{1}\beta_{2} + \varepsilon_{i} + {\beta_{2}u}_{i}}{1 - \alpha_{2}\beta_{2}} \\ \end{matrix} \right.\ \ \ (7.3)\)

Система (7.2) называется системой в структурной форме. Система (7.3) называется системой в приведенной форме, так как в ней эндогенные переменные выражены через экзогенные.

Такое представление даёт возможность легко посчитать ковариацию между \(x_{i}\ и\ \varepsilon_{i}\). Для этого достаточно воспользоваться первым уравнением системы (7.3):

\(\text{cov}\left( x_{i},\ \varepsilon_{i} \right) = \text{cov}\left( \frac{\alpha_{1} + \alpha_{2}\beta_{1} + \alpha_{2}\varepsilon_{i} + u_{i}}{1 - \alpha_{2}\beta_{2}},\varepsilon_{i} \right) = \frac{\alpha_{2}*\text{cov}\left( \varepsilon_{i},\varepsilon_{i} \right)}{1 - \alpha_{2}\beta_{2}} =\)

\(= \frac{\alpha_{2}*\text{var}(\varepsilon_{i})}{1 - \alpha_{2}\beta_{2}} > 0,\)

Чтобы определить знак последней дроби, мы воспользовались первоначальными ограничениями на параметры: \({\alpha_{2} > 0\ и\ \beta}_{2} < 0\).

Оказывается, что из-за того, что ситуация описывается не одним уравнением, а системой, регрессор \(\mathbf{x}\) эндогенен: он коррелирован со случайной ошибкой.

Как мы доказали ранее в главе 6 (см. равенство (6.1) в параграфе 6.3), МНК-оценки коэффициентов сходятся по вероятности к следующей величине:

\(\widehat{\beta_{2}}\overset{\text{~~p~~}}{\rightarrow}\ \beta_{2} + \frac{\text{cov}(x_{i},\varepsilon_{i})}{\text{var}\left( x_{i} \right)}.\)

В нашем случае это означает следующее:

\(\widehat{\beta_{2}}\overset{\text{~~p~~}}{\rightarrow}\ \beta_{2} + \frac{\text{cov}(x_{i},\varepsilon_{i})}{\text{var}\left( x_{i} \right)} = \left( \beta_{2} + \frac{1}{\text{var}\left( x_{i} \right)}*\frac{\alpha_{2}*\text{var}(\varepsilon_{i})}{1 - \alpha_{2}\beta_{2}} \right) > \beta_{2}\)

Мы показали, что МНК-оценка будет несостоятельна и завышена. Так как \(\beta_{2} < 0\), то в нашем примере при использовании обычного МНК мы часто будем получать оценку, сдвинутую к нулю. Иными словами, мы будем недооценивать эффективность полиции. Если эффект завышения силен, то мы получим оценку коэффициента \(\widehat{\beta_{2}}\) настолько близкую к нулю, что даже сочтем её незначимой, то есть сделаем ошибочный вывод о бесполезности полиции. В крайнем случае возможна даже ситуация \(\widehat{\beta_{2}} > 0\), что может привести нас к решению о том, что полиция способствует увеличению, а вовсе не снижению количества преступлений.

Этот пример показывает, что в ситуации двусторонней причинно-следственной связи обычный МНК применять не следует, так как его использование приведёт к несостоятельности интересующей нас оценки даже при использовании больших выборок.

Проблема одновременной причинно-следственной связи и сопутствующие ей трудности при оценивании встречаются в исследованиях часто. Гораздо чаще, чем хотелось бы прикладным эконометристам. Представим, например, традиционную проблему идентификации при оценке последствий макроэкономической политики: вопрос о том, как изменение ключевой ставки процента1 влияет на уровень инфляции? При ответе на этот вопрос придется принимать во внимание, что, с одной стороны, увеличение ключевой ставки сдерживает рост инфляции (то есть ключевая ставка влияет на инфляцию). Однако, с другой стороны, увеличение инфляции может побудить центральный банк изменить свою политику (то есть инфляция влияет на политику центрального банка и, следовательно, на ключевую ставку). Даже простой анализ конкурентного равновесия на рынке некоторого товара приведёт нас к системе по меньшей мере из двух одновременных уравнений: кривой спроса и кривой предложения, что снова потребует анализа одновременной причинно-следственной связи.

Обратите внимание, что в нашем примере про полицию в модели нет никаких пропущенных переменных, поэтому включение их в уравнение не может решить проблему. Придется использовать другие пути получения состоятельной оценки коэффициента в условиях двусторонней причинно-следственной связи:

1. используйте инструментальные переменные,

2. используйте методы, основанные на оценке систем одновременных уравнений (вместо оценки отдельных уравнений),

3. осуществите контролируемый эксперимент.

Применительно к пространственным и панельным данным в современных исследованиях более распространен первый подход. Мы обсудим его в главе 8. Второй подход в настоящее время в основном используются для временных рядов2 и потому выходит за рамки данного издания нашего вводного учебника.

Наконец, использование экспериментов подробно обсуждается в главе 11. По аналогии с предыдущими примерами вы вполне можете догадаться, как может быть устроен эксперимент в данном случае. Департаменту полиции следует определять количество полицейских в ряде районов случайным образом, то есть независимо от наблюдаемого там уровня преступности. В этом случае обратная причинно-следственная связь в указанных районах пропадет, что позволит состоятельно оценить коэффициент \(\beta_{2}\) при помощи обычного МНК.


  1. Напомним, что ключевая ставка — это ставка, по которой центральный банк предоставляет кредиты коммерческим банкам. Она играет решающую роль при установлении процентных ставок по банковским кредитам.↩︎

  2. См. модели структурных векторных авторегрессий (structural vector autoregression, SVAR) или векторной коррекции ошибок (vector error correction model, VECM).↩︎