Учебник+

8.1. Двухшаговый МНК: парная регрессия

Рассмотрим модель парной регрессии \(y_{i} = \beta_{1} + \beta_{2} \ast x_{i} + \varepsilon_{i},\) в которой \(x\) — эндогенный регрессор: \(\text{cov}\left( x_{i},\varepsilon_{i} \right) \neq 0\). Иными словами, нарушена предпосылка №4 линейной модели с одним регрессором из главы 6. Будем предполагать, что все остальные предпосылки этой модели выполняются.

Как мы выяснили в двух предыдущих главах, если предпосылка об экзогенности регрессора нарушена, то МНК-оценка коэффициента \(\beta_{2}\) несостоятельна. Следовательно, обычный МНК использовать нецелесообразно. Поэтому нам нужно предложить другой метод.

Представим, что в нашем распоряжении кроме информации о переменных x и y есть ещё данные о третьей переменной z, которая удовлетворяет двум свойствам:

  • релевантность (relevance): \(\text{cov}\left( z_{i},x_{i} \right) \neq 0\),

  • экзогенность (exogeneity): \(\text{cov}\left( z_{i},\varepsilon_{i} \right) = 0\).

Первое свойство говорит о том, что эта переменная коррелирована с нашим эндогенным регрессором. Второе свойство требует, чтобы эта переменная не была коррелирована со случайной ошибкой модели (то есть, в отличие от регрессора x, являлась экзогенной).

Переменная z называется инструментальной переменной или инструментом (instrumental variable, instrument). Если инструмент удовлетворяет обоим указанным свойствам (экзогенности и релевантности), то его называют валидным.

Графически отношения между переменными x, y и z представлены на рисунке 8.1.

image

Рисунок 8.1. Взаимосвязи между переменными x, y и z. Не зачёркнутые стрелки означают наличие корреляции. Зачеркнутая стрелка означает её отсутствие.

Наличие валидного инструмента позволяет получить состоятельную оценку коэффициента \(\beta_{2}\), используя двухшаговый МНК. Из названия легко догадаться, что реализация этого метода состоит из двух шагов. На каждом из них применяется обычный МНК:

Первый шаг

Оцениваем регрессию переменной x по переменной z:

\({{\widehat{x}}_{i} = {{\widehat{\theta}}_{1} + {\widehat{\theta}}_{2}}}z_{i}.\)

Получаем прогнозные значения \({\widehat{x}}_{i}.\)

Второй шаг

Оцениваем регрессию переменной y по этим предсказанным значениям \(\widehat{x}\):

\({{\widehat{y}}_{i} = {{\widehat{\beta}}_{1} + {\widehat{\beta}}_{2}}}{\widehat{x}}_{i}.\)

Чтобы отличать оценку коэффициента, полученную таким способом, от обычной МНК-оценки, мы иногда будем использовать в обозначении дополнительный индекс: \(\widehat{\beta_{2}^{\text{TSLS}}}\).

Прежде чем формально доказывать, что оценка \(\widehat{\beta_{2}^{\text{TSLS}}}\) является состоятельной, поясним кратко, почему так получается. Всё дело в том, что переменная \(\widehat{x}\), в отличие от исходной переменной \(x\), является экзогенной. Мы можем быть в этом уверены потому, что она линейно выражается через инструмент, а инструмент, в свою очередь, экзогенен по своему свойству.

Покажем, что 2МНК-оценка коэффициента при регрессоре задается формулой:

\(\widehat{\beta_{2}^{\mathit{TSLS}}} = \frac{\frac{1}{n}{\sum{{({y_{i} - \overline{y}})}{({z_{i} - \overline{z}})}}}}{\frac{1}{n}{\sum{{({x_{i} - \overline{x}})}{({z_{i} - \overline{z}})}}}} = \frac{\widehat{\mathit{cov}}{({y,z})}}{\widehat{\mathit{cov}}{({x,z})}}\)

Для этого отметим, что в силу стандартных формул для парной регрессии МНК-оценка коэффициента при переменной в регрессии первого шага \({\widehat{x}}_{i} = {\widehat{\theta}}_{1} + {\widehat{\theta}}_{2}z_{i}\) имеет вид: \({\widehat{\theta}}_{2} = \frac{\widehat{\text{cov}}(x,z)}{\widehat{\text{var}}(z)}\), а МНК-оценка в регрессии второго шага \({\widehat{y}}_{i} = {\widehat{\beta}}_{1} + {\widehat{\beta}}_{2}{\widehat{x}}_{i}\) равна \(\widehat{\beta_{2}^{\text{TSLS}}} = \frac{\widehat{\text{cov}}\left( \widehat{x},y \right)}{\widehat{\text{var}}\left( \widehat{x} \right)}\). Следовательно

\(\widehat{\beta_{2}^{\mathit{TSLS}}} = \frac{\widehat{\mathit{cov}}\left( {\widehat{x},y} \right)}{\widehat{\mathit{var}}\left( \widehat{x} \right)} = \frac{\widehat{\mathit{cov}}\left( {{{\widehat{\theta}}_{1} + {\widehat{\theta}}_{2}}z,y} \right)}{\widehat{\mathit{var}}\left( {{{\widehat{\theta}}_{1} + {\widehat{\theta}}_{2}}z} \right)} = \frac{{{\widehat{\theta}}_{2} \ast \widehat{\mathit{cov}}}\left( {z,y} \right)}{{\left( {\widehat{\theta}}_{2} \right)^{2} \ast \widehat{\mathit{var}}}(z)} = {}\)

\({}{\frac{\widehat{\mathit{cov}}{({z,y})}}{{{\widehat{\theta}}_{2} \ast \widehat{\mathit{var}}}{(z)}} = \frac{\widehat{\mathit{cov}}{({z,y})}}{{\frac{\widehat{\mathit{cov}}{({x,z})}}{\widehat{\mathit{var}}{(z)}} \ast \widehat{\mathit{var}}}{(z)}} = \frac{\widehat{\mathit{cov}}{({y,z})}}{\widehat{\mathit{cov}}{({x,z})}}}\)

Теперь можно доказать состоятельность этой оценки.

\({\widehat{\beta_{2}^{\mathit{TSLS}}} = \frac{\frac{1}{n}{\sum{{({y_{i} - \overline{y}})}{({z_{i} - \overline{z}})}}}}{\frac{1}{n}{\sum{{({x_{i} - \overline{x}})}{({z_{i} - \overline{z}})}}}}}\underset{\rightarrow}{p}{\frac{\mathit{Cov}\left( {y_{i},z_{i}} \right)}{\mathit{Cov}\left( {x_{i},z_{i}} \right)} =}\)

\({}{\frac{\mathit{Cov}\left( {{\beta_{1} + {\beta_{2} \ast x_{i}} + \varepsilon_{i}},z_{i}} \right)}{\mathit{Cov}\left( {x_{i},z_{i}} \right)} = \frac{\beta_{2}\mathit{Cov}{\left( {x_{i},z_{i}} \right) + \mathit{Cov}}\left( {\varepsilon_{i},z_{i}} \right)}{\mathit{Cov}\left( {x_{i},z_{i}} \right)} =}\)

\({}{\left\{ {\mathit{cov}{\left( {z_{i},\varepsilon_{i}} \right) = 0}} \right\} =}\)

\({}{\frac{\beta_{2}\mathit{Cov}{\left( {x_{i},z_{i}} \right) + 0}}{\mathit{Cov}\left( {x_{i},z_{i}} \right)} = \beta_{2}}\)

Здесь мы также использовали свойство релевантности инструмента (то есть свойство \(\text{cov}\left( z_{i},x_{i} \right) \neq 0\)), чтобы гарантировать, что знаменатель дроби \(\frac{\text{Cov}\left( y_{i},z_{i} \right)}{\text{Cov}\left( x_{i},z_{i} \right)}\) не равен нулю.

В случае использования двухшагового МНК дисперсии оценок коэффициентов будут отличаться от случая обычного МНК. Следовательно, и стандартные ошибки оценок коэффициентов нужно рассчитывать несколько иначе. Например, для случая гомоскедастичности корректная формула стандартной ошибки коэффициента при регрессоре имеет вид:

\(\mathit{se}{\left( {\widehat{\beta}}_{2} \right) = \sqrt{\frac{\frac{S^{2}}{\sum\left( {x_{i} - \overline{x}} \right)^{2}} \ast 1}{{\widehat{\mathit{corr}}}^{2}\left( {x,z} \right)}}},{S^{2} = \frac{\sum\limits_{i = 1}^{n}e_{i}^{2}}{n - 2}}.\)

Подчеркнем, что здесь остатки рассчитываются по формуле \(e_{i} = y_{i} - {\widehat{\beta}}_{1} - {\widehat{\beta}}_{2}x_{i}\), а не по формуле \(e_{i} = y_{i} - {\widehat{\beta}}_{1} - {\widehat{\beta}}_{2}{\widehat{x}}_{i}\) (так как иначе \(S^{2}\) окажется несостоятельной оценкой дисперсии случайной ошибки).

Если вы сравните эту формулу стандартной ошибки с привычной формулой из второй главы, то увидите, что отличие состоит в появлении множителя \(\frac{1}{{\widehat{\text{corr}}}^{2}(x,z)}\). Этот множитель демонстрирует важность релевантности инструмента. Ведь если инструмент почти не релевантен, то корреляция между ним и регрессором окажется близкой к нулю. Тогда этот множитель будет велик, и, следовательно, стандартная ошибка оценки коэффициента тоже будет велика, что приведет к низкой точности оценивания. Например, к очень широким доверительным интервалам.

Чтобы эконометрический пакет рассчитывал стандартные ошибки коэффициентов корректно, следует использовать встроенную процедуру двухшагового МНК (в этом случае можно добавить и корректировку стандартных ошибок на случай гетероскедастичности), а не самостоятельно регрессировать y по \(\widehat{x}\) при помощи обычного МНК.

За исключением альтернативных стандартных ошибок, процедуры тестирования гипотез и построения доверительных интервалов для коэффициентов модели полностью аналогичны процедурам, описанным в главе 6.

Пример 8.1. Оценка эластичности спроса по цене

На рынке сигарет в некоторой стране функция спроса в i-м регионе имеет вид:

\({{\ln ⁡Q}_{i} = {\beta_{1} + {\beta_{2} \ast \ln}}}⁡{P_{i} + \varepsilon_{i}}\)

Функция предложения описывается соотношением:

\({{\ln ⁡Q}_{i} = {\gamma_{1} + {\gamma_{2} \ast \ln}}}{P_{i} + {\gamma_{3} \ast \ln}}{T_{i} + u_{i}}\)

\(Q_{i}\) — количество сигарет в i-м регионе, \(P_{i}\) — цена сигарет в i-м регионе, \(T_{i}\) — налог с продаж в i-м регионе. \(\varepsilon_{i}\) — независимые и одинаково распределенные случайные величины, характеризующие шоки спроса (не коррелированы с налогами), \(u_{i}\) — независимые и одинаково распределенные случайные величины, характеризующие шоки предложения.

(а) Объясните, почему МНК-оценка эластичности спроса по цене в рассматриваемой модели будет несостоятельной. Для этого вычислите предел по вероятности для МНК-оценки \({\widehat{\beta}}_{2}^{\text{OLS}}\). Определите, если это возможно, будет ли МНК давать завышенную или заниженную оценку эластичности спроса?

(б) Предложите процедуру состоятельного оценивания эластичности спроса по цене. Формально обоснуйте свой ответ, вычислив соответствующий предел по вероятности.

Решение:

(а) Выразим эндогенную переменную \(\ln P_{i}\) через экзогенную \(\ln T_{i}:\)

\({\beta_{1} + \beta_{2}}\ln{{P_{i} + \varepsilon_{i}} = {\gamma_{1} + {\gamma_{2} \ast \ln}}}{P_{i} + {\gamma_{3} \ast \ln}}{T_{i} + u_{i}}\)

\(\ln{P_{i} = \frac{{\beta_{1} - \gamma_{1} - {\gamma_{3} \ast \ln}}{T_{i} + \varepsilon_{i} - u_{i}}}{\gamma_{2} - \beta_{2}}}.\)

\(\mathit{cov}{\left( {\ln P_{i},\varepsilon_{i}} \right) = \mathit{cov}}{\left( {\frac{{\beta_{1} - \gamma_{1} - {\gamma_{3} \ast \ln}}{T_{i} + \varepsilon_{i} - u_{i}}}{\gamma_{2} - \beta_{2}},\varepsilon_{i}} \right) =}\)

\({}{\frac{1}{\gamma_{2} - \beta_{2}} \ast \mathit{cov}}{\left( {{\beta_{1} - \gamma_{1} - {\gamma_{3} \ast \ln}}{T_{i} + \varepsilon_{i} - u_{i}},\varepsilon_{i}} \right) =}\)

\({}{\frac{1}{\gamma_{2} - \beta_{2}} \ast \mathit{cov}}{\left( {{{- \gamma_{3}} \ast \ln}{T_{i} + \varepsilon_{i} - u_{i}},\varepsilon_{i}} \right) =}\)

\({}\frac{1}{\gamma_{2} - \beta_{2}}{\left( {{{- \gamma_{3}} \ast \mathit{cov}}{\left( {\ln T_{i},\varepsilon_{i}} \right) + \sigma_{\varepsilon}^{2} - \mathit{cov}}\left( {u_{i},\varepsilon_{i}} \right)} \right) =}\)

\({}{\begin{Bmatrix} {\mathit{cov}{\left( {\ln T_{i},\varepsilon_{i}} \right) = 0},\mathit{налоги}\mathit{не}\mathit{коррелированы}с\mathit{шоками}\mathit{спроса}} \\ {\mathit{cov}{\left( {u_{i},\varepsilon_{i}} \right) = 0}} \\ \end{Bmatrix} =}\)

\({}\frac{\sigma_{\varepsilon}^{2}}{\gamma_{2} - \beta_{2}}.\)

Таким образом, цена является эндогенной переменной в уравнении спроса, так как она коррелирована со случайными ошибками в этом уравнении. Такой ситуации легко предложить интуитивное объяснение, если представить стандартный график с пересечением кривых спроса и предложения: положительный шок спроса (\(\varepsilon > 0\)) сдвигает кривую спроса вправо, в результате чего растет равновесная цена.

Поэтому оценка обычного МНК будет несостоятельной:

\({{\widehat{\beta}}_{2}^{\mathit{OLS}} = \frac{\widehat{\mathit{cov}}\left( {\ln{P,}\ln Q} \right)}{\widehat{\mathit{var}}\left( {\ln P} \right)} = {\beta_{2} + \frac{\widehat{\mathit{cov}}\left( {\ln{P,}\varepsilon} \right)}{\widehat{\mathit{var}}\left( {\ln P} \right)}}}\underset{\rightarrow}{p}\)

\(\underset{\rightarrow}{p}{{\beta_{2} + \frac{\mathit{cov}{({\ln{P_{i},}\varepsilon_{i}})}}{\mathit{var}{({\ln P_{i}})}}} = {\beta_{2} + \frac{\frac{\sigma_{\varepsilon}^{2}}{\gamma_{2} - \beta_{2}}}{\sigma_{\ln P}^{2}}}}\neq\beta_{2}.\)

Поскольку по закону спроса \(\beta_{2} < 0\), а в силу закона предложения \(\gamma_{2} > 0\), то (\(\gamma_{2} - \beta_{2} > 0\). Следовательно, \(\frac{\frac{\sigma_{\varepsilon}^{2}}{\gamma_{2} - \beta_{2}}}{\sigma_{\ln P}^{2}} > 0,\) и оценка завышена (так как \(\beta_{2} < 0\), то МНК-оценка, скорее всего, будет ближе к нулю, чем истинное значение коэффициента).

(б) Состоятельную оценку эластичности спроса по цене можно получить, если воспользоваться процедурой двухшагового МНК. Инструмент валиден, если он, во-первых, экзогенен и, во-вторых, релевантен.

В рассматриваемом случае переменная \(\ln T_{i}\) экзогенна: по условию налоги не коррелированы со случайными величинами \(\varepsilon_{i}\), характеризующими шоки спроса: \(\text{cov}\left( \ln T_{i},\varepsilon_{i} \right) = 0\).

К тому же налоги коррелированы с ценой: если они повышаются, то в результате сдвига кривой предложения увеличивается и равновесная цена. Поэтому \(\text{cov}\left( \ln T_{i},\ln P_{i} \right) \neq 0\).

Следовательно, инструмент \(\ln T_{i}\)валиден.

На первом шаге оцениваем регрессию \(\ln P_{i}\) по \(\ln T_{i}\) и получаем прогнозные значения \({\widehat{\ln P}}_{i}\). На втором шаге оцениваем регрессию \({\ln Q}_{i}\) по \({\widehat{\ln P}}_{i}\), где уже отсутствует проблема эндогенности.