Учебник+

8.4. Тесты для моделей, оцененных двухшаговым МНК

2МНК-оценки коэффициентов являются состоятельными, только если используемые инструменты релевантны и экзогенны. Поэтому полезно уметь тестировать выполнение этих условий.

Начнем с релевантности. Рассмотрим случай, когда в модели есть единственная эндогенная переменная:

\({y_{i} = {\beta_{0} + \beta_{1}}}{x_{i} + \beta_{2}}{w_{i}^{(1)} + \ldots + \beta_{1 + r}}{w_{i}^{(r)} + \varepsilon_{i}}.\)

Тогда для проверки релевантности сначала следует оценить параметры регрессии первого шага:

\({{\widehat{x}}_{i} = {{\widehat{\alpha}}_{0} + {\widehat{\alpha}}_{1}}}{z_{i}^{(1)} + \ldots + {\widehat{\alpha}}_{m}}{z_{i}^{(m)} + {\widehat{\alpha}}_{m + 1}}{w_{i}^{(1)} + \ldots + {\widehat{\alpha}}_{m + r}}w_{i}^{(r)}\)

Затем, опираясь на тест для сравнения «короткой» и «длинной» регрессий, вычислить расчетное значение тестовой F-статистики для проверки гипотезы

\(H_{0}:{\alpha_{1} = \ldots = \alpha_{m} = 0.}\)

Если эта гипотеза отвергается, то это значит, что инструменты вносят существенный вклад в объяснение изменений эндогенной переменной. Это говорит в пользу их релевантности. Обычно на практике используется следующее правило: если расчетное значение тестовой F-статистики для проверки данной гипотезы больше 10, то инструменты признаются релевантными. (И в целом, чем F-статистика больше, тем лучше.)

Эта рекомендация опирается на тот факт, что при выполнении указанного условия максимально возможное смещение 2МНК-оценки будет не слишком велико — в пределах 10% от истинного значения параметра. Поскольку доказательство данного факта весьма сложно технически, оно выходит за рамки нашего учебника. Однако заинтересованному (и не боящемуся трудностей) читателю мы советуем обратиться за подробностями к статье (Stock, Yogo, 2005).

Если же F-статистика меньше 10, то инструмент называется слабым. Это означает, что он почти не коррелирован с регрессором, то есть объясняет малую долю дисперсии эндогенной переменной.

Если используемые вами инструменты слабые, то:

  • точность 2МНК оценок очень низка.

  • результаты тестов на значимость могут быть некорректны, так как распределение оценки коэффициента не является нормальным даже асимптотически.

Поэтому, если результаты теста указывают, что вы имеете дело со слабыми инструментами, следует:

  • или найти альтернативный набор инструментов, которые будут сильными (к сожалению, иногда сделать это довольно трудно);

  • или, если у вас уже есть большое количество инструментов, попробовать отказаться от некоторых из них. Исключение наименее значимых инструментов может способствовать увеличению соответствующей F-статистики в регрессии первого шага (разумеется, при этом по-прежнему должно выполняться условие идентифицируемости \(m \geq p\)).

Пример 8.2. Оценка эластичности спроса по цене (продолжение)

Исследователь анализирует спрос на сигареты в 48 американских штатах. Он изучает зависимость величины спроса (Q) от цены (P), используя в качестве инструмента для цены ставку налога, взимаемого с производителей в соответствующем штате (T). Ниже представлены результаты применения двухшагового МНК:

Регрессия первого шага:

\({{\widehat{\mathit{lnP}}}_{i} = {\underset{(0,03)}{4,63} + {0,03\underset{(0,005)}{\ast}\mathit{lnT}_{i}}}},{R^{2} = 0,47}\)

Регрессия второго шага (в скобках указаны робастные к гетероскедастичности стандартные ошибки для 2МНК):

\({{\widehat{\mathit{lnQ}}}_{i} = {\underset{(1,53)}{9,72} - 1}},{08\underset{(0,32)}{\ast}{\widehat{\mathit{lnP}}}_{i}}.\)

(а) Является ли инструмент рассматриваемой модели слабым?

(б) Постройте 95-процентный доверительный интервал для эластичности спроса по цене. Можно ли на основе полученного интервала утверждать, что цена значимо влияет на потребление сигарет? Можно ли на основе полученного интервала утверждать, что спрос на сигареты является эластичным?

Решение:

(а) Чтобы проверить, является ли инструмент слабым, в данном случае необходимо вычислить расчетное значение соответствующей F-статистики для проверки гипотезы \(H_{0}:\alpha_{2} = 0\) в уравнении:

\(\ln{P_{i} = {\alpha_{1} + {\alpha_{2} \ast \ln}}}{T_{i} + u_{i}}.\)

\(F_{\mathit{расч}} = \frac{\frac{R^{2}}{1 - R^{2}} \ast {n - 2}}{2 - 1} = \frac{\frac{0,47}{0,53} \ast {48 - 2}}{2 - 1} = 40,8.\)

Поскольку \(F_{расч} > 10\), можно заключить, что инструмент релевантен (то есть не является слабым).

(б) Теперь построим 95-процентный доверительный интервал:

\(\left( {{\widehat{\beta_{2}} - {1,96 \ast \mathit{se}}}\left( \widehat{\beta_{2}} \right),{\widehat{\beta_{2}} + {1,96 \ast \mathit{se}}}\left( \widehat{\beta_{2}} \right)} \right)\)

\(\left( {{{- 1,08} - {1,96 \ast 0,32}}{, - 1,08 + {1,96 \ast 0,32}}} \right)\)

\(\left( {{- 1,71}{, - 0,45}} \right)\)

Поскольку доверительный интервал не содержит ноль, можно утверждать, что цена значимо влияет на величину спроса.

Однако на основе полученного доверительного интервала нельзя утверждать, что спрос на сигареты является эластичным, так как в доверительный интервал входят как значения больше минус единицы, так и меньше неё.

***

Перейдем теперь к тестированию экзогенности инструмента. Для этого можно применить тест Саргана (Sargan test или the overidentifying restrictions test). Также иногда его называют J-тестом.

Тест доступен только в том случае, если число инструментов превышает число эндогенных регрессоров: \(m > p\).

Нулевая гипотеза теста состоит в том, что все инструменты экзогенны. Альтернативная гипотеза — в том, что хотя бы один из инструментов эндогенен.

Для осуществления теста следует оценить параметры вспомогательной модели регрессии следующего вида:

\({e_{i} = {\gamma_{0} + \gamma_{1}}}{z_{i}^{(1)} + \ldots + \gamma_{m}}{z_{i}^{(m)} + \gamma_{m + 1}}{w_{i}^{(1)} + \ldots + \gamma_{m + r}}{w_{i}^{(r)} + v_{i}}\)

Здесь \(e_{i}\) — остатки, полученные в ходе оценивания регрессии второго шага двухшагового МНК.

Далее следует вычислить расчетное значение тестовой статистики по следующей формуле: \(J_{\text{statistic}} = m \ast F\), где F — расчетное значение F-статистки для проверки гипотезы \(\gamma_{1} = \ldots = \gamma_{m} = 0\) в этом вспомогательном уравнении.

Если верна нулевая гипотеза, то \(J_{\text{statistic}}\) имеет распределение \(\text{χ}^{2}(m - p)\). Поэтому для принятия решения следует сравнивать расчетное значение статистики с критическим значением из таблиц распределения Хи-квадрат с \((m - p)\) степенями свободы. Как обычно, нулевая гипотеза не отвергается при заданном уровне значимости, если расчетное значение меньше критического. Это означает, что все инструменты экзогенны.

Если же нулевая гипотеза отклоняется, то нужно сделать вывод о том, что, по крайней мере, некоторые из инструментов эндогенны, а значит, 2МНК-оценки несостоятельны. Подчеркнем, что в этой ситуации вовсе не следует отказываться абсолютно от всех используемых инструментов, ведь тест говорит о том, что эндогенны лишь какие-то из них (но не обязательно все сразу). Поэтому в такой ситуации разумной идеей будет отказ только от части инструментов, повторная оценка уравнения и повторное осуществление теста. К сожалению, тест не указывает, с каким конкретно из инструментов возникла проблема, так что тут придется принимать решение самостоятельно.

Ещё раз подчеркнем, что проведение теста Саргана возможно лишь при \(m > p\). Если же \(m = p\), то тестировать экзогенность инструментов в принципе невозможно. Это означает, что при обосновании валидности используемых инструментальных переменных придется опираться на содержательные соображения. Следовательно, если вы используете 2МНК, то содержательное понимание моделируемого процесса особенно важно. Некоторые полезные примеры для такого случая приведены в следующем параграфе.

Третий тест, который мы обсудим в этом разделе — тест Хаусмана. Он помогает принять решение о том, нужно ли в принципе использование 2МНК в вашей модели, или можно ограничиться обычным МНК. Идея теста состоит в следующем: МНК-оценки будут состоятельны только в том случае, если регрессоры экзогенны, а 2МНК-оценки будут состоятельны независимо от того, эндогенен регрессор или экзогенен. Следовательно, если МНК- и 2МНК-оценки параметров отличаются не слишком сильно, то это аргумент в пользу применимости обычного МНК. Если же МНК- и 2МНК-оценки совсем не похожи друг на друга, то значит, МНК дает несостоятельные результаты, и пользоваться им не следует. Поэтому расчетное значение тестовой статистики опирается на сравнение векторов оценок, полученных при помощи обычного МНК и двухшагового.

Представление формулы тестовой статистики требует использования матричной записи (параграф 3.3 и параграф 8.3):

\(\left( {\widehat{\beta_{2\mathit{МНК}}} - \widehat{\beta_{\mathit{МНК}}}} \right)^{'}\left( {\widehat{V}{\left( \widehat{\beta_{2\mathit{МНК}}} \right) - \widehat{V}}\left( \widehat{\beta_{\mathit{МНК}}} \right)} \right)^{- 1}\left( {\widehat{\beta_{2\mathit{МНК}}} - \widehat{\beta_{\mathit{МНК}}}} \right)\)

\(\widehat{V}\left( \widehat{\beta_{МНК}} \right)\) — оценка ковариационой матрицы вектора МНК-оценок

\(\widehat{V}\left( \widehat{\beta_{2МНК}} \right)\)— оценка ковариационой матрицы вектора 2МНК-оценок

Нулевая гипотеза теста Хаусмана состоит в том, что МНК-оценки коэффициентов модели состоятельны. Если она верна, то указанная тестовая статистика имеет распределение \(\chi^{2}(k)\), где \(k\) — суммарное число переменных в регрессии второго шага.

Если нулевая гипотеза не отвергается, следует использовать для оценки коэффициентов обычный МНК, так как он будет давать состоятельные результаты (и к тому же более точные, чем 2МНК). В случае отвержения нулевой гипотезы придется заключить, что МНК-оценки несостоятельны, и остановить свой выбор на 2МНК.

У теста Хаусмана есть ограничение: его применение корректно только, когда используемые инструменты валидны. Если вывод о том, что можно ограничиться обычным МНК, получен на основе использования теста Хаусмана с сомнительным набором инструментальных переменных, то и сам вывод будет оставаться спорным. Иными словами, для корректного проведения теста Хаусмана все равно придется искать набор годных инструментов. И это дает нам дополнительную мотивацию, чтобы перейти к следующему параграфу.