Учебник+

11.3. Локальный средний эффект воздействия (LATE)

В некоторых случаях разделение на группу, подвергшуюся воздействию, и контрольную группу может быть эндогенным. Например, если индивиды сами решают, подвергаться ли им воздействию, то при попытке оценить величину среднего эффекта воздействия мы столкнемся со смещением из-за самоотбора.

Такая ситуация особенно вероятна, если эффект воздействия является гетерогенным, то есть существенно отличается для разных индивидов. В этих условиях корректно оценить ATE затруднительно, зато возможно состоятельно оценить так называемый локальный средний эффект воздействия (local average treatment effect, LATE)

Чтобы пояснить идею работы этого метода, мы будем использовать статью (Angrist, 1990), которая посвящена попытке оценить воздействие службы в армии на будущие доходы.

Простое сравнение средних доходов людей, которые служили и не служили в армии, показывает, что доходы ветеранов устойчиво ниже. Однако эти оценки не вызывают доверия, так как они могут быть смещены из-за эндогенности решения о прохождении службы (возможно, дело в том, что в армию идут менее способные к гражданской работе люди). Подход, который использует Ангрист, позволяет преодолеть эту проблему.

Ангрист обращается к данным о ветеранах войны во Вьетнаме. В те времена в США использовался призыв на военную службу. Приоритетность призыва зависела от так называемого случайного порядкового номера (Random Sequence Number, RSN). Этот номер присваивался каждому мужчине в результате розыгрыша лотереи. Номер изменялся от 1 до 365, так как был привязан к дате рождения. Министерство обороны каждый год определяло некоторый потолок (пороговое значение) случайного порядкового номера. После этого на службу призывались все мужчины с RSN ниже этого порогового значения.

Говоря коротко, на службу призывались мужчины, которым выпало пойти в армию в результате некоторой лотереи (в статье этих победителей называют «draft-eligible»).

Важно отметить, что статус победителя лотереи вовсе не равен статусу ветерана войны (это две разные переменные):

  • С одной стороны, вовсе не все ветераны войны были победителями лотереи, ведь кто-то записывался на службу добровольно.
  • С другой стороны, не все победители лотереи стали ветеранами, так как кто-то из победителей избежал службы в силу, например, медицинских ограничений.

Такая ситуация называется двусторонним несоблюдением (two-sided noncompliance).

Тем не менее, статус победителя лотереи и статус ветерана положительно коррелированы друг с другом: победители лотереи в среднем оказывались в армии с большей вероятностью, чем остальные мужчины. В то же время статус победителя лотереи не коррелирован с прочими характеристиками индивида, которые могут влиять на его доход (так как присваивался случайным образом). Все это указывает на то, что статус победителя лотереи можно было бы использовать в качестве инструмента для переменной, характеризующей ветеранский статус. Мы, однако, не будем сразу пользоваться уже знакомой методологией двухшагового МНК, а начнем с альтернативного взгляда на описанную ситуацию.

Будем использовать следующие обозначения:

\(Y_i\) — значение зависимой переменной (potential outcome). В нашем примере это доход i-го индивида.

\(D_i\) — это снова переменная воздействия, которая в отличие от первого параграфа является эндогенной. В нашем примере это бинарная переменная, равная единице, если i-ый индивид служил в армии.

Переменная воздействия зависит от некоторого бинарного инструмента \(Z_i\) — так называемого внешнего предписания (treatment assignment). В нашем примере это бинарная переменная, равная единице, если i-ый индивид выиграл в лотерее:

\begin{equation*} D_i=D_i\left(Z_i\right)=\left\{\begin{matrix}D_i\left(1\right),\mathit{\text{е}\text{с}\text{л}\text{и}}Z_i=1\\D_i\left(0\right),\mathit{\text{е}\text{с}\text{л}\text{и}}Z_i=0\end{matrix}\right. \end{equation*}

В общем случае переменная \(Y_i\) может зависеть и от переменной воздействия, и от предписания:

\begin{equation*} Y_i=Y_i\left(D_i,Z_i\right)=\left\{\begin{matrix}\begin{matrix}Y_i\left(0,0\right),\mathit{\text{е}\text{с}\text{л}\text{и}}D_i=0,Z_i=0\\Y_i\left(0,1\right),\mathit{\text{е}\text{с}\text{л}\text{и}}D_i=0,Z_i=1\end{matrix}\\\begin{matrix}Y_i\left(1,0\right),\mathit{\text{е}\text{с}\text{л}\text{и}}D_i=1,Z_i=0\\Y_i\left(1,1\right),\mathit{\text{е}\text{с}\text{л}\text{и}}D_i=1,Z_i=1\end{matrix}\end{matrix}\right. \end{equation*}

Как обычно, для каждого отдельного индивида мы наблюдаем только одно из четырёх возможных значений (так как один и тот же человек не мог одновременно служить и не служить или одновременно выиграть в лотерее и не выиграть.

Сформулируем предпосылки, которые потребуются нам для оценки локального среднего эффекта воздействия (LATE).

Предпосылка 11.1 о независимости (Independence).

\(Z_i\) не зависит от \(\left(Y_i\left(D_i\left(0\right),0\right),Y_i\left(D_i\left(1\right),1\right),D_i\left(0\right),D_i\left(1\right)\right)\).

В нашем примере это означает, что результат лотереи не зависит от характеристик индивида.

Предпосылка 11.2 об исключающем ограничении (Exclusion restriction).

Для любого i верно, что \(Y_i\left(1,0\right)=Y_i\left(1,1\right)\) и \(Y_i\left(0,0\right)=Y_i\left(0,1\right)\).

Эта предпосылка означает, что инструмент \(Z_i\) не оказывает непосредственного влияния на зависимую переменную. Он может влиять на неё только опосредованно: через изменение переменной \(D_i\).

В нашем примере это означает, что выигрыш в лотерее сам по себе не влияет на доход1. Он влияет на вероятность попадания в армию. А уже служба в армии, в свою очередь, может влиять на доход.

С учетом этой предпосылки зависимую переменную можно записать как функцию от единственного фактора \(Y_i\left(D_i\right)\):

\begin{equation*} Y_i\left(1\right){\equiv}Y_i\left(1,0\right)=Y_i\left(1,1\right), \end{equation*}

\begin{equation*} Y_i\left(0\right){\equiv}Y_i\left(0,0\right)=Y_i\left(0,1\right). \end{equation*}

Предпосылка 11.3 о первом шаге (First Stage).

Для любого i верно, что \(E\left(D_i\left(1\right)-D_i\left(0\right)\right){\neq}0\).

Это аналог предпосылки о релевантности инструмента. То есть о том, что инструмент влияет на переменную воздействия.

В нашем примере это означает, что выигрыш в лотерею увеличивает для индивида вероятность оказаться в армии.

Предпосылка 11.4 о монотонности (Monotonicity).

Для любого i верно, что \(D_i\left(1\right)-D_i\left(0\right){\geq}0\).

Заметим, что вместо \(D_i\left(1\right)-D_i\left(0\right)>0\) можно с таким же успехом писать \(D_i\left(1\right)-D_i\left(0\right)=1\), так как здесь это эквивалентно. Сформулированная предпосылка означает, что разность \(D_i\left(1\right)-D_i\left(0\right)\) может принимать только два значения: 0 или 1.

Чтобы пояснить эту предпосылку, отметим, что, с точки зрения реакции на предписание, каждый индивид может быть отнесен к одному из четырех типов:

  • Complier: если получил предписание, то идет в армию, а если не получил предписание, то не идёт в армию. Для такого индивида верно, что \(D_i\left(1\right)-D_i\left(0\right)=1-0=1\)
  • Always-taker: независимо от предписания идёт в армию: \(D_i\left(1\right)-D_i\left(0\right)=1-1=0\)
  • Never-taker: независимо от предписания не идёт в армию: \(D_i\left(1\right)-D_i\left(0\right)=0-0=0\)
  • Defier: если получил предписание, то не идет в армию, а если не получил предписание, то идёт в армию. Для такого странного индивида верно, что \(D_i\left(1\right)-D_i\left(0\right)=0-1=-1\)

Ясно, что поведение последнего типа индивидов выглядит нереалистично. Предпосылка о монотонности как раз и предполагает, что таких индивидов не существует.

Последняя предпосылка важна для того, чтобы понять, что такое локальный средний эффект воздействия (LATE) — это эффект воздействия для индивидов типа Complier (по-русски их можно назвать послушными индивидами, то есть индивидами, которые строго следуют предписанию):

\begin{equation*} \mathit{LATE}=E\left(Y_i\left(1\right)-Y_i\left(0\right)|D_i\left(1\right)-D_i\left(0\right)>0\right) \end{equation*}

Для других групп индивидов оценить ATE невозможно:

  • Для индивидов типа Always-taker у нас нет ни одного наблюдения, показывающего, что с ними будет, если они не подвергнутся воздействию.
  • Для индивидов типа Never-taker у нас нет ни одного наблюдения, показывающего, что с ними будет, если они подвергнутся воздействию.

Если эксперимент устроен так, что в группу, подвергшуюся воздействию, могут попасть только те, кто получил предписание (а те, кто его не получил, могут оказаться исключительно в контрольной группе), то такая ситуация называется односторонним несоблюдением (one-sided noncompliance).

В нашем примере такая ситуация наблюдалась бы, если бы в США законодательно запретили поступать на военную службу тем, кто не выиграл в лотерее (даже в качестве добровольцев).

В случае одностороннего несоблюдения четвертая предпосылка не потребуется нам для оценки эффекта воздействия. А в случае двустороннего несоблюдения, как мы убедимся далее, она необходима.

Теорема о LATE

Если выполнены предпосылки А1–A4, то

\begin{equation*} \frac{E\left(Y_i|Z_i=1\right)-E\left(Y_i|Z_i=0\right)}{E\left(D_i|Z_i=1\right)-E\left(D_i|Z_i=0\right)}=\mathit{LATE}. \end{equation*}

Для доказательства теоремы рассмотрим сначала два слагаемых в числителе данной дроби:

\begin{equation*} E\left(Y_i|Z_i=1\right)=\left\{\text{в}\mathit{\text{с}\text{и}\text{л}\text{у}}\mathit{\text{п}\text{р}\text{е}\text{д}\text{п}\text{о}\text{с}\text{ы}\text{л}\text{к}\text{и}}\text{А}2\right\}= \end{equation*}

\begin{equation*} E\left(Y_i\left(0\right)+\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}D_i|Z_i=1\right)=\left\{\text{в}\mathit{\text{с}\text{и}\text{л}\text{у}}\mathit{\text{п}\text{р}\text{е}\text{д}\text{п}\text{о}\text{с}\text{ы}\text{л}\text{к}\text{и}}\text{А}1\right\}= \end{equation*}

\begin{equation*} E\left(Y_i\left(0\right)+\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}D_i\left(1\right)\right) \end{equation*}

Аналогично:

\begin{equation*} E\left(Y_i|Z_i=0\right)=\left\{\text{в}\mathit{\text{с}\text{и}\text{л}\text{у}}\mathit{\text{п}\text{р}\text{е}\text{д}\text{п}\text{о}\text{с}\text{ы}\text{л}\text{к}\text{и}}\text{А}2\right\}= \end{equation*}

\begin{equation*} E\left(Y_i\left(0\right)+\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}D_i|Z_i=0\right)=\left\{\text{в}\mathit{\text{с}\text{и}\text{л}\text{у}}\mathit{\text{п}\text{р}\text{е}\text{д}\text{п}\text{о}\text{с}\text{ы}\text{л}\text{к}\text{и}}\text{А}1\right\}= \end{equation*}

\begin{equation*} E\left(Y_i\left(0\right)+\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}D_i\left(0\right)\right) \end{equation*}

Следовательно, числитель дроби в формуле для LATE можно записать так:

\begin{equation*} E\left(Y_i|Z_i=1\right)-E\left(Y_i|Z_i=0\right)= \end{equation*}

\begin{equation*} E\left(Y_i\left(0\right)+\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}D_i\left(1\right)\right)-\end{equation*}

\begin{equation*}-E\left(Y_i\left(0\right)+\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}D_i\left(0\right)\right)= \end{equation*}

\begin{equation*} E\left(\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}\left(D_i\left(1\right)-D_i\left(0\right)\right)\right) \end{equation*}

Преобразуем далее полученное выражение. Для этого воспользуемся свойством математического ожидания:

\begin{equation*} E\left(\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}\left(D_i\left(1\right)-D_i\left(0\right)\right)\right)= \end{equation*}

\begin{equation*} E\left(\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}1|D_i\left(1\right)-D_i\left(0\right)=1\right){\ast}P\left(D_i\left(1\right)-D_i\left(0\right)=1\right)+ \end{equation*}

\begin{equation*} +E\left(\left(Y_i\left(1\right)-Y_i\left(0\right)\right){\ast}0|D_i\left(1\right)-D_i\left(0\right)=0\right){\ast}P\left(D_i\left(1\right)-D_i\left(0\right)=0\right)= \end{equation*}

\begin{equation*} E\left(\left(Y_i\left(1\right)-Y_i\left(0\right)\right)|D_i\left(1\right)-D_i\left(0\right)=1\right){\ast}P\left(D_i\left(1\right)-D_i\left(0\right)=1\right)+0 \end{equation*}

Здесь мы опираемся на предпосылку 11.4, поэтому не включаем случай \(D_i\left(1\right)-D_i\left(0\right)=-1\), ведь в силу этой предпосылки такой случай невозможен.

Следовательно, дробь, записанная в формулировке теоремы, может быть преобразована так:

\begin{equation*} \frac{E\left(Y_i|Z_i=1\right)-E\left(Y_i|Z_i=0\right)}{E\left(D_i|Z_i=1\right)-E\left(D_i|Z_i=0\right)}= \end{equation*}

\begin{equation*} \frac{E\left(\left(Y_i\left(1\right)-Y_i\left(0\right)\right)|D_i\left(1\right)-D_i\left(0\right)=1\right){\ast}P\left(D_i\left(1\right)-D_i\left(0\right)=1\right)}{P\left(D_i\left(1\right)-D_i\left(0\right)=1\right)}= \end{equation*}

\begin{equation*} E\left(\left(Y_i\left(1\right)-Y_i\left(0\right)\right)|D_i\left(1\right)-D_i\left(0\right)=1\right)=\mathit{LATE}, \end{equation*}

что и требовалось доказать.

Предпосылка 11.3 необходима, чтобы знаменатель дроби не равнялся нулю.

Если заменить математические ожидания их выборочными аналогами, то получим оценку LATE:

\begin{equation*} \widehat {\mathit{LATE}}=\frac{\overline Y_1-\overline Y_0}{\overline D_1-\overline D_0} \end{equation*}

\(\overline Y_1\) — среднее значение зависимой переменной для индивидов, которые получили предписание. В нашем примере это средний доход тех, кто выиграл в лотерею.

\(\overline Y_0\) — среднее значение зависимой переменной для индивидов, которые не получили предписание. В нашем примере это средний доход тех, кто проиграл в лотерею.

\(\overline D_1\) — доля тех, кто подвергся воздействию, среди тех, кто получил предписание. В нашем примере это доля победителей лотереи, которые пошли служить.

\(\overline D_0\) — доля тех, кто подвергся воздействию, среди тех, кто не получил предписание. В нашем примере это доля проигравших в лотерею, которые при этом всё равно пошли служить.

Мы показали, что

\begin{equation*} E\left(D_i|Z_i=1\right)-E\left(D_i|Z_i=0\right)=P\left(D_i\left(1\right)-D_i\left(0\right)=1\right) \end{equation*}

Указанная вероятность — это доля послушных индивидов в генеральной совокупности. В свою очередь, величина \(\overline D_1-\overline D_0\) — это оценка разности матожиданий

\begin{equation*} E\left(D_i|Z_i=1\right)-E\left(D_i|Z_i=0\right) \end{equation*}

Следовательно, величина \(\overline D_1-\overline D_0\) является оценкой доли послушных индивидов в нашей выборке.

Если игнорировать различие между переменной предписания и переменной воздействия, то можно просто оценить влияние предписания на изменение зависимой переменной вот таким образом:

\begin{equation*} \mathit{ITT}=E\left(Y_i|Z_i=1\right)-E\left(Y_i|Z_i=0\right) \end{equation*}

Эта величина называется эффектом предписания (intention-to-treat effect, ITT effect).

Состоятельная оценка этой величины снова может быть вычислена путем замены матожиданий соответствующими средними: \(\widehat {\mathit{ITT}}=\overline{Y_1}-\overline{Y_0}\).

В силу доказанной нами теоремы

\begin{equation*} \mathit{LATE}=\frac{E\left(Y_i|Z_i=1\right)-E\left(Y_i|Z_i=0\right)}{E\left(D_i|Z_i=1\right)-E\left(D_i|Z_i=0\right)}=\frac{\mathit{ITT}}{P\left(D_i\left(1\right)-D_i\left(0\right)=1\right)} \end{equation*}

Так как знаменатель последней дроби лежит между нулем и единицей, то \(\left|\mathit{LATE}\right|{\geq}\left|\mathit{ITT}\right|\). Причем равенство достигается, только если выборка на 100% состоит из послушных индивидов.

Мы не зря упоминали двухшаговый МНК в начале этого параграфа. Дело в том, что в случае, когда инструментальная переменная и эндогенный регрессор являются бинарными, 2МНК-оценка совпадает с оценкой LATE (доказательству этого факта посвящено одно из упражнений в конце главы).

Таким образом, идеология LATE полезна в том числе тем, что в условиях гетерогенного эффекта воздействия позволяет четко определить, что именно мы оцениваем, используя 2МНК: эффект воздействия политики для индивидов, которые следуют предписанию.


  1. Напомним, что здесь речь идет не о лотерее с денежным выигрышем, а о лотерее, победители которой получали повестку от министерства обороны.