Учебник+

11.2. Оценка эффекта воздействия методом разности разностей

Описание метода разность разностей удобно сразу осуществить на примере конкретного исследования. Для этого мы воспользуемся работой Карда и Крюгера (Card, Kreuger, 1994).

В 1992 году в штате Нью-Джерси минимальный размер оплаты труда был увеличен с 4,25 до 5,05 долларов. Экономическая теория подсказывает, что подобное решение должно сказаться на занятости работников с низкой квалификацией (ведь именно их труд часто оплачивается по минимальной ставке). Эту гипотезу решили проверить Кард и Крюгер в своей работе. Они собрали данные о занятости работников в ресторанах быстрого питания. Таким образом, отдельный объект в их выборке — это один ресторан быстрого питания. А зависимая переменная — число работников, занятых в этом ресторане полный рабочий день.

Таким образом, средний эффект воздействия (average treatment effect), который интересует авторов работы, — это среднее изменение занятости в ресторане быстрого питания в Нью-Джерси в результате принятия нового закона о минимальной заработной плате.

Как можно было бы посчитать это изменение?

Первый, довольно наивный, подход — взять данные по Нью-Джерси до и после изменения минимальной заработной платы и сравнить их между собой. Этот подход плох, потому что занятость с течением времени может изменяться не только в результате изменения заработной платы, но и по каким-то другим причинам. Есть множество глобальных факторов, которые влияют на всю Америку в целом и могли сказаться на занятости. И, сравнивая такие средние значения до и после, мы не можем понять, влияет ли на происходящее минимальная зарплата или дело в каких-то других факторах. Например, в США могла начаться рецессия, которая способствовала бы снижению занятости во всех штатах, независимо от экономической политики на рынке труда. Или в ресторанном бизнесе могла быть внедрена новая продвинутая технология, которая позволила снизить спрос на труд низкоквалифицированных работников в этой отрасли.

Второй подход состоит в том, чтобы сравнить занятость в среднем ресторане в Нью-Джерси (то есть в испытуемой группе) со средней занятостью в каком-нибудь другом штате, где минимальная зарплата не изменилась (то есть в контрольной группе). Например, в Пенсильвании, в которой в тот же самый период времени минимальная заработная плата осталась на прежнем уровне. Понятно, что такой подход тоже не совершенен. В отличие от совсем «честного» эксперимента, когда мы случайным образом делим рестораны на две группы, здесь эксперимент не совсем чистый, потому что все рестораны первой группы находятся в одном штате, а рестораны второй группы – в другом. И эти штаты, вполне возможно, хотя они и похожи, отличаются не только минимальной зарплатой, но какими-то ещё характеристиками. И поэтому снова невозможно выяснить, объясняются ли различия в занятости в этих двух штатах именно различием в минимальной заработной плате или чем-то ещё.

Вместо каждого из двух указанных подходов можно применить альтернативный метод, который объединяет их преимущества и помогает избежать недостатков. Чтобы понять, как он работает, перечислим основные факторы, которые могут влиять на занятость в типичном ресторане:

  • специфические особенности штата, в котором расположен ресторан (эффект штата);
  • особенности различных периодов времени, скажем, изменение экономической конъюнктуры (временной эффект);
  • эффект изменения минимальной заработной платы (тот самый эффект, который мы пытаемся оценить).

Формально мы можем записать это так:

\begin{equation*} Y_{\mathit{ist}}=\alpha _s+\mu _t+\delta {\ast}D_{\mathit{ist}}+\varepsilon _{ist} \end{equation*}

Здесь индекс i обозначает номер ресторана, индекс s обозначает штат (Нью-Джерси или Пенсильвания), индекс t — момент времени (период до изменения заработной платы в Нью-Джерси или период после него).

\(Y_{\mathit{ist}}\) — число работников, занятых в данном ресторане.

Переменная D равна единице в тех ресторанах, которые находятся в Нью-Джерси в тот период, когда там поменялась заработная плата, и равна нулю во всех остальных случаях.

\(\alpha _s\) — эффект штата. Он имеет два значения: \(\alpha _{\mathit{control}}\), если наблюдение относится к контрольной группе, то есть к Пенсильвании; \(\alpha _{\mathit{treatment}}\) если наблюдение относится к испытуемой группе, то есть к Нью-Джерси.

\(\mu _t\) — временной эффект. Он равен \(\mu _{\mathit{before}}\) до изменения заработной платы и \(\mu _{\mathit{after}}\) после изменения.

\(\delta \) — эффект воздействия увеличения заработной платы на занятость. Это тот самый эффект, который требуется оценить.

\(\varepsilon _{\mathit{ist}}\) — случайные ошибки модели

Определим ожидаемое количество занятых в ресторане Нью-Джерси до изменения заработной платы:

\begin{equation*} E\left(Y_{\mathit{ist}}\left|s=\mathit{treatment},t=\mathit{before}\right.\right)=\mu _{\mathit{before}}+\alpha _{\mathit{treatment}} \end{equation*}

Определим ожидаемое количество занятых в ресторане Нью-Джерси после изменения:

\begin{equation*} E\left(Y_{\mathit{ist}}\left|s=\mathit{treatment},t=\mathit{after}\right.\right)=\mu _{\mathit{after}}+\alpha _{\mathit{treatment}}+\delta \end{equation*}

Вычитая из второго математического ожидания первое, получим ожидаемое изменение занятости в Нью-Джерси:

\begin{equation*} {\Delta}_{\mathit{treatment}}=\mu _{\mathit{after}}-\mu _{\mathit{before}}+\delta \end{equation*}

Теперь определим ожидаемое количество занятых в ресторане Пенсильвании до изменения заработной платы:

\begin{equation*} E\left(Y_{\mathit{ist}}\left|s=\mathit{control},t=\mathit{before}\right.\right)=\mu _{\mathit{before}}+\alpha _{\mathit{control}} \end{equation*}

Определим ожидаемое количество занятых в ресторане Пенсильвании после изменения:

\begin{equation*} E\left(Y_{\mathit{ist}}\left|s=\mathit{control},t=\mathit{after}\right.\right)=\mu _{\mathit{after}}+\alpha _{\mathit{control}} \end{equation*}

Аналогично прошлому случаю, вычитая из второго математического ожидания первое, получим ожидаемое изменение занятости в Пенсильвании:

\begin{equation*} {\Delta}_{\mathit{control}}=\mu _{\mathit{after}}-\mu _{\mathit{before}} \end{equation*}

Осталось вычесть из первой разности (из \({\Delta}_{\mathit{treatment}}\)) вторую разность ( \({\Delta}_{\mathit{control}}\)), то есть найти ту самую разность разностей, которая дала название анализируемому методу:

\begin{equation*} {\Delta}_{\mathit{treatment}}-{\Delta}_{\mathit{control}}=\delta \end{equation*}

Таким образом, мы показали, что интересующий нас эффект воздействия может быть представлен как разность разностей условных математических ожиданий:

\begin{equation*} \delta ={\Delta}_{\mathit{treatment}}-{\Delta}_{\mathit{control}}= \end{equation*}

\begin{equation*} \left[E\left(Y_{\mathit{ist}}\left|s=\mathit{treatment},t=\mathit{after}\right.\right)-E\left(Y_{\mathit{ist}}\left|s=\mathit{treatment},t=\mathit{before}\right.\right)\right]- \end{equation*}

\begin{equation*} -\left[E\left(Y_{\mathit{ist}}\left|s=\mathit{control},t=\mathit{after}\right.\right)-E\left(Y_{\mathit{ist}}\left|s=\mathit{control},t=\mathit{before}\right.\right)\right] \end{equation*}

В силу закона больших чисел состоятельной оценкой каждого из этих математических ожиданий является соответствующее среднее значение. Следовательно, состоятельная оценка эффекта воздействия в данном случае может быть рассчитана так:

\begin{equation*} \widehat {\delta }= \end{equation*}

\begin{equation*} \left[\overline Y_{\mathit{treatment},\mathit{after}}-\overline Y_{\mathit{treatment},\mathit{before}}\right]-\left[\overline Y_{\mathit{control},\mathit{after}}-\overline Y_{\mathit{control},\mathit{before}}\right]\left(11.2\right) \end{equation*}

Здесь \(\overline Y_{\mathit{control},\mathit{before}}\) — средний уровень зависимой переменной в контрольной группе до осуществления воздействия (в нашем случае — это средний уровень занятости в ресторанах Пенсильвании до изменения минимальной заработной платы в Нью-Джерси);

\(\overline Y_{\mathit{control},\mathit{after}}\) — средний уровень зависимой переменной в контрольной группе после осуществления воздействия (в нашем случае — это средний уровень занятости в ресторанах Пенсильвании после изменения минимальной заработной платы в Нью-Джерси);

\(\overline Y_{\mathit{treatment},\mathit{before}}\) — средний уровень зависимой переменной в испытуемой группе до осуществления воздействия (в нашем случае — это средний уровень занятости в ресторанах Нью-Джерси до изменения минимальной заработной платы);

\(\overline Y_{\mathit{treatment},\mathit{after}}\) — средний уровень зависимой переменной в испытуемой группе после осуществления воздействия (в нашем случае — это средний уровень занятости в ресторанах Нью-Джерси после изменения минимальной заработной платы);

Таблица 11.2. Оценка воздействия увеличения минимальной заработной платы на занятость методом разности разностей

Переменная Пенсильвания Нью-Джерси  
    (1) (2) (3)=(2)–(1)
1. Среднее число занятых в одном ресторане до изменения минимальной зарплаты 23,33
(1,35)
20,44
(0,51)
-2,89
(1,44)
2. Среднее число занятых в одном ресторане после изменения минимальной зарплаты 21,17
(0,94)
21,03
(0,52)
-0,14
(1,07)
3. Изменение среднего числа занятых -2,16
(1,25)
0,59
(0,54)
2,76
(1,36)

Примечания: в скобках под средними значениями указаны соответствующие стандартные ошибки. Источник: (Card, Kreuger, 1994)

Результаты расчетов эффекта воздействия на реальных данных приведены в таблице 11.2. В соответствии с ней эффект воздействия равен:

\begin{equation*} \widehat {\delta }=\left[\overline Y_{\mathit{treatment},\mathit{after}}-\overline Y_{\mathit{treatment},\mathit{before}}\right]-\left[\overline Y_{\mathit{control},\mathit{after}}-\overline Y_{\mathit{control},\mathit{before}}\right]= \end{equation*}

\begin{equation*} \left[21,03-20,44\right]-\left[21,17-23,33\right]=2,76. \end{equation*}

На первый взгляд может показаться, что правильный ответ равен 2,75, а в таблице из статьи и в наших выкладках выписано число 2,76. Это расхождение возникает из-за округлений при промежуточных вычислениях (см. статью).

Можно заключить, что повышение минимальной заработной платы привело к увеличению равновесного уровня занятости в ресторанах быстрого питания Нью-Джерси в среднем на 2,76 человека. Этот результат противоречит выводам стандартных теоретических моделей из микроэкономики (или экономики труда), поэтому вызвал большое обсуждение в литературе. Вы можете посмотреть для деталей статью Карда и Крюгера, а также цитирующие её более поздние работы, в которых предпринимаются попытки уточнить и объяснить полученные в ней оценки.

Нас же этот пример интересует в качестве иллюстрации применения метода разности разностей. Кроме того, описанная здесь история является примером квазиэксперимента, то есть ситуации, когда распределение объектов на контрольную и испытуемую группу осуществляется не в ходе контролируемого эксперимента, а в силу некоторых внешних обстоятельств, которые при этом позволяют все-таки получить корректную оценку эффекта воздействия.

Геометрическая интерпретация применения метода разности разностей представлена на рисунке 11.1. Пунктирная линия на нём показывает, как менялась бы занятость в Нью-Джерси, если бы этот штат не подвергся воздействию. Подход разности разностей предполагает, что в этом случае динамика занятости была бы аналогична контрольной группе (что в нашем примере означает снижение числа работников).

pic

Рисунок 11.1. Геометрическая иллюстрация метода разности разностей

Метод разности разностей непосредственно связан с оценкой моделей при помощи регрессий. В частности, если вы располагаете панельными данными об объектах из испытуемой и контрольной групп за два периода (до и после проведения политики), оценка метода разности разностей может быть получена в результате применения следующей модели:

\begin{equation*} Y_{\mathit{it}}=\beta _0+\beta _1{\ast}x_i+\beta _2{\ast}z_t+\delta {\ast}x_i{\ast}z_t+\varepsilon _{\mathit{it}}\left(11.3\right) \end{equation*}

\(x_i\) — бинарная переменная, которая равна единице, если \(i\)-ый ресторан расположен в Нью-Джерси (то есть относится к испытуемой группе).

\(z_t\)— бинарная переменная, которая равна единице для всех наблюдений, относящихся ко второму периоду (периоду после повышения минимальной зарплаты).

В этом случае, применив МНК, получим следующее уравнение:

\begin{equation*} \widehat Y_{\mathit{it}}=\widehat {\beta }_0+\widehat {\beta }_1{\ast}x_i+\widehat {\beta }_2{\ast}z_t+\widehat {\delta }{\ast}x_i{\ast}z_t \end{equation*}

Можно доказать (см. задание в конце главы), что:

\begin{equation*} \widehat {\beta }_0=\overline Y_{\mathit{control},\mathit{before}}, \end{equation*}

\begin{equation*} \widehat {\beta }_1=\overline Y_{\mathit{treatment},\mathit{before}}-\overline Y_{\mathit{control},\mathit{before}}, \end{equation*}

\begin{equation*} \widehat {\beta }_2=\overline Y_{\mathit{control},\mathit{after}}-\overline Y_{\mathit{control},\mathit{before}}, \end{equation*}

\begin{equation*} \widehat {\delta }=\left[\overline Y_{\mathit{treatment},\mathit{after}}-\overline Y_{\mathit{treatment},\mathit{before}}\right]-\left[\overline Y_{\mathit{control},\mathit{after}}-\overline Y_{\mathit{control},\mathit{before}}\right]. \end{equation*}

Таким образом, коэффициент при произведении \(x_i{\ast}z_t\) равен той самой оценке эффекта воздействия, которую мы вывели выше.

Эквивалентный способ оценивания состоит в применении МНК к следующей парной регрессии:

\begin{equation*} {\Delta}Y_i=\beta _2+\delta {\ast}x_i+u_i.\left(11.4\right) \end{equation*}

Здесь \(x_i\) — по-прежнему бинарная переменная, которая равна единице, если \(i\)-ый объект относится к испытуемой группе, а \({\Delta}Y_i=Y_{i1}-Y_{i0}\). Если применить к этой модели МНК, то оценка коэффициента при регрессоре снова будет задаваться формулой (11.2).

Для состоятельности этой оценки требуется, чтобы в уравнении (11.3) выполнялись все предпосылки модели со стохастическим регрессором (см. главу 6). В частности, требуется экзогенность объясняющей переменной. Если регрессор оказывается эндогенным из-за пропуска других существенных факторов, влияющих на \({\Delta}Y\), то эта проблема может быть, как обычно, решена включением в уравнение (11.3) контрольных переменных.

Иными словами, метод разности разностей может быть дополнен при помощи учета контрольных переменных, что делает его взаимосвязь с прочими моделями на панельных данных ещё более тесной.

В то же время у метода разности разностей есть важное преимущество по сравнению с ними. Дело в том, что иногда вместо панельных данных вам доступны лишь так называемые повторяющиеся пространственные данные. Это означает, что для разных периодов имеются данные по различным объектам. Скажем, в нашем примере про рестораны быстрого питания это означало бы, что до изменения заработной платы исследователи опросили бы одни рестораны, а после изменения — другие. Тогда непосредственно оценить уравнение (11.3) было бы невозможно, так как нельзя было бы рассчитать разности \({\Delta}Y_i=Y_{i1}-Y_{i0}\) (потому что по каждому отдельному объекту доступны данные только для одного из двух периодов). Однако интересующий нас эффект воздействия всё ещё мог бы быть рассчитан при помощи метода разности разностей по формуле (11.2).

Метод разности разностей широко используется в современных прикладных исследованиях для анализа последствий применения тех или иных мер экономической политики.