10.2. Логит-модель: введение

В рамках логит-анализа для описания вероятности наступления события используется логистическая функция:

\(F\left( z_{i} \right) = \frac{1}{1 + e^{- z_{i}}}.\)

График этой функции представлен на рисунке 10.1. Она всегда принимает значения в пределах от нуля до единицы, что позволяет преодолеть основной недостаток линейной модели вероятности, упомянутый в предыдущем параграфе.

Рисунок 10.1. График логистической функции

Если мы анализируем случай парной взаимосвязи (то есть случай, когда вероятность наступления события зависит от единственного фактора x), то логит-модель может быть записана так:

\(P\left( y_{i} = 1 \right) = F\left( z_{i} \right) = \frac{1}{1 + e^{- z_{i}}},\ \ где\ z_{i} = \beta_{1} + \beta_{2}x_{i}.\)

\(P\left( y_{i} = 1 \right) = \frac{1}{1 + e^{- (\beta_{1} + \beta_{2}x_{i})}}\)

Для оценивания такой модели применить обычный МНК не получится, так как параметры входят в уравнение нелинейно. Кроме того, невозможно свести модель к линейной по параметрам подобно тому, как мы делали это в главе 4 при помощи перехода к логарифмам. Поэтому для оценки логит-модели используется метод максимального правдоподобия (ММП).

С деталями процедуры оценивания можно познакомиться в параграфе 10.3. Здесь мы доверим эту работу эконометрическому пакету, а сами сосредоточимся на том, как можно интерпретировать результаты логит-модели. Для этого вернемся к нашему примеру про вероятность успешной сдачи зачета в зависимости от времени, затраченного на подготовку (см. таблицу 10.2).

Таблица 10.2. Результаты оценки вероятности сдачи зачета при помощи логит-модели

Зависимая переменная: y
	Коэффициент	Ст. ошибка	z
const	-9,00	0,50	-18,00
x	0,50	0,04	10,00

В соответствии с таблицей 10.2 оценённая вероятность сдачи зачета имеет следующий вид:

\(\widehat{P}\left( y_{i} = 1 \right) = \frac{1}{1 + e^{- ( - 9 + 0,5x_{i})}}\)

Как можно интерпретировать подобные результаты?

Во-первых, можно оценить вероятность наступления интересующего нас события в тех или иных условиях. Например, если студент затратил на подготовку 15 часов, то какова вероятность сдать зачет? Для ответа на вопрос достаточно подставить в формулу \(x_{i} = 15\) и вычислить вероятность. В нашем случае она равна 0,18. То есть для студента, который готовился 15 часов, вероятность сдать зачет составляет 18%.

Во-вторых, можно интерпретировать результаты в терминах изменения зависимой переменной в результате изменения регрессора. Для этого следует найти так называемый предельный эффект изменения регрессора, то есть вычислить, на сколько меняется вероятность наступления события при небольшом изменении переменной \(x\). Для этого посчитаем производную вероятности по \(x\):

\(\frac{\text{dP}\left( y_{i} = 1 \right)}{\text{dx}} = \frac{e^{- (\beta_{1} + \beta_{2}x)}}{\left( 1 + e^{- \left( \beta_{1} + \beta_{2}x \right)} \right)^{2}}*\beta_{2}\)

В нашем примере для студента, который готовился к зачету 15 часов, оценка предельного эффекта составит:

\(\frac{d\widehat{P}\left( y_{i} = 1 \right)}{\text{dx}} = \frac{e^{- ( - 9 + 0,5*15)}}{{(1 + e^{- ( - 9 + 0,5*15)})}^{2}}*0,5 = 0,07\)

То есть дополнительный час подготовки для нашего студента увеличит вероятность сдачи зачета примерно на 7 процентных пунктов.

Геометрически предельный эффект (как и любая производная) характеризует наклон функции. Так как у логистической функции разный наклон в разных точках (см. рис. 10.1), то и предельный эффект для разных значений регрессора будет отличаться. Скажем, для студента, который затратил на подготовку не 15 часов, а 100 часов, предельный эффект будет гораздо меньше:

\(\frac{d\widehat{P}\left( y_{i} = 1 \right)}{\text{dx}} = \frac{e^{- ( - 9 + 0,5*100)}}{{(1 + e^{- ( - 9 + 0,5*100)})}^{2}}*0,5 = 0,0000000000000000008\)

В нашем примере это, по всей видимости, означает, что студент, который готовится уже целых 100 часов, и так знает всё, что нужно, и имеет вероятность сдачи зачета, близкую к ста процентам. Поэтому от ещё одного дополнительного часа подготовки толку практически не будет.

С прикладной точки зрения непостоянство предельного эффекта порождает некоторую сложность: не очень понятно, в какой именно точке его считать. На практике для этого обычно используется один из двух вариантов:

предельный эффект для среднего по выборке. В нашем примере работает следующим образом: вычисляем среднее по выборке время подготовки к зачету \(\overline{x}\), а затем считаем предельный эффект в точке \(\overline{x}\);
средний предельный эффект: вычисляем предельный эффект для каждого студента, затем считаем среднее значение из \(n\) предельных эффектов.

Говоря про интерпретацию результатов логит-модели, следует отдельно упомянуть интерпретацию коэффициентов при фиктивных переменных. Представим, например, что в нашей истории про вероятность сдачи зачета регрессором теперь является бинарная переменная. Пусть, например, x —переменная, которая равна единице для тех студентов, которые в прошлом в школе учились в математическом классе (и равна нулю для всех остальных). Представим для определённости, что, оценив логит-модель, мы получили вот такие результаты:

\(\widehat{P}\left( y_{i} = 1 \right) = \frac{1}{1 + e^{- ( - 2,0 + 2,0*x)}}\)

Использовать здесь для интерпретации подход с вычислением предельного эффекта — это не слишком удачная идея, так как предельный эффект (как и любая производная) показывает изменение функции при бесконечно малом изменении аргумента. Однако в случае бинарной переменной аргумент не может меняться на бесконечно малую величину: он равен либо нулю, либо единице. Вместо этого удобно вычислить изменение вероятности наступления события в результате изменения регрессора с 0 до 1.

В нашем примере с бинарной переменной математического класса можно посчитать вероятность сдать зачёт для студента не из математического класса (т. е. для студента, для которого х равен 0). Для этого надо просто в формулу вероятности подставить х, равный 0 (получится \(\frac{1}{1 + e^{2}}\)). А потом можно посчитать вероятность наступления этого события для студента из математического класса (т. е. для студента, для которого х равен 1). Для этого надо подставить 1 в выражение для вероятности (получится\(\ \frac{1}{1 + e^{0}}\)). Потом следует просто сравнить эти две вероятности:

\(\widehat{p}(x = 1) - \widehat{p}(x = 0) = \frac{1}{1 + e^{0}} - \frac{1}{1 + e^{2}} = 0,38\)

Это будет значить, что для выпускников из математической школы по сравнению с выпускниками других школ вероятность получить зачёт на 0,38 больше (т. е. на 38 процентных пунктов больше).