10.4. Пробит-модель

Альтернативным способом оценивать параметры модели бинарного выбора является пробит-модель.

Её отличие от логит-модели состоит в том, что вместо логистической функции для описания вероятности наступления события используется функция стандартного нормального распределения.

\(P\left( Y_{i} = 1 \right) = Ф\left( z_{i} \right) = Ф\left( \beta_{1} + \beta_{2}*{x_{i}}^{(2)} + \ldots + \beta_{k}*{x_{i}}^{(k)} \right),\)

\(z_{i} = \beta_{1} + \beta_{2}*{x_{i}}^{(2)} + \ldots + \beta_{k}*{x_{i}}^{(k)}\)

Здесь \(Ф\left( z_{i} \right)\) — функция стандартного нормального распределения.

Оценивание, тестирование гипотез и интерпретация результатов в рамках пробит-анализа проводится полностью аналогично случаю логит-анализа с поправкой на использование функции стандартного нормального распределения вместо логистической функции. В частности, предельный эффект изменения переменной \(x^{(j)}\) может быть вычислен вот так:

\(\frac{\partial P\left( Y_{i} = 1 \right)}{\partial x^{(j)}} = Ф'\left( \beta_{1} + \beta_{2}*{x_{i}}^{(2)} + \ldots + \beta_{k}*{x_{i}}^{(k)} \right)*\beta_{j} =\)

\(= \frac{1}{\sqrt{2\pi}}e^{- \ \frac{\left( \beta_{1} + \beta_{2}*{x_{i}}^{(2)} + \ldots + \beta_{k}*{x_{i}}^{(k)} \right)^{2}}{2}}*\beta_{j}.\)

Здесь \(Ф'( \bullet )\) — производная от функции стандартного нормального распределения, то есть функция плотности вероятности стандартного нормального распределения. Аналогично тому, что мы обсуждали в параграфе 10.2, на практике этот предельный эффект часто вычисляют в точке средних значений регрессоров.

При значениях аргумента, не слишком далеких от нуля, логистическая функция и функция стандартного нормального распределения ведут себя сходным образом, поэтому предельные эффекты, оцененные с использованием логит- и пробит-моделей оказываются примерно одинаковыми. Это делает выбор между двумя указанными подходами непринципиальным. В случае, если результаты их применения все-таки отличаются, можно выбирать модель, характеризующуюся более высоким значением функции правдоподобия и лучшими значениями характеристик качества подгонки модели, которые мы обсудили в параграфе 10.3.

Пример 10.2. Вероятность сдачи зачета

На основе пробит-модели бинарного выбора исследователь анализирует вероятность сдать зачет по некоторому курсу. Исследователь собрал данные о 250 студентах, сдававших зачет: Pass — бинарная переменная, равная единице, если студент сдал зачет; Lectures — количество посещенных студентом лекций по курсу; Male — фиктивная переменная, равная единице для мужчин и нулю для женщин.

В таблице представлены результаты оценивания модели:

Dependent Variable: Pass
	Probit
Lectures	0,20 (0,03)
Male	– 0,50 (0,02)
Lectures *Male	– 0,05 (0,02)
Constant	– 1,00 (0,12)

(a) Какие коэффициенты в модели являются значимыми?

(б) Иван и Дарья посетили по 10 лекций, но пропустили зачет и будут писать его позже. Используя оцененную модель, вычислите вероятность сдать зачет для каждого из них.

(в) Вычислите предельный эффект посещения лекций для Дарьи.

Решение:

(а) Для всех коэффициентов отношение оценки коэффициента к стандартной ошибке по модулю больше, чем 1,96. Поэтому все коэффициенты статистически значимо отличаются от нуля при уровне значимости 5%.

(б) Для Ивана: z=0,2*10-0,5*1-0,05*10-1=0. Ф(z)=Ф(0)=0,5. Вероятность сдать зачет равна 50% (здесь Ф(z) — функция стандартного нормального распределения).

Для Дарьи: z=0,2*10-0,5*0-0,05*0-1=1. Ф(z)=Ф(1)=0,84. Вероятность сдать зачет равна 84%.

(в) \(\frac{1}{\sqrt{2\pi}}e^{- \frac{z^{2}}{2}}*0,2 = \frac{1}{\sqrt{2\pi}}e^{- \frac{1^{2}}{2}}*0,2 = 0,24*0,2 = 0,048\). Одна дополнительная лекция увеличит вероятность получения зачета примерно на 5 процентных пунктов.