Альтернативным способом оценивать параметры модели бинарного выбора является пробит-модель.
Её отличие от логит-модели состоит в том, что вместо логистической функции для описания вероятности наступления события используется функция стандартного нормального распределения.
\(P\left( Y_{i} = 1 \right) = Ф\left( z_{i} \right) = Ф\left( \beta_{1} + \beta_{2}*{x_{i}}^{(2)} + \ldots + \beta_{k}*{x_{i}}^{(k)} \right),\)
\(z_{i} = \beta_{1} + \beta_{2}*{x_{i}}^{(2)} + \ldots + \beta_{k}*{x_{i}}^{(k)}\)
Здесь \(Ф\left( z_{i} \right)\) — функция стандартного нормального распределения.
Оценивание, тестирование гипотез и интерпретация результатов в рамках пробит-анализа проводится полностью аналогично случаю логит-анализа с поправкой на использование функции стандартного нормального распределения вместо логистической функции. В частности, предельный эффект изменения переменной \(x^{(j)}\) может быть вычислен вот так:
\(\frac{\partial P\left( Y_{i} = 1 \right)}{\partial x^{(j)}} = Ф'\left( \beta_{1} + \beta_{2}*{x_{i}}^{(2)} + \ldots + \beta_{k}*{x_{i}}^{(k)} \right)*\beta_{j} =\)
\(= \frac{1}{\sqrt{2\pi}}e^{- \ \frac{\left( \beta_{1} + \beta_{2}*{x_{i}}^{(2)} + \ldots + \beta_{k}*{x_{i}}^{(k)} \right)^{2}}{2}}*\beta_{j}.\)
Здесь \(Ф'( \bullet )\) — производная от функции стандартного нормального распределения, то есть функция плотности вероятности стандартного нормального распределения. Аналогично тому, что мы обсуждали в параграфе 10.2, на практике этот предельный эффект часто вычисляют в точке средних значений регрессоров.
При значениях аргумента, не слишком далеких от нуля, логистическая функция и функция стандартного нормального распределения ведут себя сходным образом, поэтому предельные эффекты, оцененные с использованием логит- и пробит-моделей оказываются примерно одинаковыми. Это делает выбор между двумя указанными подходами непринципиальным. В случае, если результаты их применения все-таки отличаются, можно выбирать модель, характеризующуюся более высоким значением функции правдоподобия и лучшими значениями характеристик качества подгонки модели, которые мы обсудили в параграфе 10.3.
Пример 10.2. Вероятность сдачи зачета
На основе пробит-модели бинарного выбора исследователь анализирует вероятность сдать зачет по некоторому курсу. Исследователь собрал данные о 250 студентах, сдававших зачет: Pass — бинарная переменная, равная единице, если студент сдал зачет; Lectures — количество посещенных студентом лекций по курсу; Male — фиктивная переменная, равная единице для мужчин и нулю для женщин.
В таблице представлены результаты оценивания модели:
Dependent Variable: Pass | |
---|---|
Probit | |
Lectures |
0,20 (0,03) |
Male |
– 0,50 (0,02) |
Lectures *Male |
– 0,05 (0,02) |
Constant |
– 1,00 (0,12) |
(a) Какие коэффициенты в модели являются значимыми?
(б) Иван и Дарья посетили по 10 лекций, но пропустили зачет и будут писать его позже. Используя оцененную модель, вычислите вероятность сдать зачет для каждого из них.
(в) Вычислите предельный эффект посещения лекций для Дарьи.
Решение:
(а) Для всех коэффициентов отношение оценки коэффициента к стандартной ошибке по модулю больше, чем 1,96. Поэтому все коэффициенты статистически значимо отличаются от нуля при уровне значимости 5%.
(б) Для Ивана: z=0,2*10-0,5*1-0,05*10-1=0. Ф(z)=Ф(0)=0,5. Вероятность сдать зачет равна 50% (здесь Ф(z) — функция стандартного нормального распределения).
Для Дарьи: z=0,2*10-0,5*0-0,05*0-1=1. Ф(z)=Ф(1)=0,84. Вероятность сдать зачет равна 84%.
(в) \(\frac{1}{\sqrt{2\pi}}e^{- \frac{z^{2}}{2}}*0,2 = \frac{1}{\sqrt{2\pi}}e^{- \frac{1^{2}}{2}}*0,2 = 0,24*0,2 = 0,048\). Одна дополнительная лекция увеличит вероятность получения зачета примерно на 5 процентных пунктов.