Во второй и третьей главах, обсуждая тестирование гипотез относительно отдельных коэффициентов, мы использовали тот факт, что отношение \(\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\) имеет t-распределение Стьюдента с \((n-k)\) степенями свободы. Однако в асимптотическом случае это число степеней свободы стремится к бесконечности. Из математической статистики известно, что при неограниченном увеличении числа степеней свободы случайная величина, имеющая распределение Стьюдента, сходится к нормальной случайной величине. Это несколько упрощает процедуру тестирования гипотезы о незначимости коэффициента, которая теперь устроена так:
Процедура тестирования незначимости коэффициента в модели множественной регрессии при использовании асимптотического подхода:
- Формулируем тестируемую гипотезу \(H_0:\beta _j=0\) («переменная \(x^{(j)}\) не влияет на переменную y») и альтернативную гипотезу \(H_1:\beta _j{\neq}0\) («переменная \(x^{(j)}\) влияет на переменную y»).
- Находим расчетное значение тестовой статистики по формуле \(\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\).
- Вычисляем P-значение по формуле
P-значение \(=2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right)\).
Здесь \(\text{Ф}\left({\bullet}\right)\) обозначает функцию стандартного нормального распределения.
- Выбираем уровень значимости \(\alpha \).
- Если P-значение меньше уровня значимости:
\(2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right)<\alpha \),
то следует отвергнуть гипотезу \(H_0:\beta _j=0\) и сделать вывод в пользу альтернативной гипотезы, то есть заключить, что переменная \(x^{(j)}\) влияет на переменную y. В этом случае переменную \(x^{(j)}\) называют статистически значимой при уровне значимости \(\alpha \).
Замечание 1. Как и прежде, вместо вычисления P-значения можно сравнивать расчетное значение тестовой статистики с критическим значением из таблицы стандартного нормального распределения. Например, при уровне значимости 1% ( \(\alpha =0,01\)) получаем следующее условие для отвержения нулевой гипотезы:
\begin{equation*} 2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right)<0,01. \end{equation*}
Это условие эквивалентно неравенству
\begin{equation*} \left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|>2,58. \end{equation*}
Поэтому при использовании асимптотического подхода критическое значение тестовой статистики при уровне значимости 1% составляет 2,58. Аналогично легко проверить, что при уровне значимости 5% оно равно 1,96.
Отсюда следует, что 99-процентный и 95-процентный асимптотические доверительные интервалы для коэффициента, соответственно, составляют:
\begin{equation*} \left(\widehat {\beta }_j-\mathit{se}\left(\widehat {\beta }_j\right)\ast 2,58,\widehat {\beta }_j+\mathit{se}\left(\widehat {\beta }_j\right)\ast 2,58\right) \end{equation*}
и
\begin{equation*} \left(\widehat {\beta }_j-\mathit{se}\left(\widehat {\beta }_j\right)\ast 1,96,\widehat {\beta }_j+\mathit{se}\left(\widehat {\beta }_j\right)\ast 1,96\right). \end{equation*}
В Приложении 6.Б обсуждается построение доверительных интервалов для нелинейных относительно коэффициентов выражений. Оказывается, что асимптотический подход позволяет решать и такую задачу. Для этого применяется так называемый дельта-метод.
Замечание 2. Аналогичным образом можно тестировать гипотезу \(H_0:\beta _j=c\), где c — это некоторая константа. В этом случае процедура тестирования остается такой же с одним исключением: расчетное значение тестовой статистики будет иметь вид \(\frac{\widehat {\beta }_j-c}{\mathit{se}\left(\widehat {\beta }_j\right)}\) и, следовательно, P-значение рассчитывается по формуле:
P-значение \(=2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j-c}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right).\)
Замечание 3. Не забудьте, что, так как в рамках нашей новой модели мы отказались от предположения о гомоскедастичности, стандартные ошибки для осуществления этого теста должны быть получены на основе формул стандартных ошибок, состоятельных в условиях гетероскедастичности. К счастью, все современные эконометрические пакеты умеют легко рассчитывать их автоматически.
В случае тестирования гипотез по поводу выполнения сразу нескольких линейных ограничений также можно использовать все стандартные варианты F-теста, которые подробно рассмотрены в параграфе 3.5.
Единственное отличие состоит в том, что теперь если верна нулевая гипотеза данного теста, то расчетное значение тестовой статистики имеет не распределение Фишера с q и \((n-k)\) степенями свободы \(F(q,\text{ }n-k)\). Теперь это распределение Фишера с q и \( \infty \) степеней свободы \(F(q, \infty )\), так как \(n\rightarrow \infty \). Поэтому для получения критических значений следует использовать таблицу распределения Фишера \(F^{\alpha }(q, \infty )\) или таблицу распределения Хи-квадрат, так как случайная величина с распределением \(\chi ^2\left(q\right)\) в \(q\) раз больше случайной величины с распределением \(F(q, \infty )\).
Ограничение такого подхода к тестированию совместных ограничений состоит в том, что стандартный F-тест опять же требует гомоскедастичности случайных ошибок. Поэтому, чтобы получить корректные в условиях гетероскедастичности результаты тестирования гипотезы, используется специальное обобщение F-теста. В качестве такого обобщения можно применять, например, тест Вальда.
Идея теста Вальда похожа на идею использования состоятельных в условиях гетероскедастичности стандартных ошибок: расчетное значение тестовой статистики корректируется с учетом возможной гетероскедастичности. Поэтому вас не должно удивлять, если при использовании робастных стандартных ошибок ваш эконометрический пакет для проверки значимости уравнения или для сравнения «короткой» и «длинной» регрессий начинает использовать тест Вальда вместо F-теста (что приводит к соответствующей корректировке значений тестовых статистик). Интерпретировать его результаты можно аналогичным образом.
Более полное описание процедуры теста Вальда требует знакомства с матричной формой записи для множественной регрессии (параграф 3.3) и обобщенной линейной моделью множественной регрессии (параграф 5.5). Если вы разобрались и с тем, и с другим, то можно читать дальше.
Пусть тестируемая гипотеза, как и в параграфе 3.6, имеет вид:
\begin{equation*} \mathit{H\beta }=r. \end{equation*}
Здесь \(\beta \) — вектор коэффициентов модели. \(H\) — матрица размера q на k, \(r\) — вектор-столбец длины q. В свою очередь, q — количество тестируемых ограничений, то есть количество уравнений в системе ограничений, k — число коэффициентов в модели.
Расчетное значение тестовой статистики теста Вальда для тестирования гипотезы \(\mathit{H\beta }=r\) имеет вид:
\begin{equation*} \left(H\widehat {\beta }-r\right)'\left(H\left(X'\Omega ^{-1}X\right)^{-1}H'\right)^{-1}\left(H\widehat {\beta }-r\right) \end{equation*}
Здесь \(\Omega \) — ковариационная матрица вектора случайных ошибок.
Если верна тестируемая гипотеза, то эта величина имеет распределение Хи-квадрат с q степенями свободы.
Таким образом, в случае, если расчетное значение тестовой статистики больше критического значения из таблиц распределения Хи-квадрат при заданном уровне значимости, то гипотеза о выполнении ограничения \(\mathit{H\beta }=r\) должна быть отвергнута.
На практике ковариационная матрица \(\Omega \) обычно не известна. Поэтому в формуле тестовой статистики её заменяют оценкой \(\widehat {\Omega }\). В частности, если выполнены предпосылки линейной модели со стохастическими регрессорами о независимости отдельных наблюдений, то \(\widehat {\Omega }\) будет диагональной матрицей, где на главной диагонали стоят оценки дисперсий случайных ошибок, полученные по процедуре из главы 5 (см. параграф 5.3, случай 2).
Пример 6.5. Тестирование гипотез в условиях асимптотического подхода
Руководство крупной торговой сети планирует выяснить, помогает ли тренинг по продажам увеличить эффективность работы менеджеров по продажам.
Для решения этой задачи были собраны следующие данные о двух тысячах менеджеров:
sales — объем продаж данного менеджера (в тысячах рублей за период);
training — фиктивная переменная, равная единице, если в самом начале данного периода менеджер прошел тренинг по продажам (работники, которые направлялись на курсы, выбирались из общей совокупности работников компании при помощи специальной лотереи);
female — фиктивная переменная, равная единице для менеджеров-женщин и нулю для мужчин;
experience — опыт работы менеджера в годах;
capital — фиктивная переменная, равная единице, если менеджер работает в столичном отделении компании, и равная нулю в противном случае;
IQ — все менеджеры при приеме на работу в данную компанию проходят IQ-тест, эта переменная характеризует результаты менеджера.
(а) Оценка регрессии переменной sales на переменные training, female, experience, capital и IQ дала следующие результаты:
Модель 1: МНК, использованы наблюдения 1-2000
Зависимая переменная: sales
Робастные оценки стандартных ошибок (с поправкой на гетероскедастичность), вариант HC1
Коэффициент | Ст. ошибка | |
const | \(-\)24,3731 | 6,70733 |
training | 18,8678 | 1,81762 |
female | 0,392756 | 1,75849 |
experience | 5,30055 | 0,569546 |
capital | 3,29574 | 1,60932 |
IQ | 1,72884 | 0,0647299 |
Сумма кв. остатков | 2574369 | F(5, 1994) | 180,6451 |
Используя асимптотический подход:
(а) вычислите P-значение для коэффициента при переменной female. Проверьте значимость указанной переменной. Интерпретируйте полученный результат.
(б) Постройте 95-процентный доверительный интервал для коэффициента при переменной training. Интерпретируйте полученный результат.
(в) Проверьте незначимость уравнения в целом, используя уровень значимости 1%.
Решение:
(а) P-значение равно: \(\)
\begin{equation*} 2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right)=2\ast \text{Ф}\left(\frac{-0,392756}{1,75849}\right)=2\ast \text{Ф}\left(-0,223348\right)= \end{equation*}
\begin{equation*} =2\ast 0,4116=0,8232 \end{equation*}
Так как P-значение больше одной сотой, пяти сотых и десяти сотых, то соответствующий коэффициент не является значимым ни на однопроцентном, ни на пятипроцентном, ни на десятипроцентном уровнях значимости. Следовательно, пол менеджера не влияет на объем его продаж.
Примечание: Значение функции стандартного нормального распределения в нужной точке \(\text{Ф}\left(-0,223348\right)\) можно вычислить, например, в MS Excel, используя команду =НОРМ.СТ.РАСП(-0,2235;1).
(б) Асимптотический доверительный интервал имеет вид:
\begin{equation*} \left(\widehat {\beta }_j-\mathit{se}\left(\widehat {\beta }_j\right)\ast 1,96,\widehat {\beta }_j+\mathit{se}\left(\widehat {\beta }_j\right)\ast 1,96\right) \end{equation*}
\begin{equation*} \left(18,8678-1,81762\ast 1,96,18,8678+1,81762\ast 1,96\right) \end{equation*}
\begin{equation*} \left(15,31,22,43\right) \end{equation*}
Так как этот 95-процентный доверительный интервал не содержит ноль, можно заключить, что посещение тренинга значимо влияет на объем продаж менеджера (при 5-процентном уровне значимости). Причем с вероятностью 95% увеличение объем продаж в результате этого посещения лежит в пределах от 15,31 тысячи рублей до 22,43 тысяч рублей за период.
(в) Расчетное значение тестовой статистики дано по условию и составляет 180,6451. Критическое значение может быть взято из таблиц распределения Фишера: \(F^{\alpha }\left(q, \infty \right)=F^{0,01}\left(5, \infty \right)=3,02\).
Или можно получить тот же самый результат, воспользовавшись распределением Хи-квадрат. Критическое значение из таблицы распределения Хи-квадрат для 5 степеней свободы и уровня значимости 1% составляет 15,086. Его следует разделить на \(q=5\), что приведёт к получению той же самой величины 3,02.
Поскольку расчетное значение больше критического, гипотеза о незначимости уравнения в целом отвергается. Уравнение в целом значимо (при однопроцентном уровне).