Учебник+

6.5. Тестирование гипотез и построение доверительных интервалов

Во второй и третьей главах, обсуждая тестирование гипотез относительно отдельных коэффициентов, мы использовали тот факт, что отношение \(\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\) имеет t-распределение Стьюдента с \((n-k)\) степенями свободы. Однако в асимптотическом случае это число степеней свободы стремится к бесконечности. Из математической статистики известно, что при неограниченном увеличении числа степеней свободы случайная величина, имеющая распределение Стьюдента, сходится к нормальной случайной величине. Это несколько упрощает процедуру тестирования гипотезы о незначимости коэффициента, которая теперь устроена так:

Процедура тестирования незначимости коэффициента в модели множественной регрессии при использовании асимптотического подхода:

  1. Формулируем тестируемую гипотезу \(H_0:\beta _j=0\) («переменная \(x^{(j)}\) не влияет на переменную y») и альтернативную гипотезу \(H_1:\beta _j{\neq}0\) («переменная \(x^{(j)}\) влияет на переменную y»).
  2. Находим расчетное значение тестовой статистики по формуле \(\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\).
  3. Вычисляем P-значение по формуле

P-значение \(=2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right)\).

Здесь \(\text{Ф}\left({\bullet}\right)\) обозначает функцию стандартного нормального распределения.

  1. Выбираем уровень значимости \(\alpha \).
  2. Если P-значение меньше уровня значимости:

\(2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right)<\alpha \),

то следует отвергнуть гипотезу \(H_0:\beta _j=0\) и сделать вывод в пользу альтернативной гипотезы, то есть заключить, что переменная \(x^{(j)}\) влияет на переменную y. В этом случае переменную \(x^{(j)}\) называют статистически значимой при уровне значимости \(\alpha \).

Замечание 1. Как и прежде, вместо вычисления P-значения можно сравнивать расчетное значение тестовой статистики с критическим значением из таблицы стандартного нормального распределения. Например, при уровне значимости 1% ( \(\alpha =0,01\)) получаем следующее условие для отвержения нулевой гипотезы:

\begin{equation*} 2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right)<0,01. \end{equation*}

Это условие эквивалентно неравенству

\begin{equation*} \left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|>2,58. \end{equation*}

Поэтому при использовании асимптотического подхода критическое значение тестовой статистики при уровне значимости 1% составляет 2,58. Аналогично легко проверить, что при уровне значимости 5% оно равно 1,96.

Отсюда следует, что 99-процентный и 95-процентный асимптотические доверительные интервалы для коэффициента, соответственно, составляют:

\begin{equation*} \left(\widehat {\beta }_j-\mathit{se}\left(\widehat {\beta }_j\right)\ast 2,58,\widehat {\beta }_j+\mathit{se}\left(\widehat {\beta }_j\right)\ast 2,58\right) \end{equation*}

и

\begin{equation*} \left(\widehat {\beta }_j-\mathit{se}\left(\widehat {\beta }_j\right)\ast 1,96,\widehat {\beta }_j+\mathit{se}\left(\widehat {\beta }_j\right)\ast 1,96\right). \end{equation*}

В Приложении 6.Б обсуждается построение доверительных интервалов для нелинейных относительно коэффициентов выражений. Оказывается, что асимптотический подход позволяет решать и такую задачу. Для этого применяется так называемый дельта-метод.

Замечание 2. Аналогичным образом можно тестировать гипотезу \(H_0:\beta _j=c\), где c — это некоторая константа. В этом случае процедура тестирования остается такой же с одним исключением: расчетное значение тестовой статистики будет иметь вид \(\frac{\widehat {\beta }_j-c}{\mathit{se}\left(\widehat {\beta }_j\right)}\) и, следовательно, P-значение рассчитывается по формуле:

P-значение \(=2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j-c}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right).\)

Замечание 3. Не забудьте, что, так как в рамках нашей новой модели мы отказались от предположения о гомоскедастичности, стандартные ошибки для осуществления этого теста должны быть получены на основе формул стандартных ошибок, состоятельных в условиях гетероскедастичности. К счастью, все современные эконометрические пакеты умеют легко рассчитывать их автоматически.

В случае тестирования гипотез по поводу выполнения сразу нескольких линейных ограничений также можно использовать все стандартные варианты F-теста, которые подробно рассмотрены в параграфе 3.5.

Единственное отличие состоит в том, что теперь если верна нулевая гипотеза данного теста, то расчетное значение тестовой статистики имеет не распределение Фишера с q и \((n-k)\) степенями свободы \(F(q,\text{ }n-k)\). Теперь это распределение Фишера с q и \( \infty \) степеней свободы \(F(q, \infty )\), так как \(n\rightarrow \infty \). Поэтому для получения критических значений следует использовать таблицу распределения Фишера \(F^{\alpha }(q, \infty )\) или таблицу распределения Хи-квадрат, так как случайная величина с распределением \(\chi ^2\left(q\right)\) в \(q\) раз больше случайной величины с распределением \(F(q, \infty )\).

Ограничение такого подхода к тестированию совместных ограничений состоит в том, что стандартный F-тест опять же требует гомоскедастичности случайных ошибок. Поэтому, чтобы получить корректные в условиях гетероскедастичности результаты тестирования гипотезы, используется специальное обобщение F-теста. В качестве такого обобщения можно применять, например, тест Вальда.

Идея теста Вальда похожа на идею использования состоятельных в условиях гетероскедастичности стандартных ошибок: расчетное значение тестовой статистики корректируется с учетом возможной гетероскедастичности. Поэтому вас не должно удивлять, если при использовании робастных стандартных ошибок ваш эконометрический пакет для проверки значимости уравнения или для сравнения «короткой» и «длинной» регрессий начинает использовать тест Вальда вместо F-теста (что приводит к соответствующей корректировке значений тестовых статистик). Интерпретировать его результаты можно аналогичным образом.

Более полное описание процедуры теста Вальда требует знакомства с матричной формой записи для множественной регрессии (параграф 3.3) и обобщенной линейной моделью множественной регрессии (параграф 5.5). Если вы разобрались и с тем, и с другим, то можно читать дальше.

Пусть тестируемая гипотеза, как и в параграфе 3.6, имеет вид:

\begin{equation*} \mathit{H\beta }=r. \end{equation*}

Здесь \(\beta \) — вектор коэффициентов модели. \(H\) — матрица размера q на k, \(r\) — вектор-столбец длины q. В свою очередь, q — количество тестируемых ограничений, то есть количество уравнений в системе ограничений, k — число коэффициентов в модели.

Расчетное значение тестовой статистики теста Вальда для тестирования гипотезы \(\mathit{H\beta }=r\) имеет вид:

\begin{equation*} \left(H\widehat {\beta }-r\right)'\left(H\left(X'\Omega ^{-1}X\right)^{-1}H'\right)^{-1}\left(H\widehat {\beta }-r\right) \end{equation*}

Здесь \(\Omega \) — ковариационная матрица вектора случайных ошибок.

Если верна тестируемая гипотеза, то эта величина имеет распределение Хи-квадрат с q степенями свободы.

Таким образом, в случае, если расчетное значение тестовой статистики больше критического значения из таблиц распределения Хи-квадрат при заданном уровне значимости, то гипотеза о выполнении ограничения \(\mathit{H\beta }=r\) должна быть отвергнута.

На практике ковариационная матрица \(\Omega \) обычно не известна. Поэтому в формуле тестовой статистики её заменяют оценкой \(\widehat {\Omega }\). В частности, если выполнены предпосылки линейной модели со стохастическими регрессорами о независимости отдельных наблюдений, то \(\widehat {\Omega }\) будет диагональной матрицей, где на главной диагонали стоят оценки дисперсий случайных ошибок, полученные по процедуре из главы 5 (см. параграф 5.3, случай 2).

Пример 6.5. Тестирование гипотез в условиях асимптотического подхода

Руководство крупной торговой сети планирует выяснить, помогает ли тренинг по продажам увеличить эффективность работы менеджеров по продажам.

Для решения этой задачи были собраны следующие данные о двух тысячах менеджеров:

sales — объем продаж данного менеджера (в тысячах рублей за период);

training — фиктивная переменная, равная единице, если в самом начале данного периода менеджер прошел тренинг по продажам (работники, которые направлялись на курсы, выбирались из общей совокупности работников компании при помощи специальной лотереи);

female — фиктивная переменная, равная единице для менеджеров-женщин и нулю для мужчин;

experience — опыт работы менеджера в годах;

capital — фиктивная переменная, равная единице, если менеджер работает в столичном отделении компании, и равная нулю в противном случае;

IQ — все менеджеры при приеме на работу в данную компанию проходят IQ-тест, эта переменная характеризует результаты менеджера.

(а) Оценка регрессии переменной sales на переменные training, female, experience, capital и IQ дала следующие результаты:

Модель 1: МНК, использованы наблюдения 1-2000

Зависимая переменная: sales

Робастные оценки стандартных ошибок (с поправкой на гетероскедастичность), вариант HC1

  Коэффициент Ст. ошибка
const \(-\)24,3731 6,70733
training 18,8678 1,81762
female 0,392756 1,75849
experience 5,30055 0,569546
capital 3,29574 1,60932
IQ 1,72884 0,0647299
Сумма кв. остатков 2574369   F(5, 1994) 180,6451

Используя асимптотический подход:

(а) вычислите P-значение для коэффициента при переменной female. Проверьте значимость указанной переменной. Интерпретируйте полученный результат.

(б) Постройте 95-процентный доверительный интервал для коэффициента при переменной training. Интерпретируйте полученный результат.

(в) Проверьте незначимость уравнения в целом, используя уровень значимости 1%.

Решение:

(а) P-значение равно: \(\)

\begin{equation*} 2\ast \text{Ф}\left(-\left|\frac{\widehat {\beta }_j}{\mathit{se}\left(\widehat {\beta }_j\right)}\right|\right)=2\ast \text{Ф}\left(\frac{-0,392756}{1,75849}\right)=2\ast \text{Ф}\left(-0,223348\right)= \end{equation*}

\begin{equation*} =2\ast 0,4116=0,8232 \end{equation*}

Так как P-значение больше одной сотой, пяти сотых и десяти сотых, то соответствующий коэффициент не является значимым ни на однопроцентном, ни на пятипроцентном, ни на десятипроцентном уровнях значимости. Следовательно, пол менеджера не влияет на объем его продаж.

Примечание: Значение функции стандартного нормального распределения в нужной точке \(\text{Ф}\left(-0,223348\right)\) можно вычислить, например, в MS Excel, используя команду =НОРМ.СТ.РАСП(-0,2235;1).

(б) Асимптотический доверительный интервал имеет вид:

\begin{equation*} \left(\widehat {\beta }_j-\mathit{se}\left(\widehat {\beta }_j\right)\ast 1,96,\widehat {\beta }_j+\mathit{se}\left(\widehat {\beta }_j\right)\ast 1,96\right) \end{equation*}

\begin{equation*} \left(18,8678-1,81762\ast 1,96,18,8678+1,81762\ast 1,96\right) \end{equation*}

\begin{equation*} \left(15,31,22,43\right) \end{equation*}

Так как этот 95-процентный доверительный интервал не содержит ноль, можно заключить, что посещение тренинга значимо влияет на объем продаж менеджера (при 5-процентном уровне значимости). Причем с вероятностью 95% увеличение объем продаж в результате этого посещения лежит в пределах от 15,31 тысячи рублей до 22,43 тысяч рублей за период.

(в) Расчетное значение тестовой статистики дано по условию и составляет 180,6451. Критическое значение может быть взято из таблиц распределения Фишера: \(F^{\alpha }\left(q, \infty \right)=F^{0,01}\left(5, \infty \right)=3,02\).

Или можно получить тот же самый результат, воспользовавшись распределением Хи-квадрат. Критическое значение из таблицы распределения Хи-квадрат для 5 степеней свободы и уровня значимости 1% составляет 15,086. Его следует разделить на \(q=5\), что приведёт к получению той же самой величины 3,02.

Поскольку расчетное значение больше критического, гипотеза о незначимости уравнения в целом отвергается. Уравнение в целом значимо (при однопроцентном уровне).