Учебник+

3.7. Обобщающий пример

В заключение этой главы рассмотрим пример, позволяющий обобщить всё, что мы в ней выяснили.

Пример 3.4. Размер класса и эффективность обучения

Одним из дискуссионных вопросов в организации школьного образования является вопрос о том, действительно ли более эффективно учить школьников в маленьких классах (например, в классах по 10-15 человек) по сравнению с большими классами (например, в классах на 20-25 человек)? И если в маленьких классах школьники правда учатся лучше, то насколько велико это улучшение качества?

Вопрос важен в том числе и с экономической точки зрения. Действительно, если мы хотим улучшить качество школьного образования за счет уменьшения численности учеников в каждом классе, то нам придется нанять больше учителей, что потребует более значительных расходов на оплату их труда. Кроме того, мы столкнемся с издержками на организацию большего количества помещений, подходящих для обучения. Поэтому количественной оценке воздействия размера класса на эффективность обучения посвящен ряд исследований1. В представленном примере вам также предлагается проанализировать массив данных, посвященный этому вопросу. В файле Students вам доступны следующие данные о двух сотнях школьников: CLASS — размер класса, в котором обучается школьник. Воздействие именно этой переменной на качество обучения будет интересовать нас в этом примере; EXPN — средние расходы на одного школьника в школе, где он учится, измеренные в тысячах долларов в год; INCOME — средний доход на одного члена семьи в семье школьника, измеренный в тысячах долларов в год; TEST — результат итогового стандартизированного теста, который писали все школьники в конце учебного года. Эта переменная будет выступать в нашей регрессии в качестве зависимой переменной, так как она характеризует качество обучения (конечно, результаты тестов не являются совершенным измерителем качества обучения, однако в условиях отсутствия иных данных придется использовать их)

(а) Оцените параметры модели №1:

\begin{equation*} \mathit{TES}T_i=\beta _1+\beta _2\mathit{CLAS}S_i+\varepsilon _i \end{equation*}

Является переменная CLASS значимой? Интерпретируйте полученные результаты.

(б) Оцените параметры модели №2:

\begin{equation*} \mathit{TES}T_i=\beta _1+\beta _2\mathit{CLAS}S_i+\beta _3\exp N_i+\varepsilon _i \end{equation*}

Является ли уравнение в целом статистически значимым?

Как изменилась оценка коэффициента при переменной CLASS. Чем можно объяснить такое изменение?

(в) Оцените параметры модели №3:

\begin{equation*} \mathit{TES}T_i=\beta _1+\beta _2\mathit{CLAS}S_i+\beta _3\exp N_i+\beta _4\mathit{INCOME}_i+\varepsilon _i \end{equation*}

Используя тест, на сравнение «короткой» и «длинной» регрессий сравните модели №1 и №3. Оправдано ли включение в модель новых переменных. Остается ли в новой модели переменная CLASS значимой? Как теперь можно интерпретировать коэффициент при этой переменной?

Скрипт в R для этого примера

Файл с данными для этого примера.

Решение:

(а) Результаты оценивания параметров модели №1 представлены ниже:

Модель 1: МНК, использованы наблюдения 1-200
Зависимая переменная: TEST

            Коэффициент   Ст. ошибка   t-статистика   P-значение
  ---------------------------------------------------------------
  const       83,6554       6,27855        13,32       2,47e-029  ***
  CLASS       −1,30921      0,280996       −4,659      5,82e-06   ***

Среднее зав. перемен    55,18000   Ст. откл. зав. перемен  21,36774
Сумма кв. остатков      81882,25   Ст. ошибка модели       20,33585
R-квадрат               0,098804   Испр. R-квадрат         0,094252
F(1, 198)               21,70799   Р-значение (F)          5,82e-06
Лог. правдоподобие     −885,2597   Крит. Акаике            1774,519
Крит. Шварца            1781,116   Крит. Хеннана-Куинна    1777,189

Мы видим, что переменная CLASS статистически значима при уровне значимости 1%, так как соответствующее P-значение меньше одной сотой2. Коэффициент при этой переменной равен –1,3, что можно интерпретировать так: увеличение размера класса на одного ученика в среднем приводит к снижению результата школьника, который в этом классе учится, на 1,3 балла.

(б) Оценим теперь модель №2:

Модель 2: МНК, использованы наблюдения 1-200
Зависимая переменная: TEST

             Коэффициент   Ст. ошибка   t-статистика   P-значение
  ---------------------------------------------------------------
  const       60,1560       7,97117         7,547      1,62e-012  ***
  CLASS       −0,908844     0,282915       −3,212      0,0015     ***
  EXPN         2,53712      0,566948        4,475      1,29e-05   ***

Среднее зав. перемен    55,18000   Ст. откл. зав. перемен  21,36774
Сумма кв. остатков      74326,57   Ст. ошибка модели       19,42401
R-квадрат               0,181962   Испр. R-квадрат         0,173657
F(2, 197)               21,91000   Р-значение (F)          2,56e-09
Лог. правдоподобие     −875,5783   Крит. Акаике            1757,157
Крит. Шварца            1767,052   Крит. Хеннана-Куинна    1761,161

Обратите внимание, что в этой таблице приведено расчетное значение F-статистики для проверки значимости уравнения в целом. И соответствующее P-значение:

F(2, 197) 21,91000 Р-значение (F) 2,56e-09

Так как это P-значение меньше одной сотой, можно заключить, что уравнение в целом является значимым.

Заметим, что коэффициент при переменной CLASS по-прежнему значимый и отрицательный, однако по абсолютной величине он стал меньше. Теперь увеличение размера класса на единицу снижает результаты школьника за тест в среднем (при неизменных расходах на одного школьника) всего на 0,9 балла вместо прежних 1,3.

Такой результат легко объяснить, если вспомнить самое начало нашей главы. По всей видимости, переменная EXPN, которую мы добавили в модель, является существенной: она тоже значимо влияет на успехи школьника. Кроме того, она коррелирована с переменной CLASS. Если вычислить соответствующий выборочный коэффициент корреляции, то он окажется равен –0,31. В модели №1 эта переменная была пропущена, поэтому в модели №1 оценка коэффициента \(\beta _2\) была смещена из-за пропуска существенной переменной.

Теперь мы добавили пропущенную переменную в модель и устранили указанное смещение. Поэтому оценка интересующего нас коэффициента изменилась. Следовательно, новая оценка (–0,9) вызывает больше доверия, чем предыдущая оценка (–1,3). Однако, возможно, мы по-прежнему упускаем что-то важное. Поэтому добавим в модель ещё один регрессор.

(в) Добавление в модель переменной INCOME позволяет получить следующие результаты:

Модель 3: МНК, использованы наблюдения 1-200
Зависимая переменная: TEST

             Коэффициент   Ст. ошибка   t-статистика   P-значение
  ---------------------------------------------------------------
  const       29,1786      4,84720          6,020      8,46e-09   ***
  CLASS       −1,07250     0,163173        −6,573      4,36e-010  ***
  EXPN         2,05022     0,327487         6,260      2,37e-09   ***
  INCOME       1,04899     0,0525994       19,94       4,69e-049  ***

Среднее зав. перемен    55,18000   Ст. откл. зав. перемен  21,36774
Сумма кв. остатков      24536,68   Ст. ошибка модели       11,18871
R-квадрат               0,729949   Испр. R-квадрат         0,725816
F(3, 196)               176,5965   Р-значение (F)          1,84e-55
Лог. правдоподобие     −764,7484   Крит. Акаике            1537,497
Крит. Шварца            1550,690   Крит. Хеннана-Куинна    1542,836

Третья модель также позволяет заключить, что размер класса значимо влияет на эффективность обучения. Теперь коэффициент при этой переменной можно интерпретировать так: увеличение размера класса на одного ученика в среднем приводит при прочих равных условиях к снижению результата школьника, который в этом классе учится, на 1,1 балла. Формулировка «при прочих равных» важна. В данном случае она означает, что мы сравниваем успехи школьников при прочих равных значениях двух других регрессоров: расходах на одного ученика и уровне благосостояния семьи школьника. Преимущество множественной регрессии как раз и состоит в том, что можно давать количественные оценки изменений при фиксированных значениях прочих важных факторов.

В таблице 3.1 содержатся сводные результаты оценки трех моделей. Обратите внимание, что при представлении результатов моделирования хорошим тоном является использование именно таких сводных таблиц, содержащих только необходимую информацию, а не необработанных таблиц, выданных эконометрическим пакетом, которые мы в учебных целях приводили выше.

Таблица 3.1. Влияние размера класса на качество обучения

  Модель 1 Модель 2 Модель 3
Константа 83,655*** 60,156*** 29,179***
  (6,279) (7,971) (4,847)
CLASS -1,309*** -0,909*** -1,073***
  (0,281) (0,283) (0,163)
EXPN 2,537*** 2,050***
    (0,567) (0,327)
INCOME 1,049***
      (0,053)
Число наблюдений 200 200 200
R2 0,099 0,182 0,730
Исправленный R2 0,094 0,174 0,726

Примечания: зависимая переменная — балл за итоговый тест. В скобках под оценками коэффициентов указаны стандартные ошибки. ***, ** и * обозначают значимость на одно-, пяти- и десятипроцентном уровнях соответственно.

Сопоставим первую и третью модели, используя тест на сравнение «короткой» и «длинной» регрессии.

Нулевая гипотеза: \(\beta _3=\beta _4=0\).

Расчетное значение тестовой статистики составит:

\begin{equation*} F=\frac{\frac{R_{\mathit{UR}}^2-R_R^2}{1-R_{\mathit{UR}}^2}{\ast}n-k} q=\frac{\frac{0,730-0,099}{1-0,730}{\ast}200-4} 2=229,0 \end{equation*}

Критическое значение из таблицы распределения Фишера для уровня значимости 1% и 2 и 196 степеней свободы примерно равно 4,6. Так как расчетное значение больше критического, мы отвергаем нулевую гипотезу и делаем вывод в пользу «длинной» регрессии. Таким образом, включение дополнительных переменных оправдано.

Аналогичный результат может быть получен в результате автоматического проведения теста в эконометрическом пакете:

Нулевая гипотеза: параметры регрессии нулевые

EXPN, INCOME

Тестовая статистика: F(2, 196) = 229,039, P-значение 5,12105e-052

Легко видеть, что соответствующее P-значение меньше одной сотой, следовательно, тестируемая гипотеза действительно должна быть отвергнута.

С точки зрения исправленного R-квадрата третья модель также лучше всех, так как там этот коэффициент принимает самое большое значение (напомним, что сравнивать модели с разным числом регрессоров корректно при помощи именно исправленного, а не обычного коэффициента R-квадрат).


  1. См., например, Kreuger (1999) Experimental Estimates of Education Production Functions // The Quarterly Journal of Economics. 
  2. Запись «5,82e-06», используемая в таблице означает \(5,82{\ast}10^{-6}\), что заметно меньше, чем 0,01.