Давайте разберем как устроен частный f-критерий для сравнения моделей. Нам понадобится полная модель и уменьшенная. Представьте себе, что в полной модели всего L предикторов, а параметров p=L+1, потому что у нас есть еще интерсепт. В уменьшенной модели вот этого предиктора не будет. Там останется всего на один меньше предиктор, соответственно, полная модель из всей изменчивости объясняет какую-то большую часть, вот это заштрихованная область, допустим, это объясненная изменчивость, а уменьшенная модель будет объяснять немного меньше, потому что мы удалили один из предикторов, который что-то объяснял из остаточной изменчивости. Всегда более полная модель будет лучше объяснять существующие данные, и соответственно, остаточная изменчивость в более полной модели, она окажется меньше, чем в уменьшенной. Мы можем эту разницу количественно оценить, мы просто можем посчитать разницу остаточной изменчивости уменьшенной модели, раз она больше мы из нее будем вычитать остаточную изменчивость полной модели. И у этой разницы будет свое число степеней свободы, которое мы тоже можем вычислить по разнице. Если одно разделить на другое, то у нас получится дисперсия, которая связана с включением данного предиктора в модель. Дисперсию, связанную с включением предикторов в модель, нам нужно с чем-то сравнивать, мы можем ее поделить на остаточную дисперсию полной модели и тогда все это выражение у нас будет выражением f-критерии, которые тестируют значимость включения данного предиктора в модель. Можно переформулировать f-критерий, используя не остаточную изменчивость, а объясненную изменчивость. На самом деле это будут полностью синонимичные выражения, потому что вы помните, что остаточная изменчивость это то, что осталось после того, как регрессия что-то объяснило, то есть эти вещи взаимосвязаны. Давайте посмотрим как нам проверить в нашей модели объясняет ли что-нибудь предиктор объем опухоли. Чтобы это проверить, нам нужно сравнить полную модель, в которой есть много предикторов, и тот, которые нас интересует, объем опухоли, с уменьшенной моделью, в которой этот предиктор удален. Мы их сравниваем при помощи f-критерии, чтобы нам не пришлось каждый раз записывать полностью уравнения модели, мы будем использовать такую краткую запись. Что это означает? Это означает, что мы проверяем значимость предиктора lcavol при условии, что вот такие-то предикторы уже включены в модель. То же самое можно записать для сумм квадратов, которые связанны с включением данного предиктора, совершенно аналогичным образом. Давайте теперь попробуем посчитать частные f-критерии в R. Что нам для этого понадобится? Нам понадобится функция anova. Этой функции нужно будет передать два аргумента, две ваших модели, которую вы хотите сравнить, полную и уменьшенную. Полная модель у нас уже есть, это наша модель M_prost_2, а уменьшенную мы сейчас получим при помощи функции update. Функцией update мы передаем нашу полную модель и хотим в этой модели что-то изменить, вот такая вот запись будет означать, что мы берем тот же самый отклик, точка означает то же самое как в модели образце, мы берем те же самые предикторы, пишем справа точку, но один из предикторов удаляем, минус lcavol, и результативную модель M_prost_lcavol, она будет без этого предиктора, единственное отличие. Теперь мы передаем обе модели в функции anova и она нам показывает результаты тестов, собственно, она нам показывает значение f-статистики для частного f-критерия. При удалении предиктора lcavol из модели, модель значимо ухудшается, мы можем сказать это таким способом, или мы можем сказать, это будет абсолютно то же самое при добавлении предиктора lcavol в модель, она значимо улучшается, он что-то объясняет. Вы видите, что частные f-критерии, это еще один инструмент, который мы можем использовать для тестирования значимости предикторов, мы можем проверить все предикторы при помощи частного f-критерия точно так же, как раньше мы это делали при помощи t-критерий. Результаты этих двух тестов будут эквивалентны, поэтому на самом деле вам все равно что использовать, выбираете тест и придерживаетесь его. Результаты будут абсолютно идентичны, в этом мы можем легко убедиться прямо на опыте. Давайте попробуем из результатов частного f-критерия экстрагировать собственно значение f-статистики и сохраним его в переменную F_val, это будет 76,8, вы это видели в таблице. Из результатов summary нашей полной модели мы можем экстрагировать значение t-статистики для предиктора lcavol, и сохраним его в переменную t_val, так вот значение f-статистики, это t-статистика в квадрате для простой линейной регрессии. Вы видите, что если мы t_val возведём в квадрат, мы получим абсолютно то же самое число. Это значит, что вам не нужно делать тестирование значимости предикторов двумя способами, достаточно выбрать один из них и его придерживаться.