Интерпретация коэффициентов в логит-модели.
Для начала разберёмся с разницей между вероятностью и отношением шансов.
Есть вероятность того,
что y_i будет равен единичке,
и есть отношение шансов вероятности того, что y_i = 1,
делить на вероятность того, что y_i = 0.
Давайте себе представим несколько ситуаций,
чтобы лучше почувствовать разницу между этими понятиями.
Представим себе, что вероятность того,
что Вася сдаст экзамен: y_i = 1 — это будет означать,
что Вася сдаст экзамен.
И рассмотрим две ситуации: ситуация
до подготовки
и после.
В первом случае вероятность того, что Вася сдаст экзамен,
пусть равняется 2/3, или, примерно, 0.66.
А, скажем, вероятность того, что он сдаст его после подготовки,
равна 3/4, равно 0.75.
Если перейти к отношению шансов, то отношение шансов, вероятность того,
что он сдаст, делить на вероятность того, что не сдаст, равняется,
соответственно, 2/3 делить на 1/3, и равняется 2 к 1.
И во втором случае отношение
шансов сдать экзамен к вероятности не сдать экзамен равно,
аналогично, 3/4 к 1/4, 3 к 1.
Некоторым людям удобнее думать в вероятностях и удобнее
сравнивать вероятности, некоторым людям удобнее сравнивать шансы.
Здесь шансы были 2 к 1, здесь стали 3 к 1.
Вероятность 0,66 и 0,75.
Соответственно, если посчитать, на сколько выросла вероятность?
Вероятность выросла на 12.5%,
то есть с 0.66 до 0.75,
а отношение шансов выросло с
двух до трёх, — на 50%.
В логит-модели мы можем проинтерпретировать коэффициенты благодаря
пониманию, что такое отношение шансов.
Итак, предполагаем, что y_i*, скрытая переменная, — это β₁ + β₂x_i + ε_i.
И, с другой стороны, логарифмическое отношение шансов,
как мы вывели, равняется той же самой
линейной функции β₁ + β₂x_i.
Соответственно, смысл коэффициента β₂ следующий.
Можно говорить про ненаблюдаемую характеристику,
а именно: с ростом
x на единичку ненаблюдаемая характеристика,
именно склонность к y_i = 1,
— она абстрактная, поэтому она тяжело интерпретируется,
— с ростом x на единичку склонность к событию y_i = 1
растёт на β₂.
Ну это совсем ужасно, потому что мы не понимаем, что такое склонность к y_i = 1.
Однако логарифмическое отношение шансов, логарифм отношения шансов,
позволяет дать более понятный смысл коэффициенту β₂,
а именно: из-за того, что с ростом x логарифм отношения шансов растёт на β₂,
то есть с ростом x на единичку логарифм отношения шансов,
логарифм шансов,
растёт на β₂.
Вот это уже даёт нам совершенно понятное понимание,
поскольку мы можем перевести рост логарифма к процентному росту шансов.
Следовательно, с ростом x на
единичку отношение шансов,
то есть дробь: вероятность того, что y_i = 1,
к вероятности того, что y_i = 0, растёт
на β₂,
умноженное на 100%.
Таким образом, мы получаем,
например: если
β₂ = 0.02,
то при росте x на единичку
мы получаем прирост отношения шансов
на 2%.