Суть регрессии Кокса: модель рисков
В жизни и бизнесе возникает масса ситуаций, в которых крайне важно адекватно оценить риски того или иного решения. Чем дальше горизонт планирования – тем больше факторов влияет на исход дела. Модель пропорциональных рисков, предложенная в 1972 году, как раз призвана помочь оценить вероятность наступления того или иного события. По имени разработчика метод получил название регрессия Кокса.
Уточним, что регрессия в качестве метода используется для моделирования взаимоотношений между различными переменными и выяснения, как такое взаимодействие влияет на конечный результат. Также уточним, что риски в данной модели напрямую зависят от фактора времени. Для примера, возьмем исследование влияния обработанных продуктов на риск развитие диабета 2 типа. Именно регрессия Кокса была взята за основу при изучении влияния продуктов на здоровье человека. Это исследование можно прочесть в
Суть регрессии Кокса
В основе регрессии Кокса лежат 3 (три) базовых допущения, на которых строится моделирование ситуации. Это очень важный момент.
Базовые предположения:
1. Все используемые переменные являются независимыми.
2. Все используемые переменные оказывают линейное влияние на оцениваемые риски.
3. Риски являются пропорциональными для любых 2-х объектов в любой временной отрезок.
С учётом данных допущений формула оценки рисков имеет следующий вид:
h(t) = h0(t)*exp(β1*х1 + β2*х2 …+ βр*хр)
В этой формуле наличествуют следующие величины:
- h0(t) – базовый риск.
- β1, …, βp – коэффициенты.
- х1, х2, …, хp – независимые переменные (т. н. предикторы).
Коэффициенты β1, …, βp описывают степень влияния каждой переменной на вероятность наступления события. Так, при увеличении переменой хр на 1 риск увеличивается в exp (βр) раз. Это при условии, что значение прочих предикторов не менялось.
В целом, метод Кокса имеет много общего с логистической регрессией: в том и другом случае регрессия строится с помощью поочередного включения и исключения предикторов в создаваемую модель. Поэтому модель нередко представляют таким образом:
h[(t),(х1, х2, …, хр)] = h0(t)*exp(β1*х1 +…+ βр*хр)
Далее можно линеаризовать модель, поделив части формулы на h0(t) и взяв натуральный логарифм от обеих частей:
log{h[(t),(х…)]/h0(t)} = β1*х1 +…+ βр*хр
Основное преимущество регрессии Кокса для оценки рисков состоит в том, что для моделирования ситуации по данному методу требуется меньшее количество наблюдений, чем для многих других методов. При этом данная модель обладает высокой точностью оценки пропорциональных рисков.
Автор: Павел Чайка, главный редактор журнала Познавайка
При написании статьи старался сделать ее максимально интересной, полезной и качественной. Буду благодарен за любую обратную связь и конструктивную критику в виде комментариев к статье. Также Ваше пожелание/вопрос/предложение можете написать на мою почту pavelchaika1983@gmail.com или в Фейсбук, с уважением автор.
Добрый день. Подскажите, пожалуйста, по статистическим методам. У меня есть группа больных (n=229) с терминальной стадией заболевания, которые прошли успешное лечение по устранению причины этого заболевания (избавились от вируса). После этого, я наблюдаю больных каждые 3-6 месяцев с целью выявления неблагоприятных исходов. Мне необходимо определить какие параметры (факторы) до лечения позволят спрогнозировать развитие неблагоприятного исхода, несмотря на успешную противовирусную терапию. Какой метод точнее: логистическая регрессия или анализ пропорциональных рисков Кокса (последний чаще встречается в работах с аналогичным дизайном исследования)?
Екатерина сложно выбрать тот или иной метод, каждый из них имеет свои плюсы и минусы. Попробуйте оба, а потом можно будет сравнить их эффективность.