Многие алгоритмы обнаружения подгрупп возвращают оценки важности, которые отражают прогностическую силу переменных. Однако основным ограничением этих оценок является то, что они не отвечают на основной вопрос: «Какие переменные на самом деле являются прогностическими?» В предлагаемой вниманию работе представлен ответ на этот вопрос, для решения которого обычно используется фреймворк "подделки", который является общей структурой для управления скоростью ложного обнаружения при выполнении выбора прогностической переменной. В отличие от этого, представленная работа является первой, которая использует подделки для прогнозного выбора переменных.
Авторы публикации ввели два новых фильтра "подделки": один параметрический, основанный на оценках важности переменных, полученных из оштрафованной модели линейной регрессии, и один непараметрический, основанный на показателях важности причинно-следственных переменных. Проведено обширное моделирование для проверки эффективности предлагаемой методологии, а также применены предложенные методы к данным рандомизированного клинического исследования.
Using knockoffs for controlled predictive biomarker identification - PubMed (nih.gov)
Sechidis K, Kormaksson M, Ohlssen D. Using knockoffs for controlled predictive biomarker identification. Stat Med. 2021 Nov 10;40(25):5453-5473. doi: 10.1002/sim.9134. Epub 2021 Jul 30. PMID: 34328655.
Комментарии (0)
Зарегистрируйтесь, чтобы добавить комментарий