Одной из ключевых проблем персонализированной медицины является определение того, какие пациенты будут положительно реагировать на данное лечение. Область идентификации подгрупп фокусируется на этой задаче, то есть выявлении групп пациентов, которые испытывают желательные характеристики, такие как усиленный эффект лечения. Важным первым шагом на пути к идентификации подгруппы является определение исходных переменных (например, биомаркеров), которые влияют на эффект лечения, которые известны как прогностические переменные.

Многие алгоритмы обнаружения подгрупп возвращают оценки важности, которые отражают прогностическую силу переменных. Однако основным ограничением этих оценок является то, что они не отвечают на основной вопрос: «Какие переменные на самом деле являются прогностическими?» В предлагаемой вниманию работе представлен ответ на этот вопрос, для решения которого обычно используется фреймворк "подделки", который является общей структурой для управления скоростью ложного обнаружения при выполнении выбора прогностической переменной. В отличие от этого, представленная работа является первой, которая использует подделки для прогнозного выбора переменных.

Авторы публикации ввели два новых фильтра "подделки": один параметрический, основанный на оценках важности переменных, полученных из оштрафованной модели линейной регрессии, и один непараметрический, основанный на показателях важности причинно-следственных переменных. Проведено обширное моделирование для проверки эффективности предлагаемой методологии, а также применены предложенные методы к данным рандомизированного клинического исследования.
 

Using knockoffs for controlled predictive biomarker identification - PubMed (nih.gov) 
Sechidis K, Kormaksson M, Ohlssen D. Using knockoffs for controlled predictive biomarker identification. Stat Med. 2021 Nov 10;40(25):5453-5473. doi: 10.1002/sim.9134. Epub 2021 Jul 30. PMID: 34328655.