В статье представлен обзор исследований по обнаружению биомаркеров с использованием данных омики для стратификации пациентов, которые привели к клинически подтвержденным тестам FDA или лабораторным тестам, чтобы определить общие характеристики и вывести рекомендации для будущих проектов биомаркеров.

Методика: Проведён поиск в PubMed, EMBASE и Web of Science с целью получить полный список статей из биомедицинской литературы, опубликованной в период с января 2000 года по июль 2021 года, описывающих клинически подтвержденные сигнатуры биомаркеров для стратификации пациентов, полученные с использованием статистических подходов к поисковому обучению. Все документы были проверены, чтобы сохранить только рецензируемые исследовательские статьи, обзорные статьи или статьи мнений, охватывающие контролируемые и неконтролируемые приложения машинного обучения для стратификации пациентов на основе омики. Два рецензента независимо друг от друга подтвердили право на участие. Разногласия решались консенсусом. Авторы сосредоточили окончательный анализ на биомаркерах на основе омики, которые достигли высочайшего уровня валидации, то есть клинического одобрения разработанной молекулярной сигнатуры в качестве лабораторно разработанного теста или одобренных FDA тестов.

Результаты: В целом, 352 статьи соответствовали критериям приемлемости. Анализ валидированных сигнатур биомаркеров выявил несколько общих методологических и практических особенностей, которые могут объяснить успешную разработку тестов и направлять будущие проекты биомаркеров. К ним относятся выбор дизайна исследования для обеспечения достаточной статистической мощности для построения моделей и внешнего тестирования, подходящие комбинации нецелевых и целевых технологий измерения, интеграция предшествующих биологических знаний, строгая фильтрация и критерии включения/исключения, а также адекватность статистических методов и методов машинного обучения для обнаружения и проверки.

Выводы: В то время как большинство клинически подтвержденных моделей биомаркеров, полученных из данных омики, были разработаны для персонализированной онкологии, первые приложения для нераковых заболеваний показывают потенциал многомерного дизайна биомаркеров омики для других сложных расстройств. Отличительные характеристики предыдущих историй успеха, такие как ранняя фильтрация и надежные подходы к обнаружению, постоянное совершенствование дизайна анализа и экспериментальной технологии измерения, а также строгие подходы к валидации с несколькими критериями и способами, позволяют выводить конкретные рекомендации для будущих исследований.
 

Biomarker discovery studies for patient stratification using machine learning analysis of omics data: a scoping review - PubMed (nih.gov) 
Glaab E, Rauschenberger A, Banzi R, Gerardi C, Garcia P, Demotes J. Biomarker discovery studies for patient stratification using machine learning analysis of omics data: a scoping review. BMJ Open. 2021 Dec 6;11(12):e053674. doi: 10.1136/bmjopen-2021-053674. PMID: 34873011; PMCID: PMC8650485.