Медицинская геномика полагается на методы секвенирования следующего поколения для расшифровки основных молекулярных механизмов экспрессии генов. В этом спецвыпуске собраны материалы, впервые представленные на конференции «Столетие популяционной генетики человека»-2019 в Москве. Здесь представлены некоторые недавние разработки вычислительных методов, проверенные на реальных проблемах медицинской генетики, проанализированные с помощью анализа данных геномики, транскриптомики и протеомики, генных сетей, межбелковых взаимодействий и изучения биомедицинской литературы. Отобраны материалы на основе подходов системной биологии, интеллектуального анализа баз данных. Эти методы и алгоритмы обсуждались на Цифровом медицинском форуме-2019, организованном Первым Московским государственным медицинским университетом им. И.М. Сеченова, где были представлены биоинформатические подходы к поиску мишеней для лекарств при онкологических заболеваниях, их вычислительное обеспечение, и оцифровка медицинских исследований, а также в Школе молодых ученых «Системная биология и биоинформатика» -2019 (SBB-2019) в Новосибирске, Россия. Некоторые недавние достижения, обсуждаемые на этих мероприятиях в области медицинской геномики и генетики, основаны на новых инструментах биоинформатики.

Вычислительные модели для молекулярных механизмов анализа регуляции экспрессии генов очень востребованы в биомедицине. Регуляцию экспрессии генов можно контролировать на уровне транскрипции, посттранскрипции, трансляции, генной сети и путей. Серия выпусков специальных журналов после конференций началась с конференций «Биоинформатика регуляции и структуры генома» (BGRS) и связанных с ними школ по системной биологии и биоинформатике (SBB) в Новосибирске, Россия ( http: //conf.bionet.nsc.ru/sbb2019/en/). Приложения в области геномики человека обсуждались на конференции «Столетие популяционной генетики человека» 29–31 мая 2019 г. и на Цифровом медицинском форуме-2019 в Москве ( http://centenary-popgene.com/en ). Документы присоединились к этой тематической проблеме медицинской геномики за рамками конференций, предлагая анализ регуляции экспрессии генов и предоставляя инструменты для прогнозирования структуры белка. Мы начнем этот сборник статей с моделей системной биологии в онкологии, комплексных заболеваниях и анализе лекарств.

Марианной Золотовской с соавторами обнаружены неоднородности опухолей и проведен перекрестный анализ их с репертуаром лекарств, которые в настоящее время используются в клинической онкологии наряду с их молекулярными мишенями. Данные об опухолях были взяты из базы данных Cancer Genome Atlas. Авторы впервые показали, что репертуар молекулярных мишеней принятых лекарств не коррелирует с молекулярными неоднородностями различных типов рака. Эти результаты обеспечивают теоретическую основу для пересмотра использования целевых терапевтических средств и активизации усилий по перепрофилированию лекарств.

Работа Виктора Ткачева и др.  продемонстрировала улучшение глобальных методов машинного обучения в персонализированной онкологии, основанной на омиксе. В настоящее время методы машинного обучения (ML) редко используются для рецептов противораковых препаратов на основе омики из-за нехватки историй болезни с клиническими результатами, дополненными молекулярными данными с высокой пропускной способностью. Это вызывает перетренированность и высокую уязвимость большинства методов машинного обучения. Авторы предложили гибридный глобально-локальный подход к ML, названный проективным разделителем с плавающим окном (FloWPS), который позволяет избежать экстраполяции в пространстве признаков. Его основное свойство - обрезка данных, т. е. специфичное для выборки удаление нерелевантных функций. Вычислительные эксперименты с 21 набором данных экспрессии генов с высокой пропускной способностью, в котором полностью представлены 1778 онкологических больных с известными ответами на химиотерапевтическое лечение, показали эффективность предложенного метода. FloWPS существенно улучшил качество классификаторов ответа на лечение для всех глобальных методов машинного обучения. Таким образом, FloWPS показал свою устойчивость к перетренированности.

В следующих статьях были обнаружены случаи участия генов в фенотипах сложных заболеваний, таких как ВИЧ-1, аутизм и неврологические заболевания, а также обнаружены соответствующие молекулярные мишени.

Лечение ВИЧ-1-положительного пациента требует одновременного приема нескольких препаратов. Ольга Тарасова и коллеги представил вычислительный подход для прогнозирования лечения и эффективности или неудачи антиретровирусной терапии. Устойчивость вируса к антиретровирусным препаратам может привести к неэффективности лечения. Подход был направлен на прогнозирование воздействия на конкретный вирусный вариант антиретровирусного препарата или комбинации препаратов. Авторы использовали нуклеотидные последовательности ВИЧ-1, кодирующие протеазу и обратную транскриптазу, для выполнения таких типов предсказаний. Для прогнозирования использовался алгоритм прогнозирования спектров активности веществ (PASS), основанный на наивном байесовском классификаторе. Вероятность того, принадлежала последовательность или не принадлежала к классу, связанному с воздействием вирусной последовательности на набор лекарств, может быть связана с устойчивостью к набору лекарств.

Расстройство аутистического спектра имеет сильный и сложный генетический компонент с оценкой более чем 1000 вовлеченных генов, каталогизированных в базе данных генов Инициативы по исследованию аутизма Фонда Саймона (SFARI). Примечательно, что значительная часть случаев как синдромального, так и идиопатического аутизма может быть связана с нарушениями, вызванными механистической мишенью рапамицина (mTOR) -зависимой дерегуляции трансляции. Екатерина Трифонова и коллеги представил фундаментальную работу по контролю экспрессии генов в генах предрасположенности к аутизму. Анализ набора генов позволил обнаружить, что 58% генов, включенных в базу данных генов SFARI, и 64% генов, включенных в первые три категории базы данных, могут быть отнесены к одной из четырех групп: белок ломкой X-умственной отсталости. гены-мишени; гены сигнальной сети mTOR; гены, модулируемые mTOR; или гены, чувствительные к витамину D3. Авторы предположили, что генетическая и / или внешняя гиперактивация mTOR, включая провокацию дефицитом витамина D, может быть общим механизмом, контролирующим экспрессию большинства генов предрасположенности к аутизму и даже основных симптомов аутизма.

Татьяна В. Татаринова с коллегами проанализировали терапию МНИИ ® - нейросенсоримоторное рефлекторное вмешательство Масгутовой. MNRI может способствовать развитию нервной системы, повышению устойчивости к стрессу, нейропластичности и оптимальным возможностям обучения. Авторы продемонстрировали, что подход MNRI - это вмешательство, уменьшающее воспаление.
В нескольких дальнейших работах в этом выпуске представлены новые методы и алгоритмы биоинформатики, применимые к данным медицинской геномики и протеомики.

Использование ДНК-микрочипов для оценки профилей экспрессии miRNA ограничено несколькими факторами, включая сравнение значений экспрессии различных miRNA. Степан Нерсисян и соавторы представили алгоритм постобработки для анализа данных микроматрицы miRNA. Алгоритм выполняет подсчет miRNA в результатах анализа микрочипов на основе значений экспрессии, времени обнаружения miRNA и уровня корреляции между экспрессией miRNA и соответствующей пре-miRNA в рассматриваемых образцах. В этой работе авторы показывают, что ситуацию можно значительно улучшить, если учесть некоторую дополнительную информацию при сравнении.

Валерий Панюков и соавторы обсудили применение биоинформатики для использования k-мер в филогенетическом анализе и профилировании микробиома. Подходы без выравнивания, основанные на поиске маркерных k-мер, оказались способными идентифицировать не только виды, но и штаммы микроорганизмов с известным геномом. Авторы оценили способность родоспецифичных k-мер различать восемь филогрупп Escherichia coli и оценили присутствие их уникальных 22-мер в клинических образцах пациентов с болезнью Крона. В исследовании предлагаются «штрих-коды», специфичные для штаммов, для быстрого филотипирования.
Сродство различных лекарственно-подобных лигандов к множеству белковых мишеней является предметом интенсивных исследований. 

Нурбубу Молдогазиева и его коллеги представили моделирование сайтов связывания белков для альфа-фетопротеина человека. Альфа-фетопротеин (AFP) является основным белком, связанным с эмбрионами и опухолями, способным связывать и транспортировать различные гидрофобные лиганды, включая эстрогены. Авторы построили трехмерную модель АФП человека на основе гомологии с целью молекулярного стыковки лигандов ERα, трех агонистов (17β-эстрадиол и другие) и трех антагонистов (тамоксифен, афимоксифен и эндоксифен) в полученную структуру. На основании оценочных функций с привязкой к лиганду были идентифицированы три предполагаемых сайта связывания эстрогена и антиэстрогена с разной аффинностью связывания лиганда.

Сергей Прошкин с соавторами проанализировали специфичную для человека изоформу РНК-полимеразы II. Они экспериментально оценили взаимодействие субъединицы РНК-полимеразы II с фактором транскрипции ATF4. Путем двухгибридного дрожжевого скрининга библиотеки кДНК головного мозга человека и последующего анализа совместной очистки in vitro фактор транскрипции ATF4 был идентифицирован как важный партнер минорной субъединицы РНК-полимеразы II hRPB11bα. В человеческой РНК-полимеразе II, которая содержит множественные изоформы субъединицы hRPB11, сила взаимодействия hRPB11-ATF4 оказалась изоформ-специфичной, обеспечивая первое функциональное различие между ранее обнаруженными человеческими формами субъединицы Rpb11.

Дмитрий Карасев и др.  показали вычислительный метод для предсказания взаимодействия белок-лиганд. Сродство различных подобных лекарству лигандов к множеству белковых мишеней отражает общие химико-биологические взаимодействия. Предлагаемый метод основан на анализе локального сходства последовательностей в наборе анализируемых белков. Этот подход обеспечивает точность прогнозов, сравнимую или превосходящую точность других методов, как это было продемонстрировано на популярных тестовых наборах Золотого стандарта. Таким образом, метод может быть применен к широкой области белок-лигандных взаимодействий. 

Чтобы модифицировать хроматин, длинная некодирующая РНК (днРНК) часто взаимодействует с ДНК специфическим для последовательности образом, образуя тройные спирали РНК: ДНК. Елена Матвейшина и соавторы сравнили инструменты биоинформатики для РНК: предсказание тройной спирали ДНК. Вычислительные инструменты для поиска по тройной спирали не всегда обеспечивают достаточно качественные прогнозы для всего генома. Авторы использовали четыре днРНК человека (MEG3, DACOR1, TERC и HOTAIR) и их экспериментально определенные области связывания для оценки параметров триплекса, которые обеспечивают наивысшую точность прогноза. Научная группа объединила предсказание триплекса с вторичной структурой днРНК и продемонстрировала, что рассмотрение только одноцепочечных фрагментов днРНК может еще больше улучшить предсказание триплексов ДНК-РНК.

Следующие статьи, первоначально обсуждавшиеся на конференции «Столетие популяционной генетики человека» ( http://centenary-popgene.com/en ), освещают проблемы популяционной генетики человека и их решения, достигнутые с помощью анализа данных геномики.

Рена Зинченко с коллегами изучали аллельную гетерогенность наследственных заболеваний в популяциях человека. В исследовании представлены результаты генетического эпидемиологического исследования наследственных заболеваний населения Карачаево-Черкесской Республики. Выявлены частые заболевания; наличие выраженной генетической гетерогенности было выявлено во время подтверждающей ДНК-диагностики. Корреляционный анализ показал, что генетический дрейф, вероятно, является одним из ведущих факторов, определяющих дифференциацию исследуемых популяций по наследственной нагрузке болезней.

Виола Гругни и соавторы проанализировал человеческие популяции на Сардинии. Было проведено множество антропологических, лингвистических, генетических и геномных анализов, чтобы оценить потенциальное влияние, которое эволюционные силы оказали на формирование современного генофонда Сардинии, главного выброса в генетическом ландшафте Европы. Авторы проанализировали специфичную для мужчин область Y-хромосомы в трех выборках населения, полученных путем перераспределения большого числа сардинских субъектов в место происхождения их монофилетических фамилий, которые передаются по отцовской линии из поколения в поколение в большинстве популяций, как и Y-хромосома. Результаты показывают, что анализ генофонда Y-хромосомы в сочетании с методом выборки, основанным на происхождении фамилии, является эффективным подходом к разгадке прошлой гетерогенности, часто скрытой недавними перемещениями.

Работа Михаила Пономаренко и др.  рассмотрели нуклеотидные полиморфизмы в геноме человека, регулирующие экспрессию генов. Восприимчивость к заболеваниям, связанным с атерогенезом, обусловлена ​​однонуклеотидными полиморфизмами (SNP). Связанные с атеросклерозом инфаркт миокарда и инсульт остаются основными причинами смерти людей. Используя ранее разработанный общедоступный веб-сервис SNP_TATA_Comparator, авторы оценили статистическую значимость вызванных SNP изменений в TATA-связывающем белке для их аффинности связывания с проксимальными промоторными областями человеческих генов, клинически ассоциированных с заболеваниями, синтоническими или дистоническими с атерогенезом. Результаты раскрыли SNP рядом с клиническими маркерами SNP как основу нейтрального дрейфа, ускоряющего атерогенез, и SNP генов, кодирующих белки, связанные с целостностью митохондриального генома, и гены микроРНК, связанные с нестабильностью атеросклеротической бляшки, как основу направленного естественного отбора, замедляющего атерогенез. Обратите внимание на соответствующие статьи по инструментам биоинформатики, опубликованные в специальном выпуске журнала Frontiers in Genetics «Биоинформатика регуляции генома и системная биология» , а также в выпуске BMC Genomics . Тема исследования регуляции экспрессии генов в Frontiers in Genetics будет продолжена в 2020 году.
 

IJMS | Free Full-Text | Bioinformatics Methods in Medical Genetics and Genomics (mdpi.com)
Yuriy L Orlov, Ancha V Baranova, Tatiana V Tatarinova. Bioinformatics Methods in Medical Genetics and Genomics. Int J Mol Sci. 2020, 21(17), 6224. DOI: 10.3390/ijms21176224