Секвенирование одноклеточной РНК (scRNA-seq) быстро становится мощным инструментом для профилирования транскриптомов отдельных клеток в масштабе генома и выявления межклеточной изменчивости в масштабе всего транскриптома. Однако недостатком технологии scRNA-seq является высокий уровень технического шума и изменчивости, что затрудняет надежную количественную оценку генов с низкой и умеренной экспрессией. Поскольку большинство последующих анализов scRNA-seq, таких как кластеризация по типу клеток и анализ дифференциальной экспрессии, полагаются на матрицу экспрессии ген-клетка, предварительная обработка данных scRNA-seq является важным предварительным шагом в анализе данных scRNA-seq.

Результаты: Авторы публикации представили scNPF, интегративную структуру предварительной обработки scRNA-seq, поддерживаемую сетевым распространением и слиянием сетей, для восстановления потери экспрессии генов, корректировки измерений экспрессии генов и изучения сходства между клетками. scNPF использует контекстно-зависимую топологию, присущую заданным данным, и априорное знание, полученное из общедоступных сетей молекулярного взаимодействия генов, для усиления отношений ген-ген на основе данных. Авторы продемонстрировали большой потенциал scNPF в предварительной обработке scRNA-seq для точного восстановления значений экспрессии генов и изучения сетей сходства клеток. Всесторонняя оценка scNPF по широкому спектру наборов данных scRNA-seq показала, что scNPF достиг сравнимой или более высокой производительности, чем конкурирующие подходы, в соответствии с различными показателями внутренней проверки и точности кластеризации. Авторы сделали scNPF простым в использовании пакетом R, который можно использовать в качестве универсального плагина предварительной обработки для большинства существующих конвейеров или инструментов анализа scRNA-seq.

Выводы: scNPF - это универсальный инструмент для предварительной обработки данных scRNA-seq, который совместно включает глобальную топологию сетей априорного взаимодействия и контекстно-зависимую информацию, инкапсулированную в данных scRNA-seq, для сбора как общих, так и дополнительных знаний из различных источников данных. scNPF можно использовать для восстановления сигнатур генов и изучения сходства между клетками из появляющихся данных scRNA-seq, чтобы облегчить последующий анализ, такой как уменьшение размеров, кластеризация типов клеток и визуализация.
 

scNPF: an integrative framework assisted by network propagation and network fusion for preprocessing of single-cell RNA-seq data (nih.gov) 
Ye W, Ji G, Ye P, Long Y, Xiao X, Li S, Su Y, Wu X. scNPF: an integrative framework assisted by network propagation and network fusion for preprocessing of single-cell RNA-seq data. BMC Genomics. 2019 May 8;20(1):347. doi: 10.1186/s12864-019-5747-5. PMID: 31068142; PMCID: PMC6505295.