动机
基于单细胞RNA测序(scRNA-seq)数据的基因调控网络(GRN)推断对于揭示细胞状态特异性的转录程序至关重要。然而,scRNA-seq测量结果稀疏且噪音较多,并且经过实验验证的转录因子-靶基因(interaction)仍然有限,这使得可靠推断变得困难。尽管图神经网络在GRN预测中取得了进展,但现有方法往往依赖于生物学上不受约束的图增强,如随机边缘扰动,且对基因与细胞之间的信息传递控制不足。这些局限性可能扭曲调控结构,并在噪声较大和弱监督条件下削弱鲁棒性。
结果
为了解决这些问题,我们提出了一种创新框架,称为生物证据精细化与异质动态门控的基因调控网络(BRIDGE)。BRIDGE从表达矩阵及其矩阵对偶中提取基因和细胞表示,并在自我与邻居之间进行对比学习,涵盖共表达精炼的调控视图和原始图。然后,它应用异质门控编码自适应调节基因与细胞之间的信息传递,从而实现鲁棒的转录因子到靶基因的预测。
在涵盖三种网络类型和七种细胞类型的基准数据集上的实验表明,BRIDGE在大多数设置中达到了最先进的AUROC和AUPRC。特别是在特定网络上,BRIDGE的平均AUPRC比第二好的基线GCLink提高了5%。在跨细胞类型的小样本迁移中,BRIDGE在所有六种目标细胞类型中均持续优于GCLink和GENELink。对人胚胎干细胞(hESC)的案例研究进一步支持了预测的生物学相关性,前10个和前100个新颖的转录因子-靶基因交互中,分别有9个和46个被ChIPBase验证。
博主点评: BRIDGE框架通过结合生物证据和动态门控机制,有效提升了基因调控网络的推断准确性,展示了在处理稀疏和噪声数据时的鲁棒性,具有重要的生物学意义与应用潜力。