了解人类早期发育的遗传基础不仅对哺乳动物胚胎发育机理和干细胞生物学研究具有重要意义,而且对再生医学、不孕症治疗以及更好地了解先天性疾病的原因也具有重要指导作用,我们目前获得的知识经验主要是通过使用实验室动物,尤其是模式动物小鼠产生的。虽然人类和小鼠的早期胚胎发育呈现出很强的发育进程和形态相似性,但我们知道在不同物种之间发育事件的时序调控过程在细胞和遗传机制是存在很大差异的。高通量测序、单细胞组学和基因组编辑等前沿生物技术的快速发展以及早期人类胚胎新型干细胞模型的构建,使得利用人工智能和机器学习方法等数据科学方法直接在人类细胞和胚胎中进行功能基因组相关的生物信息学研究变得可行。
近期,我院省部共建草原家畜生殖调控与繁育国家重点实验室左永春教授在基于人工智能的“数字胚胎”领域获得最新进展,课题组先后在生物信息学期刊Briefings in Bioinformatics(2020 IF: 11.62)和Bioinformatics (2020 IF: 6.937) 分别发表了题目为“HelPredictor models single-cell transcriptome to predict human embryo lineage allocation”和“eHSCPr discriminating the cell identity involved in endothelial to hematopoietic transition”的研究论文。
人类植入前胚胎在合子基因组激活 (ZGA) 后,细胞间的差异逐渐显现,导致全能卵裂球在胚胎第5天 (E5) 逐渐分化为内细胞团 (ICM) 和滋养外胚层 (PE)。ICM细胞显示特异转录因子 (TFs) 的“Salt and Pepper”表达,表明EPI和PE细胞逐渐变得不同。近年来,人工智能算法发展迅速并在精准医学领域得到广泛应用,尤其在识别候选发育相关调控因子和谱系决定分子事件方面具有显著优势。基于此,我们开发了第一个人类植入前胚胎谱系机器学习预测分析平台HelPredictor(http://bioinfor.imu.edu.cn/helpredictor),该平台集成了三种特征选择方法,即主成分分析 (PCA)、F-score算法和方差平方系数 (CV2),以及四种不同组合的经典人工智能算法,并通过增量特征选择算法来预测人类植入前胚胎谱系细胞。HelPredictor不仅通过交叉验证和独立测试分别达到94.9%和90.9%,而且使用该平台预测的因子能够分类不同的胚胎谱系及其发育轨迹,并对候选谱系特异性基因进行了详细讨论并进行了聚类,以探索胚胎异质性的转变。该工具可以快速有效地揭示潜在的谱系特异性和阶段依赖性生物标志物,并提供为发育生物学研究提供新的见解。
造血干细胞(HSC)类似于一颗树干可以长出树杈、树叶,并开花结果,它是所有血细胞和免疫细胞的起源,它会根据机体的生理需求适时的补充血液系统各个成熟细胞组分。同时在损伤、炎症等应激状态下,HSC也扮演着调节和维持体内血液系统各个细胞组分的生理平衡的角色。临床治疗中,HSC移植也被广泛应用于治疗癌症和其他免疫性疾病,而且在大部分白血病,特别是急性髄系白血病以及慢性髄性白血病的发生,都直接或间接与HSC异常相关。
医学上根据HSC的特性将其称为“万用细胞”,因此能够系统全面地了解HSC的早期发育阶段对于体外获得血液研究以及再生医学具有重要的指导意义。基于上述目的,课题组将单细胞RNA测序数据和临床分子标记整合用于机器学习建模,设计并开发了HSC分化发育阶段预测器“eHSCpr”,它可以有助于更好地帮助临床医学人员理解HSC在发育过程中做出不同的分化方向和细胞命运决定。研究人员首先通过F-score算法与三种传统差异基因筛选方法(DESeq2、edgeR、limma)来得到不同的差异基因集,然后分别比较它们在人工智能算法中的建模表现。在多项评估指标下,F-score算法不依赖先验生物学知识的情况下,优于传统的差异基因筛选方法可以更精准的识别HSC发育阶段,而且发现了一些与早期HSC发育相关的新的关键信号基因,最后,我们建立了首个eHSCpr在线预测网站来方便相关科研工作者使用。
以上研究工作主要在左永春教授指导下,由内蒙古大学生命科学学院博士生梁鹏飞和硕士生王浩作为第一作者分别完成。该工作得到国家自然科学基金(62061034, 61861036, 61702290)、内蒙古科技重大专项(2019ZD031)和内蒙古青年科技英才(NJYT-18-B01)等项目的资助支持。
论文链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab196/6284371
https://academic.oup.com/bioinformatics/article/37/15/2157/6126801