Workflow
浙江大学最新Cell论文:AI基因组模型——女娲CE,破译脊椎动物基因组调控语言
生物世界·2025-07-09 00:09

撰文丨王聪 编辑丨王多鱼 排版丨水成文 多细胞生物中的不同细胞类型拥有相同的基因组,但由于基因表达的差异调控,它们表现出高度特化的功能特征。调控序列通过以细胞类型特异性的方式招募序 列特异性转录因子 (TF) 来决定基因表达模式。染色质可及性是调控 DNA 的通用标志,可通过 DNA 酶 I 超敏感性测序 (DNase-seq) 和基于转座酶可及染 色质测序(ATAC-seq)进行测量。利用这些检测方法,已经在哺乳动物中开展了多项大规模工作以绘制全基因组范围内的调控序列。然而,对于大多数物种而 言,全面的细胞类型解析调控序列图谱仍不可用。 该研究建立了 超高通量、超灵敏的单核 ATAC 测序技术 (UUATAC-seq) ,可在一天内高效率高质量的完成一个物种的染色质可及性图谱。基于该技术,研究 团队为五大代表性脊椎动物中绘制候选顺式调控元件图谱,开发了多任务深度学习模型—— 女娲CE ( Nvwa cis -regulatory element ) ,并实现了从基因组序 列到单细胞水平调控元件图谱的直接预测。 研究团队发现,脊椎动物调控语法的保守性明显强于核苷酸序列本身,且该语法将脊椎动物调控原件序列在高维 ...