Chinese | English
用户名 密码 验证码 验证码
关闭
中心网站服务器故障,基本功能已修复,可正常下单,图片数据尚在修复中,有问题请联系(027)68780570。
关闭
在线咨询
联系QQ:2178199170
当前位置:首页 > 详细信息

浙江大学郭国骥/韩晓平组发表基于人工智能神经网络的基因组解读系统Nvwa

作者:CZRC 发布时间:2022/10/18 3:00:00
预测基因表达和解析基因调控机制一直是基因组学的重要目标。尽管研究人员已经努力使用细胞系或组织中的各种实验特征来预测调节信号和基因表达[1-3],但在单细胞分辨率下进行生物体规模的表达预测仍然具有挑战性。如今单细胞图谱能够以统一的标准呈现物种细胞的表型[4-9],因而人类有机会使用跨物种的单细胞数据来探索进化过程中不同细胞类型的表达和调控程序。研究团队假设可以直接从基因组序列预测生物体规模的单细胞基因表达,并试图在具有巨大细胞类型多样性的后生动物中检验这一假设。

2022年10月13日晚23时,Nature Genetics在线刊登了浙江大学基础医学院/浙江省良渚实验室郭国骥/韩晓平团队的学术论文“Deep learning of cross-species single cell landscapes identifies conserved regulatory programs underlying cell types”。该研究利用自主构建的高通量单细胞测序平台Microwell-seq绘制了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图谱,并探究了八种代表性后生动物细胞类型的跨物种可比性,揭示了脊椎动物细胞类型保守的调控程序。

此外,该研究提出了深度学习模型Nvwa(女娲),首次实现了完全基于基因组序列预测单细胞分辨率下的基因表达。该研究基于Nvwa模型学习衍生的谱系特异性基序,表征了跨物种细胞类型特异性的调节程序。


该研究中,研究人员首先使用其团队自主研发的高通量单细胞测序平台Microwell-seq绘制了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图。其中,斑马鱼图谱收集了635,228个单细胞数据,果蝇图谱涵盖了276,706个单细胞数据,蚯蚓图谱包含了95,020个单细胞数据。该研究利用这三种模式动物的单细胞图谱,并结合其他五种代表性动物的单细胞图谱(人类[4]、小鼠[5]、海鞘[10]、线虫[11]和涡虫[12]),挖掘了跨物种细胞谱系特异性的转录因子,探究了八种代表性后生动物细胞类型的跨物种可比性,揭示了脊椎动物细胞类型,特别是免疫细胞、基质细胞、神经元、上皮细胞、内皮细胞和生殖细胞的保守调节程序。



基于DNA序列编码基因表达模式的假设,该研究提出了深度学习模型Nvwa(女娲),首次实现了完全基于基因组序列预测单细胞水平的基因表达,且预测准确度与实验测量精度相当。值得注意的是,Nvwa模型可以高度准确地预测几乎所有测试物种的基因表达。此外,通过检查模型第一层的卷积的基序特征Filter,团队揭示了细胞类型特异的基序。这些基序与在特异细胞类型中作用机制明确的转录因子基序相一致。基于Nvwa模型Filter的跨物种比较,该研究还发现同源Filter倾向于保持跨物种的细胞类型特异性。该工作首次建立了物种层面基因组编码细胞图谱的整合模型,并为解码多物种基因调控程序提供了宝贵资源。



浙江大学基础医学院2019级直博生李佳琦、良渚实验室特聘研究员王晶晶、浙江大学基础医学院博士后张霈婧和汪仁英为本文共同第一作者,浙江大学基础医学院郭国骥教授、韩晓平教授和良渚实验室王晶晶研究员为共同通讯作者。研究获得了国家重点研发计划和国家自然科学基金的支持。


参考文献
1. Agarwal V, Shendure J. Predicting mRNA Abundance Directly from Genomic Sequence Using Deep Convolutional Neural Networks. Cell Rep. 2020, 31(7):107663.
2. Zhou J, Troyanskaya OG. Predicting effects of noncoding variants with deep learning-based sequence model. Nat Methods. 2015, 12(10):931-4.
3. Kelley DR, Snoek J, Rinn JL. Basset: learning the regulatory code of the accessible genome with deep convolutional neural networks. Genome Res. 2016, 26(7):990-9.
4. Han X, Zhou Z, Fei L, Sun H, Wang R, Chen Y, Chen H, Wang J, Tang H, Ge W, Zhou Y, Ye F, Jiang M, Wu J, Xiao Y, Jia X, Zhang T, Ma X, Zhang Q, Bai X, Lai S, Yu C, Zhu L, Lin R, Gao Y, Wang M, Wu Y, Zhang J, Zhan R, Zhu S, Hu H, Wang C, Chen M, Huang H, Liang T, Chen J, Wang W, Zhang D, Guo G. Construction of a human cell landscape at single-cell level. Nature. 2020, 581(7808):303-309.
5. Han X, Wang R, Zhou Y, Fei L, Sun H, Lai S, Saadatpour A, Zhou Z, Chen H, Ye F, Huang D, Xu Y, Huang W, Jiang M, Jiang X, Mao J, Chen Y, Lu C, Xie J, Fang Q, Wang Y, Yue R, Li T, Huang H, Orkin SH, Yuan GC, Chen M, Guo G. Mapping the Mouse Cell Atlas by Microwell-Seq. Cell. 2018, 172(5):1091-1107.e17.
6. Fei L, Chen H, Ma L, E W, Wang R, Fang X, Zhou Z, Sun H, Wang J, Jiang M, Wang X, Yu C, Mei Y, Jia D, Zhang T, Han X, Guo G. Systematic identification of cell-fate regulatory programs using a single-cell atlas of mouse development. Nat Genet. 2022, 54(7):1051-1061.
7. Ye F, Zhang G, E W, Chen H, Yu C, Yang L, Fu Y, Li J, Fu S, Sun Z, Fei L, Guo Q, Wang J, Xiao Y, Wang X, Zhang P, Ma L, Ge D, Xu S, Caballero-Pérez J, Cruz-Ramírez A, Zhou Y, Chen M, Fei JF, Han X, Guo G. Construction of the axolotl cell landscape using combinatorial hybridization sequencing at single-cell resolution. Nat Commun. 2022, 13(1):4228.
8. Liao Y, Ma L, Guo Q, E W, Fang X, Yang L, Ruan F, Wang J, Zhang P, Sun Z, Chen H, Lin Z, Wang X, Wang X, Sun H, Fang X, Zhou Y, Chen M, Shen W, Guo G, Han X. Cell landscape of larval and adult Xenopus laevis at single-cell resolution. Nat Commun. 2022, 13(1):4306.
9. Wang R, Zhang P, Wang J, Ma L, E W, Suo S, Jiang M, Li J, Chen H, Sun H, Fei L, Zhou Z, Zhou Y, Chen Y, Zhang W, Wang X, Mei Y, Sun Z, Yu C, Shao J, Fu Y, Xiao Y, Ye F, Fang X, Wu H, Guo Q, Fang X, Li X, Gao X, Wang D, Xu PF, Zeng R, Xu G, Zhu L, Wang L, Qu J, Zhang D, Ouyang H, Huang H, Chen M, Ng SC, Liu GH, Yuan GC, Guo G, Han X. Construction of a cross-species cell landscape at single-cell level. Nucleic Acids Res. 2022, gkac633.
10. Cao C, Lemaire LA, Wang W, Yoon PH, Choi YA, Parsons LR, Matese JC, Wang W, Levine M, Chen K. Comprehensive single-cell transcriptome lineages of a proto-vertebrate. Nature. 2019, 571(7765):349-354.
11. Cao J, Packer JS, Ramani V, Cusanovich DA, Huynh C, Daza R, Qiu X, Lee C, Furlan SN, Steemers FJ, Adey A, Waterston RH, Trapnell C, Shendure J. Comprehensive single-cell transcriptional profiling of a multicellular organism. Science. 2017, 357(6352):661-667.
12. Fincher CT, Wurtzel O, de Hoog T, Kravarik KM, Reddien PW. Cell type transcriptome atlas for the planarian Schmidtea mediterranea. Science. 2018, 360(6391):eaaq1736.

地址:武汉市东湖南路7号中科院水生所; 电话:027-68780570; 网址:http://www.zfish.cn/; 邮箱:zebrafish@ihb.ac.cn
Copyright © 2012 - 2023 国家斑马鱼资源中心 版权所有
鄂ICP备05003091号-2  鄂公网安备42010602003695