自然界中的微生物储藏着大量不为我们发现的宝贝基因,这些基因编码一些重要的酶、短的peptide,在生物化工,生物制药等方面扮演重要的角色,诺奖得主屠呦呦所发现的青蒿素也是来源于植物,那么如何批量的挖掘宏基因组数据的关键基因?去发现可能的药物peptide? 今天我们走进Nature chemical biology的一篇文章,学习使用基因组挖掘工具发现新型基因。 这篇文章中所关注的基因是是一种被称为绳索短肽的蛋白,具有极大的药用价值。然而由于缺乏有效的基因组挖掘工具,尚不能全面的了解这些基因的情况。 首先科学家们开发出来一套发现相应的基因的pipline: 通过输入序列,然后对基因组进行注释,发现潜在的具备基因组的位置,由于这些短肽多与修饰酶偶联分布在基因组上,提示极有可能在修饰酶的周围含有这些位点,然后通过在周围发现相应的短肽的基因,并通过打分函数进行评价。 然后科学家们发现了一千多种相应的lasso peptide 对于打分函数的训练集而言,可以很好的进行有效的区分,就是什么是有效的短肽,而什么不是。 生物极客点评: 通过基因组数据挖掘在Cas9等发现中扮演着重要的角色,随着宏基因组数据的不断发现,大自然一定越来越多的展现他的神奇!
|