学科分类
/ 1
1 个结果
  • 简介:比期望,非编码的RNA(ncRNA)基因才是更众多的。然而,与计算算法或生物实验识别ncRNAs仍然是一项困难的任务。最近的报告建议了ncRNAs可以也出现在表示顺序标签(EST的)数据库。不过,内部遗传因子的EST几乎没收到很少注意并且糟糕由于他们的低丰富被注解。这里,我们为从人的EST发现ncRNA基因开发了计算策略。我们首先收集了位于的EST内部遗传因子的区域并且别让详细注解。内部遗传因子的区域被划分成非重叠的50-nt窗口,从UCSC数据库获得的PhastCons分数被分到这些窗口。我们使有超过0.8的PhastCons分数并且有至少三支持EST充当种子的窗户保存。相应于种子的EST的每簇被装配进长contig。我们使用了二个标准从这些contigs为ncRNA抄本屏蔽:第一是最长预言的开的读物框架是不到300nt,第二是可能的Pol-II倡导者在contigs在上游或下游的2,000nt以内存在。作为结果,118新奇ncRNA基因从人的低丰富EST被识别。七个随机选择的候选人,六在由RT-PCR出现的人的2BS房间被抄录。我们的工作证明EST为检测新奇ncRNA基因是“隐藏的财富”。

  • 标签: NCRNA EST 计算机识别 标志序列 RT-PCR