西西河

主题:【原创】你凭什么让我们的祖宗东奔西走颠簸流离 -- 老顽童

共:💬20 🌺21
全看分页树展 · 主题 跟帖
家园 有意思。想起软件上的相似性算法来了

比如在WIKI里,就有一个功能,是比较前一次修改和现在版本差异的。具体的算法,我也没明白

考虑一下,如果把所有染色体里的DNA的每个编码,A、T、C、G当作是文本,一个人的所有DNA序列就是一个巨大的文本,用一些超级计算机来比较两个人之间的序列相似性,应该也还可行,虽然速度会比较够呛一些。

现在对基因的东西不熟悉了。我有个疑问,比如一条染色体当中的基因序列,它是不是总是在某一个位置,或者说是在某一个位置附近,还是可以在染色体的任意位置,只是靠某些特殊的标记来表明这段代码是某个基因?

这个公司什么算法不知道。我想大概有两种可能,一种就是纯粹的看DNA序列,不去考虑基因组。另外一种可能,就是分析分类所有的基因组,变异的也好,不表达的也好,片段也好,最后得到一个总的数据库。假设,这个基因组数据库中总共有一百万个基因组。再假设甲有其中的40万个基因组,乙有其中的30万个基因组。比较甲乙之间基因组的重复程度,就可以判断两个人来源的相似性。

不过,对这种技术,我是有些担心的。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河