西西河

主题:【整理】说说最近有关biocomputing的事情 -- 喜欢喝冰茶

共:💬27 🌺37
全看分页树展 · 主题 跟帖
家园 恩,进步不是一点半点的

可以说是成千上万倍的。它的一个数据点,几年前就是几十台机器连算一个星期的结果,它只要秒一级的时间就出来了。

想发好paper的看S那篇。想知道那东西具体干吗的童鞋,07年上半年S上有个review专门讲生物上是如何应用的。手上的东西只要热,一合作基本上就是NS级的文章,如果没那么热,怎么着也是PNAS级的。

想找工作挣钱的,有很多可看。这个bioinfo的专辑对于感兴趣算法的可以看看,不过有点老。现在的问题是技术太快,09年的数据量现在看起来太小。2nd NGS的机器可以一天30G seq data,不是图像文件哦,只是fasta,光存储都是问题。一台机器连续工作5天就是150G,假定能工作50周,一年的话,就是8个T,这还是非常保守的估计,像公司里都是不停的跑的,连续工作350天,一台就是10个T左右,要是有个十台八台的,一年就是100个T,这个往linux盒子里塞硬盘显然不是个解决办法。

至于想了解NGS最新的生物应用的童鞋们,查一下N的Methods和Genetics分刊,今年的review都有不少。不过玩儿rare variant的兄弟们最好观望一下,等等新的东西出来。现在的常用算法上有一些问题,特别是variant

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河