主题:【讨论】今天听了一个会,混了两顿饭,虽然不好吃。 -- 喜欢喝冰茶
总得来说,一个biologist(一个成功的例子),一个statistician(一个某些近于基础性的研究),一个physician(一个涉及到很多伦理问题),一个programmer(一个正在发展的数据整合),外带一个journalist(一个拿自己做例子出书骗钱),很有趣。
看起来personal genome发展很快,价格已经接近大家可以容忍的范围,想想去年还过千,现在已经400了,明年很可能会降到1、2百,至少价格上大家可以接受。不过靠这玩意儿治疗或者药物研发,还是任重道远,但是做诊断倒是曙光已现了。
* 23andMe uses a customized Illumina chip for $399
* deCODEme uses the Illumina Human 1M for $985
* SeqWright uses the Affymetrix Genome-Wide Human SNP Array 6.0 for $998
* Gene Essence uses the Affymetrix Genome-Wide Human SNP Array 6.0 for $1195
* Navigenics uses the Affymetrix Genome-Wide Human SNP Array 6.0 for $2500
* Knome offers direct full genome sequencing for $350,000
* The Personal Genome Project aims to recruit 100,000 volunteers and publish their genomes and medical information
做股票的同学看看Affymetrix,Illumina,454,Abi,看看能做出个什么model?
23andme看来不错,Google这一脚插的有远见。某些人曾经的梦想看来要实现了,“你那ipod存什么?mp3?电影?哈哈,除了那些玩意儿,俺还存自己的基因”
不明白SNP的同学可以看看这个
[FLASH]http://www.youtube.com/v/kp0esidDr-c[/FLASH]
一个有趣的例子:
This snp (and perhaps its neighbors, Rs324650) may influence intelligence and alcohol dependence
注意看右边TT代表high IQ,HCB and JPT mean:
* JPT - Japanese Tokyo - 44 unrelated Japanese in Tokyo, Japan, representing one of the populations studied in the International HapMap project
有点儿歧视欧洲和非洲的土著哈。
走了走了,去参加婚礼去。
目前的genome研究正从microarray chip向sequencing过渡,这是个大趋势。
Personal sequencing的里程碑是Solexa的Ultra-throughput sequencing,这是去年最火的一个技术。而illumina把solexa给收购了,所以在sequencing方面是执牛耳者。
Affymetrix以前是microarray的老大,但在sequencing技术上已经落后了。
但在市场上,最后谁得到最大的蛋糕还很难说。毕竟大量的商业运用还要等几年。做疾病预测的技术核心是数据库和预测算法,而不是生物技术本身。如果有好的数据库和好的算法,买几台sequencing machine,找个有能力的合伙人,你自己干或许也能进500强。
另外再随便说两句。personal genome的研究我是非常看好的,未来的市场会非常大,在商业模型上也很多样化,可能成为继互联网之后的又一大投资热点。但搞这类研究的难点在于大投入,这不是小公司所能够承受的。另一个难点在于生物研究的长周期,投资后很难在短期内获得回报。而一旦开始赚钱,利润也必然是暴利。
想起祥瑞写的一句话:“一个声音俯在耳边轻声呢喃道:‘你可以看到命运,但却不能改变什么。’”
谢谢:作者意外获得【通宝】一枚
鲜花已经成功送出。
此次送花为【有效送花赞扬,涨乐善、声望】
但是我想一些专攻算法的小公司还是有些发展前途的。可以说投资少,见效快。。
可是要没有这些公司靠技术把成本压下来,这数据库也建不成不是?老花生的当时4个人做了3星期,还是3个人做了4个星期,也就一两年前的事,照baylor的说法,钱花了不少,照现在这趋势,普通百姓们做这个比体检都简单,只要把样品和钱寄过去就行了。
Affy现在microarray也不顶了,成本太高,Illumina的价格太强,而且一个片子上就是12个 ,看来affy要走ibm的路了。
俺也觉得这块儿应该是个潜在的方向,不过谁都想分一杯羹,据说医生们想把这玩意儿跟处方权挂上。看起来老兄很熟,比较一下这几家儿的咚咚如何?
多谢多谢,好久没进项了。
所以做过一点功课。我是做bioinformatics的,所以对技术本身谈不上特别了解,随便聊聊吧。
Affymetrix不去说他了,现在苦苦支撑chip那一块,好像找rich young全世界跑一圈代言过,那也没有用,科技才是第一生产力啊。
454是老技术,一个run几百万个bp,三年前这个已经了不起了,叫做high-thoughput,但现在没用了,望illumina和abi之尘而不及。
现在的主流是illumina的illumina/solexa和abi的solid(你提到ali,怀疑是笔误)。去年illumina的solexa刚出来的时候处理能力是几千万bp/run,号称1G,现在改进后真正能够达到1G以上了 (也就是说,理想情况下3个run就可以做whole-genome sequencing, 但事实显然不是这样)。为了跟454区别,叫做ultra-throughput. abi 的机器能力也达到1G, 而且据说sequencing alignment的算法比illumina强,但illumina起家早,市场占有率高,这是abi不能比的。为了挖illumina的墙脚,abi到处邀请人去他们公司参观,上半年我的一个同事也去了,据说一副欣欣向荣的样子。
情况大致如此,所以要买股票的话,建议买illumina和abi的。
再回到市场应用的话题。illumina和abi的机器是基础,但要预测疾病需要数据库和算法,这就是你提到的那些IT公司干的事。目前这些公司其实还是基于chip,原因很简单,现在基于sequencing的分析技术才起步不久(这也是我申请的项目的目标)。但一两年内sequencing替代chip的趋势是不可逆转了。
另外,现在这些公司的产品玩的还只是概念,远远还谈不上成熟。首先,也是最重要的一点,现在对跟疾病相关的SNP的研究还不够深入,数据不够多,要建立相对准确的疾病预测的概率模型相当困难; 其次,chip是不可能做到真正的genome-wide的,这是由primer design的盲点所决定的;只有sequencing才能做到genome-wide.而要覆盖整个genome的99%,大约需要处理7倍genome-size的bp, 就目前的sequencing技术而言,至少还要几万美元。所以,在这些方面还有非常大的研究空间,当然只有这样我们这些人才有饭吃。
对23andme的惊人报价,我估计23andme的超低价连成本都不够。这个我认为不是市场策略,而是为了搜集数据。我已经说了,预测的能力取决于数据,而要搜集成千上万的数据,经费可能远高于买机器。23andme很聪明,降低报价的结果就是别人给了你数据的同时还给你付一笔钱,这是很有眼光的一招。当然也得靠google的后台才玩得起。
如果对sequencing技术感兴趣,不妨看一下这个论坛:http://seqanswers.com/
搞预测算法,样本是第一位的。而要得到大量医学样本,没有钱是不行的。这个跟普通的计算机模式识别的应用还是有区别的。
其实这个回国搞可能会比较有搞头,国内容易搞到样本,而且有中国国情(毕竟黄种人的基因跟白种人还是不一样),来自国外公司的竞争压力不那么大。这是真正的民族产业。
说实话,如果现在有人愿意给我投一千万美金,我立马回国开公司去。
我说的投资少见效快,是和其他生物产业比的。医学样本么,我觉得多到一定程度以后对某一种特定算法的精确程度就没有影响了,想提高精确程度,只能从算法本身去优化。至少我以前用 几个 machine learning 的算法是这样。这东西当然是回国搞,中国可是基因宝库。。
1千万美金。。您胃口还真大,我要是有1千万人民币就准备跃跃欲试了。芬兰和丹麦有几个这样的生物信息学公司,我看规模也不是很大。
国内想来肯定有些同学们已经有想法或者开搞了,不过水也不潜。
至于23andme,怀疑还是用Illumina的array,成本可以压下很多,当然有google在后头,它怕谁? SOLiD好像是false positive rate低,因为多测一遍儿。机器现在还是蛮贵的,1/2M一个,不过据说Canada的center一下就是10还是20台来着,真是钱多烧的。当然就全基因组来讲,“Knome offers direct full genome sequencing for $350,000”可能还靠谱儿,但就当前的一般使用,23andme们也就够了。
至于样本,那个SNPedia不就在干这事儿嘛,不过估计NCBI/NCI会插一杠。算法嘛,呵呵,MATH/CS/CSE/EE的最爱,要不这么多工程的同学们从NIH骗钱涅。正好信息版里有河友在谈云计算,连计算资源都解决了。大家玩string matching的事业开始越来越红火了。
看来老兄是搞这个的专家,以后要请老兄多多指教哈。
解决问题就不丁了。
还有人提出搞人体HPLC呢,如果对体内的所有分子的信息都不清楚,怎么搞信号传递?
还有一些别的,诸如是药三分毒,大家都知道很多药使用的时候都是有限制的,治疗某些病的药对另外一些病(诸如遗传病)有副作用,有时候是致命的。可要是病人都有怎么办,而且还没有表现,那医生开药的时候可没办法了。但是你的基因组不会骗你,如果有足够的样本,其实简单的统计就可以知道得某种遗传病甚至相关疾病的概率,那医生就心里有谱了。这也是为什么这个东西会涉及到法律/伦理问题。试问这个信息该不该透露给保险公司?不给,对保险公司或者说别的投保人不公平,给了,就涉及到个人隐私的问题。
Genetics load the gun but it's the environment that pulls the trigger.