西西河

主题:【原创】谈谈大学的变迁1 -- duhao

共:💬50 🌺39
全看树展主题 · 分页首页 上页
/ 4
下页 末页
家园 how many people will touch the

kernel? I know programmers will use algorithms. But it is not the core of their jobs.

金融公司也找很多programmer?

Do you mean Financial Quant Analysts?

A quant is totally different from a programmer in a financial enterprise.

My point is "how many people will be developing core algorithms for Google? how many software engineers in Google? "

家园 俺的意思是说

生物技术公司的programmer的工作就是写程序,但那不是生物信息。

一个很好的比较就是,quant vs bioinfo analyst。a bioinfo analyst is definitely different from a programmer in a bioinfo/biotech company.

所以你的论点就是google=computer science?请问google做计算机吗?google做模拟游戏吗?google做操作系统吗?就像genetech,amgen,affymetrix,454一样,公司不能代表一门学科。你看到是公司的商业行为而并非这里说的学科。

家园 hehe

i am talking about jobs, which may be the most important thing for some ppl.

hehe
家园 大家不在说一个东西

对,这行现在job里bioinfo programmer挺多,大部分是master/senior bachelor level的,至于phd的话,除了研究机构,公司里大约是bioinfo scientist/analyst。这行其实入门挺低的,拿个master学位也挺容易,基本上就是会编程,知道点儿生物/医学知识就行了,甚至都不需要知道,所以才会给大家的印象就是这玩意儿就是写写程序而已。就像CS的PhD不见的都是programming的guru,但是CS的Bachelor/Master的编程一定要好,否则就不是一个好学生了。

家园 的确是出发点的不同所造成的

我个人对于生物信息学,是抱一个乐观的正态度的。在自己的研究过程中,我也跟若干的生物信息学实验室进行过合作。大多数情况下,是我们获得了某个或是一大批的数据,希望能够通过生物信息学的合作来决定下一个有兴趣的方向。

但是实际情况却是屡屡遇到挫折。他们通过分析所得到的结论或者指出的方向,完全在我们的意料当中,甚至包括某些已经被我们所抛弃或者放弃的方向。

现在想来,一是我对于生物信息学的期望过高,二是合作当中,我觉得,我们就是生物学方面的,他们是信息学方面的,两者并没有足够好的融合为一体;三是他们通过完全的数学解释所得到的最符合逻辑的执导,实际上对于我们是完全没有用的,因为这些最显而易见的,都已经被我们或者别人尝试过了。

对于我们的研究来说,我们找寻的,是如何帮助我们的研究突破的方式方法。一切的手段,除了试验设计,都只不过是辅助手段而已。而一旦局限于我们所限定的圈子,生物信息学自身发展的不足就完全的暴露出来了。

而生物信息学所真正引人注目的那些发现,是对于那些我们力所不逮的方面。也就是必须用生物信息学自身的强项,比如说大规模多变量情况下多种处理结果的对比,或者说纯数学的计算类的晶体结构之类的。

目前的生物信息学,说实话,并没有完全摆脱数据分析的生物学应用这个尴尬的地位。虽然我很希望能够看到一个全新的应用方式。

我并不是说生物信息学不好,只是目前的发展还没有达到能够完全的独立存在的地步。而且,也的确是需要给予这个新兴学科一定的时间,来让它能够真正的生根发芽。

我期待着有一天,跟生物信息学者们聊天的时候,他们能够给我一个可以理解的生物学方面的观念惊喜。

家园 看做什么了,有相当一部分的BMI/BI/CB

是基于统计的,统计结果的结论是建立在大量个体的共性,允许单个例外的,因而针对某一个family或者subfamily,并不见得一定有意义。在选择方法的时候,只有明白每个方法的强处和局限,总能找到一个合适自己的。

例如有些人觉得Microarray不可信,可是这些人用之前真的明白microarray能干什么吗?在把样品交给microarray core之前,自己是否作了quality control。总以为数据就是点几下鼠标就分析出来了,岂不知所有的microarray公司当前侧重的都是片子和设备,至于分析,他们本来就是留给研究机构的,因为从business的角度,他们也许没有也许不想分配财力与人力干这个。而简单的一个genelist并不意味着分析的结束,事实上,真正有生物/医学意义的分析还没开始。这行门槛太低,很多背景的人都来做这个,总以为这东西就一统计,却忘记了要回答的是生物/医学问题,而不只是个statistical test。

家园 同意你的观点

好了,我们的观点基本上是一致的,只不过是角度不同而已。很荣幸能跟您探讨这么多生物信息学的问题。希望以后有机会还能够多多请教。

家园 您客气,以前做的东西说起来

应该也算是同行,只不过觉得太基础,又对计算有兴趣,所以来美国来的时候就转了方向。

家园 有这事,敢问国内的时候,您是谁的门下?

妖道对于计算和数学的底子太差,要补起来太费劲,这才死心塌地的做基础了。

家园 看来这两位基本算是同行

生物信息学在我看来有两个方面,一个是bioinformatics, 一个是computational biology.这两个方向通常都混为一谈。我在做博士后时也觉得差不多,但做了一些项目,自学了一些分子生物学的知识后(本人计算机专业PhD),觉得其实是两回事。

bioinformatics偏重informatics,也就是说,偏重于开发辅助生物研究的软件工具。比如网络数据库(eg genome browser, Pubmed),分子结构三维显示(eg Cn3D),Sequence Alignment (eg Fasta)等等。做bioinformatician,对生物知识的要求并不是太高,基本上就是软件开发: 生物学家提出需求,由bioinformatician 实现。低级一些的bioinformatician甚至只需要熟练应用几个软件就可以了。

而computational biology更偏重于biology。一个computational biologist需要相当的生物学知识,然后针对某个生物学问题提出自己的计算模型再加以应用。一个典型的例子是Eric Lander,人类基因组测序项目的负责人,牛津大学数学专业毕业,哈佛和麻省理工的生物学教授。这样的背景使他能够了解什么是生物学要研究的,什么能够通过现有的计算资源来解决,从而在全局上领导一个大型的生物学项目。

这两个方向其实对应了两种生物学和信息学交叉研究的模式。在传统意义上的模式,是由生物学家提出假设,申请项目,设计实验得到数据,再由bioinformatician来处理数据,最后由生物学家make story。传统模式的缺陷在于生物学家常常无法了解计算机能够做什么,而bioinformatician则不清楚生物学家到底要什么,导致合作的困难。而新的研究模式则是由计算生物学家贯穿并领导整个项目,使项目从头至尾都处于一个可控的状态。第二种研究模式现在已经越来越受重视了。比如Broad Institute近年来在三大杂志发表的很多文章第一作者都是搞计算机出身的。

我个人认为,现在bioinformatician在职场上已经饱和了,而computational biologist的需求远远还没有满足。随着high-throughput生物技术的发展,未来的生物学项目会产生海量的数据,而这些项目往往需要computational biologist 的参与甚至领导。而要培养一个computational biologist比培养一个bioinformatician难得多。一个好的computational biologist必须拥有对生物学发展的敏锐直觉和强大的逻辑分析和数学建模能力,这样的要求,不是一个单纯的生物学博士或者计算机科学博士就能达到的。从职业发展的角度看,搞bioinformatics的除了少数牛人(比如UCSC的Jim Kent)外,多数走程序员到项目经理的路子;而搞computational biology的可以申请自己的生物学研究项目,主动性高得多,甚至在未来得炸药奖都说不定。

家园 这段说得好

我给计算机系本科生开了一门选修课,介绍一些常用的生物数据常用软件。在第一堂课给了五个Tips:

1. No data is perfect;

2. Never trust default settings;

3. Never trust statistical test;

4. Try different software if possible;

5. Never trust biologist's hypothesis;

关于最后一点,我认为现在生物数据处理中很大一个误区就是用生物学家的假设去指导处理过程,而不是用数据去独立地检验假设的正确性,这是非常普遍而危险的。今年Cell上有篇文章就是犯了这样的错误而被回收的。

家园 生化武器那是大大的有前途啊

弄不好到以后还能继续搞基因武器。

家园 客气,俺是电生理那块儿的

俺只对数学里面部分东西比较感兴趣。至于计算机方面,呵呵,没办法虽说大方向和您一样,但俺们学了一些杂七杂八的东西,诸如汇编语言。

应该是邻居了

家园 呵呵,这个要看PI了

如果PI非常清楚他/她要什么,当然在后期处理focus在PI的兴趣,但是前期处理,底线还是要坚持的。

家园 也许,最好的叫法应该是BioComputing

BI/BMI和CB还是有很多重合的地方,例如protein的特性预测,不仅仅是结构,还是binding/function的预测,这东西也算是BI,但也算CB。不仅仅是纯粹的数学算法的应用,还有基于生物知识的融合。如果观察Casp的话,真正好的实验室就那么几个,而他们绝对是二者的融合,没办法,生命现象太复杂,不可能像maxwell的电磁场公式那样,几个数学公式就描述了。真正算是完美描述生命现象的数学公式,据俺的印象,一个是酶动力学的基础的米氏方程,另外一个是计算神经的HH方程。

BI现阶段相当一部分都focus在基因上,可是DNA/RNA不过是一个生命分子,而protein才是功能的行使者。二者之间的研究方法相对来讲也有所不同,前者更侧重于大量的统计分析,而后者则对相对来说单个或者少量的个体感兴趣。进来崛起的BMI还包括了图像处理等侧重信号处理方面,所以很多EE和CS的研究人员也加入这个大家族了。

全看树展主题 · 分页首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河