主题:【原创】关于工程科研和工业实践的脱节 -- 晨枫
科研和实际相结合的问题说了几十年了。但这个问题不好一概而论,基础理论科研和实际相结合比较困难,也不能因为没有近期应用就应该放弃。基础理论科研不是需求拉动的,而是钱袋子推动的。永远有足够多的课题值得研究,永远有足够大的潜在价值不能舍弃,但这东西只有国家推动,国家要是在饥寒交迫之中,就没有这个钱和精力,就无法推动。钱不是万能的,但没有钱是万万不能的,用在基础理论科研上恰到好处。
和实际相结合的问题主要集中的工程科研上。这个问题不仅中国有,全世界都有。一方面大学里集中了大批优秀的学者,他们对理论前沿和科研工具熟谙,不仅热衷于推进学术前沿,也热切希望研究成果得到应用。工程科研成果在工业实践中得到应用,不仅有利于获得更多的研究经费,也是对他们工作的肯定,更有现实的银子滚滚而来。这是有百利而无一害的好事情,那为什么那么难呢?
难点在于工业界和学术界的出发点不一样。学术界的重点在于推进学术前沿,出文章,出学生;工业界的重点在于解决实际问题。在很多时候,这两者并不重合。这其实是很大的悲剧。
尽管科学和技术常常被混为一谈,工程技术和科学研究不是等同的。两者最大的不同在于不同的焦点。工程技术的焦点是解决一个实际问题,至于这个问题是涉及理论前沿还是只需要捅破一层纸,这不是关键。甚至可以说,在不完美但是简单、迅捷的办法(西方常称quick and dirty方法)和完美但繁琐的方法之间,前者几乎肯定占上风。这是由工程实践的本性决定的。再优美的科学方法也是从理想化假定出发的,在分析、设计的时候可以简化到理想条件,但到最后实现的时候,还是必须面对完整的现实世界,面对所有的非理想因素和不确定因素,只有对非理想因素和不确定因素不敏感的解决方法才是真正有效的方法。不完美但是简单、迅捷的办法有天然的内在模糊性,糊涂人办糊涂事,不被枝节问题所牵制,在实践中反而有效,这是工程技术和科学研究的本质区别,但是经常被忽略。
科学研究的焦点则在于发现科学规律、确立科学事实。由于现实世界实在太复杂,科学研究中将具体问题细分、简化、理想化,然后才谈得上深入研究。在深入研究的过程中,问题常常得到进一步细分、简化和理想化。其结果是科学的门类越来越细,视界越来越窄,有时候就见树不见林了。
在工业革命之前,工程师和科学家是两条道上跑的车。科学家蜗居在象牙之塔里,工程师在沉浸在奇计淫巧的世界里。工程师更像医生,专注于凭经验和祖传秘方望闻诊切和对症下药,病理、药理只是闲暇时候捣鼓的玩意。但是牛顿力学、微积分、现代化学证明了现代科学不仅可以解释世界,还可以解释祖传秘方,甚至预测新方子。从此,用科学方法研究工程问题、指导工程实践成为工程师的必修课。几百年来,科学的门类越来越细,越来越深,工程教育和工程科研也跟着一头扎进去,从工程师变为工程科学家了。从理论研究的角度来说,知识前沿就像一个皮球,研究深度越深,皮球直径越大,皮球的表面积也越大,也就是说未知的东西越多。所以工程科研本身就可以是一个闭合循环,自我创造无穷无尽的研究课题。另一方面,工业实践也是一个皮球,但这两个皮球并不重合,也不是简单的一个套一个,而是在有些地方工程科研的皮球套在外层,有些地方工业实践的皮球套在外层。
因此,工程科研和工业实践脱节有两个层面。第一:在工业实践前沿超前于工程科研的部分,工程科研失职了,脱离实际了,这本来是工程科研的主要职能。第二:在工业实践前沿落后于工程科研前沿的部分,工程科研业也失职了,没有有效地转化成工业实践。
工程科研落后于工业实践的例子很多。一个例子是串列聚乙烯反应器。聚乙烯反应产生的聚合物有一个分子重量分布,在单一反应器里,这个分布是大体固定的,相应决定了聚乙烯的强度和加工性。一般来说,强度越高,加工性越糟。采用两个串列的反应器之后,最后产物可以有驼峰一样的“双模”分布,通过对两个反应器的不同搭配,可以对聚乙烯性质进行“剪裁”,达到强度和加工性之间鱼与熊掌兼得。比如说,可以在高强度聚乙烯里增加一点低分子量的成分,后者好像润滑剂一样,改善加工性;也可以在低密度聚乙烯里增加一点高分子量的成分,改善透光性。然而,这种“简单加法”曾经在学术界看来是不上台面的,没有理论高度,所以得不到重视,直到工业界走在了前面,学术界才如梦初醒。既然可以串列,为什么不能并列呢?为什么不能从两个不同的反应器的到产物后在简单混合呢?还有很多问题。
另一个例子是带约束的多变量控制问题。自从60年代矩阵理论引入控制界,多变量控制就不再是一个跨不过去的关口。但传统控制理论需要有一个过程数学模型才谈得上控制系统设计,状态方程也好,传递函数也好,在实际上都不容易得到。Charlie Cutler提出动态矩阵控制(DMC),用FIR(截断脉冲响应?)模型建立动态矩阵,实际上就是对逐个单输入多输出阶跃响应采样。这在学术界看来已经是大逆不道,用近似模型而不是精确模型。但Cutler的惊人之举在于把这个“半吊子先进模型控制”和线性规划“打包出售”,用前者处理多变量问题,用后者处理约束控制问题。这样的做法在理论上没有任何收敛性证明,因此无法预测稳定性或其他性质,但在实际上获得了良好的效果,尝试、经验和小心相结合,没有出现稳定性问题。DMC之后还出现了其他大同小异的方法,Honeywell的RMPCT则把数学规划推广到“动态漏斗”,用作参数整定的工具。Pavilion Technology则把静态的神经元网络和动态的线性模型预估控制结合起来,闯进非线性控制的领域,约束最优也从线性规划进步到二次型规划。理论界对于这种“大象闯进瓷器店”的做法一筹莫展,李雅普诺夫也好,波波夫也好,H无穷也好,李群也好,都无法解释、预测、证明这些在现实中行之有效的控制方法。这有点像中世纪了,神学家们可以数清楚针尖上可以站多少个天使,但无法指导工匠们在造桥时用多大的石料可以造多大的跨度,工匠们只有依靠自己,在实践中摸索,积累“葵花宝典”。
另一方面,工业实践前沿在有些领域实实在在地落后于工程科研前沿。往复式压缩机是气相过程中常用的设备,说白了,这就是打气筒。这东西增压比高,机械简单,但是输出压力有本质脉动。下游过程要控制压力,很难绕过这个本质脉动,一般就是用低通滤波。但往复式压缩机的频率不是很高,需要用很强的低通滤波才能达到足够的平滑,副产品就是带来很大的相位滞后。下游过程需要改变工艺参数时,压力设定值改变,还是需要有一定的响应速度,低通滤波太厉害了,响应很迟缓,也不是个事儿。用PID整定来解决,要么反应迟缓,要么控制阀随着往复式压缩机“翩翩起舞”,增加阀杆、阀座磨损,很不好办。但是滤波理论里早就有带阻滤波这档子事,针对往复式压缩机的频率,正好阻隔掉这一个频率段(实际上没有那么简单,还有“附带杀伤”),就可以解决问题。但对于绝大多数干化工过程控制的人来说,频域方法是见了就头大的事情,还要来什么频谱分析、滤波器设计,这简直是强人所难了。
化工过程控制从单回路控制发展到多回路控制发展到非线性控制,现在已经超出传统控制的范畴,开始进入操作规程自动化的阶段了,像自动开车、自动停车、自动转产。虽然这东西在理论上还没有合适的方法表述,在实施上计算机界已经有成熟的东西了。如果不是Windows这样的巨无霸系统的话,计算机专业大学毕业生写一个简单的操作系统不是什么太了不起的事情,一个大作业而已。但这东西和操作规程自动化有很大的相似之处,多任务进程管理、系统资源管理、人机对话管理、中断管理、事故恢复,这些东西在操作规程自动化里都可以找到对应。但现在工业上只有自己动手,用半吊子知识在低层次上摸索,全然无法利用计算机世界里已经成熟的方法和设施。这也是另一个类型的脱节。
还有一个是所谓data mining。国内叫数据挖掘,其实叫数据掘金比较好。工业界使用DCS已经有几十年了,大家都积累了海量数据,但都有很大的问题:如何利用这数据发现规律、寻找解决问题?这是工艺工程师的看家本事,touble shooting、挖潜、制定工艺条件,都靠它。但工艺工程师一般都是用Excel把数据列表画曲线,然后对照着看,希望找出因果关联。这个做法第一需要在浩如烟海的变量里知道找什么变量对照,这本身就是大学问,有很多经验在里面;第二有时变量太多,几十、上百条曲线放在一起根本没法看。统计上有PCA/PLS方法,把众多相关变量的主元找出来,然后对大大降阶的数据进一步分析。但工业界的人第一对数学恐惧,第二对这些没有物理意义的主元也不知道怎么办,所以PCA、PLS的培训班办了一期又一期,软件包出了一个又一个,到后来还是只有少数敢吃螃蟹的人真正采用,别的人照样到时候用Excel。另外一个工具是平行坐标系,把直角坐标系里的点变成平行坐标系里的折线。粗看不大直观,但这个平行坐标系可以容易地把几十、上百个变量标绘出来,并对各个变量来回query,比如转化率在80-85%之间的时候,别的变量都在什么范围?如果有一个一致的范围,这就是相关,下一步就可以定量地找关系;如果什么数值都差不多同样可能,那就是没有关系,就不要再在这里浪费时间了。但和PCA、PLS一样,这样并没有多少高科技但需要一点另类思维的方法在工业上的应用还是有限,无法突破人们的畏惧。
工业实践领先于工程科研的脱节是传统意义上的脱节,这是一个令人遗憾的现实。但更令人遗憾的则是工业实践落后于工程科研的脱节,现成的工具和知识在那里,但对工业界可望而不可即。很多“高级”知识在大学本科甚至研究生阶段触及不到,但对于学术界来说,这些东西早已是成熟的东西了,太小儿科。作为研究项目不合适的话,还可以作为工业界培训项目,但实际上,除了少数敢于吃螃蟹的人,大多数工业界的人在培训之后,依然畏之如虎,这些“高级工具”常常不是只要点击和拉菜单就能解决问题,而是需要一定的理解和捣鼓。
现在有一些工程咨询公司,起到桥梁和填补作用,但工业界的难题常常需要时间理解,需要时间和第一线的人建立信任,这就不是这些打一枪换一个地方的工程咨询公司的强项了。
还有一个情况比较模糊,可以算作工业实践领先于工程科研的情况,但又在理论上没有太大的难度或者深度。比如说,传统控制理论的数学模型是线性的,即使非线性,也大多是和过程状态有关,而不是和输出有关。但实际上有这样一类情况,控制输出和当前值有关。比如说,聚合反应需要控制转化率,对于某一类产品,催化剂浓度在ppm级;对于另一类产品,催化剂浓度就要高达上千ppm级;但不管什么产品,转化率都要控制在75-90%之间。如果使用线性控制律的话,参数整定确定之后,不管当前催化剂是在ppm级还是上千ppm级,实际转化率高于设定值1%的话,输出(ppm)变化是相同的,那就不可能在不同产品之间达到有效控制,很难避免对ppm级增益过大、对上千ppm级增益不足的问题。但是把整个PID控制问题放到对数空间,这个问题迎刃而解。换句话说,传统的PID增量式是加减法(additive)的,把它变成乘除法(multiplicative)的话,就可以解决这个问题。最简化的情况就是,实际转化率高于设定值1%的话,输出在现有基础上降低5%,而不是直接降低固定量的ppm。这样的东西在学术上没有什么价值,肯定在大杂志上不上台面,教科书里也难有一席之地,也升不了职称,但在工业上解决实际问题,还有那么点普遍意义。
这就牵涉到一个问题:工业界的着眼点在于解决问题,减少损耗,创造产值。解决的方法是否有普遍意义不重要,甚至可以说,有普遍意义的话,工业界会尽量阻止竞争对手得益于这样的方法。学术界的着眼点在于推进知识的前沿,激发新的思考,或者世俗一点来说,就是要出文章。解决工业问题是锦上添花,这样的花是需要大显特显的。两者着眼点的不同导致了两者的脱节。这个问题怎么解决?在鼓励学校创收的年代,这个问题其实是得到了一定的解决的。大学里的人最紧要的是到工业界的大海里捕鱼捉蟹,学术价值不太重要。但正规化后,这条路又堵死了。
工业实践好比餐饮生意的吃客,菜有派系,派系内还有“上台面”、“不上台面”之分,很多时候饭店以“正宗xx派系”作为招牌,自然都是“上台面”的菜肴主打。但对于吃客来说,正宗与否、上台面与否常常不重要,好吃才是最重要的,鲍鱼和糍饭糕在同一个桌面上有什么关系?好吃就行。大学好比饭店大厨,菜系正宗固然重要,但要是忘记了吃客的口味,生意就做不大了。
本来是想对应穿越兄的问题,结果七拉八扯越写越多,自己把自己都绕糊涂了。看客就和吃客一样,喜欢了挑两样菜尝尝,不喜欢的……拉进铁手府里用墙围起来改造,直到喜欢为止,嘻嘻。
本帖一共被 3 帖 引用 (帖内工具实现)
俺本科学的是应用;硕士学的是理论,导师对应用问题是嗤之以鼻,觉得都是小儿科;博士期间,又学习应用,但自己的方向稍微偏理论,这回的导师对理论又是瞧不上眼,觉得做学问就应该学以致用。
至于俺自己,呵呵,觉得无所谓,有意思就做,跟着兴趣走。理论问题,尤其是涉及到一些数学方面的问题很有意思,但毕竟理论得用实践去检验,而且很多应用问题解决起来又有意思,又有成就感。理论和实践结合好,才能神挡杀神,佛挡杀佛。
干应用容易有成就感。“理论和实践结合好,才能神挡杀神,佛挡杀佛。”太对了!
首先应定义两个概念,research and development. 这两者最主要的区别是, development的东西大家都知道只要时间,金钱和人员都够的话, 总能搞出来。 而research则未知。Science and engineering, 前者是弄清楚事物内在的运行机理,后者说白了就是搞出产品。
美国企业(就是很多人称为工业界的)大多数集中在development, 而不是research. 就算少量有research (比如IBM的研究中心),也是集中在近期(10年,最多15年)可以用来开发产品的技术。 企业要赚钱,如果上市公司的话还要每个季度看报表,谁也不会乱花钱的。 从这个角度看, 很多联邦研究机构,比如NASA, 其实也是在开发产品,跟企业差不多,只是不以盈利为目的。 我个人认为,美国企业是美国的灵魂。
其次美国的大学和专业研究机构,如果没有各基金的支持,所谓的研究根本进行不下去(连大学的研究生开销都是从基金里来的)。 美国的基金会五花八门,每个基金都有自己的资助原则。 除了少数基金(比如NSF,占全部联邦级资助的20%)是侧重于基础科学(用NSF自己的话说, 是support for all fields of fundamental science and engineering, except for medical sciences.), 大多数基金都是很“现实的”, 需要有实际的应用的。 比如,大名鼎鼎的NIH,其使命是 seek fundamental knowledge about the nature and behavior of living systems and the application of that knowledge to enhance health, lengthen life, and reduce the burdens of illness and disability。至于军方和各种产业基金,那更是侧重于具体的engineering。 在这种体制下, “工程科研”和“工程实践”怎么会脱节?
中国的问题是搞混了。
中国的工业界由于开发力量有限,水平不高,会outsource一些到大学和科研机构,加上各种国家产业基金,大量的development and engineering项目也交给大学和科学院,导致本来应该侧重于research和science的大学和科学院大量精力耗在development上。 这样导致两个问题: 一是大学和科学院作development & engineering并不擅长,质量差,很不稳定。二是在过去30年里,中国已经没有多少research的东西了,而30年的持续research正是开始转换为产品的时间段,这个时候手上没东西,核心技术是不可能有的。
中国大学的横向项目是不是就是为企业作Development?
问题是, 教授和研究生都不太懂engineering的要求和程序,这样开发的产品如何稳定?
公司科研和工业实践结合得紧密,但大学科研有同样的问题。各种基金我知道,他们的项目拨款评审我也去过,嘻嘻,不说也罢。
反正国家钱多, 花点钱养一群研究人员,总比浪费在食品券上好。 再说了,花小钱留住一些终身(tenure)教授,为国家培养人才,顺便搞点研究,万一这些教授里有料的,那国家就算中大奖了。 真正拿出东西的,还得靠公司,和联邦政府的研究机构(比如NASA, Oak Ridge这样的),这也就是为什么大部分预算花在他们身上的原因。
说实话, 现在的research, 我估计80%是胡扯, 做的事情是making no sense. 但只要那20%真正make sense的在,美国这个国家就有希望。
development也一样。 公司开发也有很多浪费的, 有时一个项目, 几百号人,玩命搞了好几年,最后由于市场的原因取消。这可是动辄几亿的浪费啊。
以前德语国家的大学评审工科正教授候选人时有条不成文的规矩, 要求侯选人至少有一年在大学之外相关领域任职的经历。
这一条颇有挑战性。能有相当的专业成就、又能在工业界或管理部门干得好的人,当正教授以后闭门造车的可能性就小得多。
但中国应该也立这样的规矩,工科教授必须有至少x年的工业界经验,具体条文当然可以研究,但这个大方向是应该的。
才能把问题看的更清楚。做产品的时候,老老实实按照流程来,才能做出扎实的产品。
别的行业不敢说。我们IT行业,理论和实践还是有很多结合的:一个常见的问题是如何提高软件的性能。典型的工程问题,做起来是有套路的:先profile,找到性能瓶颈。然后从算法,架构等各个方面分析,找出对策。比如算法如果复杂度太高,就按照理论指导去改写算法;如果是架构不合理,就找折中,优化架构,最后总能有提高。
常见的性能问题总结出规律来,就发展出了编译优化这套理论,从当年的fortran到现在的java,都在用这套理论指导实践。
看到有人谈自动化方面的事情,真高兴。
说来惭愧,本科虽然学过电机电力拖动、仪表、过程控制,计算机控制,PLC、组态软件。可是本科毕设是用lie代数理论去控制倒立摆,虽然在实物上成了,但基本是在鼓捣simulink。
真的接触实际的控制问题还是硕士之后给老板干的几个“横向项目”,在工厂的时候。
减少阀的动作这个太现实了,亲自见过阀开闭的频率,亲自换过磨损得不行的球阀才有认识啊。
可是这些想指望学校老师能教给你,太难了,一个硬件环境就完全不同啊,学校里实验顶多让你控制一锅水、几个仪表吧……
至于控制理论与实际脱节的问题是老生常谈了,自动化学报早就和纯数学差不多了。可是硕士博士要毕业,老师要职称,还是得靠文章不是--!
不过现在已经不搞控制了,转去搞模式识别和机器学习了。
看到老大提到数据挖掘和数据可视化的问题啦!
和数据挖掘很相近,但多少有些区别,数据挖掘更看重模型的“可解释性”,这样可以根据现象,去从新设计实验,或者进行改进。
河里有段时间自控谈得蛮多的,老同学润树写过化工过程控制的实践,我也写过自动控制的故事(要找链接,刚狗了一下,发现此文流毒甚广呢,看来干自控的同行或者同好还很多)。
说到data visualization和data mining,两者不等同,但在工业上两者是“打包”处理的,就和一般的data analysis和process redesign打包处理一样,前者是为后者服务的,单独提出来就是皮之不存毛将焉附的问题了,所以常常统称。
你什么时候写一个模式识别和机器学习吧,很想学习呢。