主题：【讨论】解释执行类代码的性能有无可能达到甚至超过本机编译代码 -- 老兵帅客

共:💬64

老大河待整

全看树展主题 · 分页首页上页下页末页

复调试器用的和动态分析/优化用的Meta Data是不一样的

家园

关键在于这种程序流的信息是否只有VM机才能提供

而编译器，或者经过改进的编译器就不能提供?

Debug器可以在程序执行期间动态 Track 变量，堆栈，

为什么就不能Track Hotspot? 现在他们没有这么做，

不意味着以后就不可以吧？

复关键在于这种程序流的信息是否只有VM机才能提供

家园

关键不在于技术，而在于是否有足够的动力这样做

例如Basic语言，很长时间它都是解释执行的。其实对于很多的Basic实现来说，做一个编译器并不是很难的事情，问题就在于是否值得做这件事情。

对于C/C++这类语言来说，它们已经有了三十多年（C语言）和二十多年（C++语言）的历史了，语言的文化、观念和实现技术都早已经定型，任何大的修改都会导致严重的争论和兼容性问题。另外，对C++来说，Virtual Table的实现方式已经导致了几派的对立，再增加比RTTI强得多的Meta Data岂不会引发地震？更不要说动态优化了。

一句过分的话，技术是人搞的，很多老的技术是由很老的人搞出来的，他们的思路早已经僵化了，人类社会的争斗在技术世界里同样存在。

复关键在于这种程序流的信息是否只有VM机才能提供

家园

不知道是不是可以这样说：C/C++编译好的程序就是CPU执行的具体指令了。

你不管如何运行，他就是他了。所以一个程序你不管运行多少遍，可执行文件依然如我，不会丝毫改动。（你也没法改动了）

而Java的byte code和.NET的IL不是机器指令。是一种中间语言，在运行时由JVM或是CLR临时翻译成机器指令。这个过程是one to many的关系。一段byte code可能在第一次翻译的时候，质量很低，但经过一段时间，翻译的质量就会提高，甚至超过C/C++静态编译的质量。

理论上讲，JVM和.NET有C/C++拥有的一切静态信息以及更多的动态信息。对一个长时间运行的程序而言，编译的开销会逐渐消失。理论上因该可以产生更好的机器代码，取得根好的性能。当然，程序最终的性能还有好多其他因素，比如内存管理方式的不同会造成性能上的差异。

复关键不在于技术，而在于是否有足够的动力这样做

家园

很高兴老兵终于同意我的观点了

http://www.cchere.com/article/216162

很多事情都不是技术的问题，而是兼容性，

有时候甚至是political的问题，

网络上这种问题更多，比如HTTP就是一个极没有效率，

性能极低的协议，可是, 谁来改一改这个协议看看？

复不知道是不是可以这样说：C/C++编译好的程序就是CPU执行的具体指令了。

家园

二进制代码不能变化似乎也不是绝对的吧

最初的编译器产生的code是直接映射到内层物理地址的，然后

有了动态连接，动态库等技术

现在你说的这个one to many的关系必然也是有限的，

编译器不能事先作出多个翻译方式，在运行期间作出

优化选择?

复二进制代码不能变化似乎也不是绝对的吧

家园

如果你有多个可执行代码，那么CPU Load哪一个呢？

.NET/Java的在一个时候只会有一个机器代码让CPU执行。而这个机器代码在一段时间后可能会不一样了。这就是“动态”。就像我们所说的“兵无常形，水无常势”一样。

C/C++一旦编译完成，就是“done deal”了。你Source code都没有了，你怎么再优化，再重新编译出更好的机器代码。

现在CPU倒是在不停的努力，试图作一些预测和out-of-order的执行。这些CPU的新能力又会反过来影响compiler的发展。

复很高兴老兵终于同意我的观点了

家园

HTTP怎么效率低下了，有空的时候还请再开个专题讨论！

复不知道是不是可以这样说：C/C++编译好的程序就是CPU执行的具体指令了。

家园

一。目前标准的C/C++程序编译以后所得到的可执行文件只是一个二进制执行映像，而不存在媒体信息，因此是不可能自行改动代码运行顺序或者优化的。但是记忆中确实存在过解释型的C/C++环境（它有提示符OK，从图片上来看很像是古典的Basica），因此应该有对应的中间码表示和中间码到机器码的转换。

至于机器代码自修改，主要是通过汇编码来实现，除了病毒这类变态应用以外，主要是用在极度节省内存的环境中。

二。对于JVM/CLR这类现代VM来说，中间码到机器码的转换过程的确存在一个学习时期，而且这个时期的确可以提高转换质量，从而提高VM的运行效率，甚至在局部做到理论上的最优化，从而超过静态编译优化器所能够做到的程度，但是在全局范围内的最优化将需要很长的运行时间，这样这项技术的适用范围将受到限制。

复如果你有多个可执行代码，那么CPU Load哪一个呢？

家园

比如说，可以有好几个image阿

CPU跑着跑着发现另外一个Image更好，就用新的image把目前这个覆盖掉。

或者，复杂的情况下，这种覆盖分成很多段来实行。

复 HTTP怎么效率低下了，有空的时候还请再开个专题讨论！

家园

有什么好处没有啊

复二进制代码不能变化似乎也不是绝对的吧

家园

一。阿康所说的多准备几个分叉是不现实的，因为执行路径树会迅速地膨胀从而导致可运行代码量的极度膨胀，这样稍大一些的程序会编译出大的不可想象的可执行文件来的，因此这个方案是行不通的。

二。动态编译的好处就是可以极端逼近理论上的最优化可执行代码，从而超过静态编译，因为后者缺乏运行经验，因此不可能得到理论上的最优化可执行代码。当然这个过程需要足够的时间和开销，因此比较适用于长时间运行的代码。

三。代码优化本身最好是在机器代码之上的某个合适层次来进行（机器代码级别太低了，很难做到比较大范围的优化），Java Byte Code/.Net IL正好提供了这个层次，这就是现代Meta Data对传统静态编译的优势所在。

本帖一共被 1 帖引用 (帖内工具实现)

【西西河电子期刊】第14期（下）

复比如说，可以有好几个image阿

家园

嘿嘿，你这问题越来越有意思了。

你的意思是程序一边执行，一边修改自己。我不敢说不可以，但现在没这样的情况。软件和硬件都没有这样的能力。

如果按照你的做法，今天我在执行Word的时候，发现某种特点（比如我是用中文写作）于是对程序进行了优化，甚至是像你说的“覆盖”。但第二天我写英文，这些特点不适用了，可是我改不回来了，应为原来的image已经被你昨天“覆盖”了。怎么办，哭鼻子？重新安装？

现在一个可行性程序一旦编译成代码发行，他就是他了。你什么时候见微软的DLL，EXE自己在“变”。你想变都不成，那代码是受法律保护的。

你开篇，我加精，怎么样？

估计阿康没学过编译理论，今天尽创新了

复回复

家园

Bingo!

That's what I am talking about!

好费劲啊！

点看全图

外链图片需谨慎，可能会被源头改

全看树展主题 · 分页首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明