主题:中国文明只有63岁——《大目标》后记 修正技术错误 -- 马前卒
现代信息论的创始人、美国数学家商农(Claude Elwood Shannon)曾经提出了“ 商农信道编码定理” 。这个定理指出, 在一个非扩展的无记忆信源中, 用二进制代码表示的码字的长度不能小于信源的嫡。汉字的摘值大, 其相应的二进制码字的平均长度也就很大, 即使是一个最优的信道编码系统, 其二进制码字的平均长度至少也应与汉字的嫡值相等, 这就必然要影响到通讯的效率。从这个意义上说, 汉字的嫡值大对于信道编码是不利的。
汉字的熵值是9.65比特,恰恰超过ASCII码的8比特值,所以必须采用16比特码--现实中,汉字编码采用2个字节,每个字符的确占用16比特。
在中文信息处理中, 汉字的嫡值大, 也给它在计算机上的输出和输入带来很大的困难。尽管现在汉字在计算机输出和输入已经不成问题, 但汉字输出输入的效率比之于拼音字母的输出输入效率要差得多。中文信息处理不仅仅只是进行汉字的输出和输入, 还要开发人机对话、机器翻译、中文自然语言理解等高技术的智能系统, 这些工作必须编写大量的程序。如果用汉字来编写计算机程序, 而不用拉丁字母来编写程序, 这样的程序的运行效率肯定是不会很高的。从这个意义上说, 汉字的嫡值大对于中文信息处理也是不利的。
上面的回答是不是解释了你的汉字通信的信道和信源问题?
对于人类的大脑这个在发育时期体积和性能不停扩增的CPU来讲,被高熵值编程语言占领过的运算区域而造成的格式化和模式化,可能永久地影响了这些区域在未来的发挥创造性和逻辑性的功能--我实在希望这些影响将是积极的。
- 相关回复 上下关系8
压缩 11 层
🙂“汉字的熵值是9.6比特,英语字的熵值是4.0比特”? 7 发了胖的罗密欧 字653 2012-09-27 05:10:52
🙂汉字单字是最小语素单位,熵值的确是9.6比特 PBS 字1540 2012-09-27 21:55:07
🙂兄台究竟读没读过信息论?信源编码和信道编码是这样理解吗? jent 字6 2012-09-27 03:26:41
🙂还是读过一些的
🙂你对信源编码和信道编码在汉字上的理解是有问题的。 jent 字50 2012-09-28 04:18:20
🙂看不大懂。 bxbird 字67 2012-09-27 02:36:23
🙂我只能说:你真能扯 摇曳凡尘 字52 2012-09-27 00:12:34
🙂你说的扯是指9.6和4.0的差别? PBS 字167 2012-09-27 00:20:50