主题:【原创】汉语和英语的比较 -- 颜赤城
共:💬368 🌺1318 🌵2
如果ASCII码按部首编,怎么会乱码呢?
汉字部首的位置形形色色位置不同,可能超过256个,ASCII码的数量可能不够了。
ASCII码长采用8比特,可以安排2^8=256个熵值在4比特左右的西文拼音字母(英语26个,俄语34个,)和其它数字标点符号。而中文单字的熵值是9.6比特,ASCII码的8比特就根本不够用了,只能采用16比特的编码了。
16个比特的中文码系统和8个比特的ASCII码系统在计算机运算性能上应该有差别吧?
汉字字符编码比拼音文字编码复杂就是因为汉字的熵值是9.6比特而拼音文字的熵值是4比特。
- 相关回复 上下关系8
🙂提一个话题,兄台考虑一下是不是写点什么 1 猫元帅 字214 2007-05-28 09:23:02
🙂错误的预期 32 颜赤城 字1588 2007-05-26 15:35:49
🙂汉语的文法研究都是沿习英文的文法习惯 8 一里 字402 2007-05-28 16:00:08
🙂简单地回答一下
🙂英文的编码量是汉字编码量的n倍(n>1) 6 黑传说 字585 2012-10-01 06:41:14
🙂花! 桥上 字10 2012-10-01 09:13:14
🙂花!请教,您说的这个熵值是什么意思,能给咱普及一下吗? 桥上 字0 2012-09-27 09:04:52
🙂这个熵是信息熵 7 PBS 字2146 2012-09-27 22:58:04