主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学
从芝加哥去纽约有很多方式,可以步行,可以开车,可以做船,可以做飞机。究竟哪种方式好呢?我想这跟我们此行的目的有关。
如果以提高民族竞争力为目的,我认为好的文字在使用中,cost应该尽量低。
文字熵可以量化这个cost。
1. 中文文字信息熵9.65比特,英文文字信息熵4.03比特。假设我们用英文和中文传递同样的信息。用英文处理每个字母,大脑平均需要解决4个yes or no的question。用中文处理每个汉字,大脑平均需要解决9个以上的yes or no的question。
2. 1所计算的文字信息熵,只是抽象符号的信息熵。抽象符号和具体实际中使用的符号是不同的。比如在实际中我可以选择用“a”这个具体符号表示一个抽象的字母或汉字,也可以选择用“齉”这个具体符号表示,但是对脑力的挑战完全不同。西方人研究西方文字可以忽略这个问题,但是我们研究汉字就不能忽略这个问题了。我认为无论是“a”还是“齉”都可以缩减为一组像素,然后以计算文字信息熵的方法可以计算出每写一个字母或汉字需要几个yes or no的question。我不知道前人是否已经给这个东东起了名字,做了计算,我姑且叫他符号信息熵。我们假设写一个英文字母需要n比特的符合信息熵,写一个汉字需要m比特的符号信息熵。
假设书写一段同样的信息,英文需要x个字母,中文需要y个汉字,那么:
写英文的cost=x*n*4.03
写中文的cost=y*m*9.65 + 汉语拼音的cost
这里汉语拼音的cost的计算方法,同1,2.
- 相关回复 上下关系8
压缩 10 层
🙂想事情太单一 4 天涯睡客 字2074 2015-01-30 14:43:55
🙂表音语言可以做到的,表意语言都可以做到 1 墨虎 字1428 2015-01-31 13:07:26
🙂至此,可以另开一个帖子讨论语言和汉语汉字了 1 PBS 字312 2015-02-05 21:43:49
🙂客观标准
🙂既然信息量相同,x*n必然远大于y*m 1 假设 字256 2015-02-23 20:45:19
🙂信息熵的含义 1 墨虎 字567 2015-02-26 18:34:18
🙂是你没有理解信息熵的含义 1 假设 字385 2015-02-26 21:25:28
🙂你也信这个信息熵比较法? 1 假设 字34 2015-02-23 07:57:09