主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学
单独考虑语音。英文发音决策树解决的是,从抽象字母到音素的对应。中文发音决策树解决的是,从抽象字符到音素+声调的对应。中文多2比特,也就是用两个yes or no的question解决四声的问题,但是表达同样的信息中文使用的汉字会少于英文使用的字母。所以很可能就是对消。
所以全域的cost可以表示为:
写英文的cost=x * (4.03 + n + E)
写中文的cost=y * (9.65 + m + C + 2)
假设:
1.英文字母的符号信息熵为n,汉字的符号信息熵为m。
2.英文的音素信息熵为E,中文的音素信息熵为C。
3.书写一段同样的信息,英文需要x个字母,中文需要y个汉字。
-----------------------------------------------------------
这还只是决策过程的cost。训练和调用决策树本身同样需要巨大的cost。决策树的尺寸越大,建立,维护,和调用决策树的cost就越大。4.03和9.65这两个文字熵,量化了英语思维者和中文思维者,不同决策树的尺寸。
1. 语言决策树越小,就越容易训练。所以,英语民族的人读写比中国人早,心智成熟的比中国人早,小时候有更多的时间玩。
2. 语言决策树越小,能耗越低。语言决策树过大,必然挤占逻辑思维的能量,挤占逻辑决策树的空间。使用大型语言决策树的人,只有把语速放慢才能保证准确的逻辑思维。温总理的大脑一定在反复调用语言决策树和逻辑决策树,而且总理两个决策树都极其庞大,所以才会说的那么慢。
3,语言决策树越小,表达越精确。语言决策树越庞大,决策过程越容易出错,造成词不达意,甚至影响后续的逻辑思维。(纠错的cost也要考虑,不过那是另外一个topic了。)
- 相关回复 上下关系8
压缩 14 层
🙂写中文的cost为什么还要加拼音一项? PBS 字20 2015-02-07 18:02:42
🙂您问的很有道理 墨虎 字140 2015-02-07 21:26:05
🙂人类口腔发音基本就是这么几百种 PBS 字128 2015-02-07 21:42:42
🙂如果只考虑文字,应该可以省略这一项
🙂这个讨论变得越来越有意思了 2 PBS 字1862 2015-02-12 01:48:26
🙂临时数据 1 墨虎 字1955 2015-02-20 13:21:57
🙂试图用信息论的概念讨论一下 1 PBS 字781 2015-02-20 21:07:38
🙂说这么多干嘛,实际上两个字母就够了 假设 字114 2015-02-23 07:59:22