西西河

主题:转个有意思暴论:英语是自带半文盲debuff的种姓隔离圣体 -- 划水的鱼

  • 共: 💬 84 🌺 569 🌵 12
  • : 💬 2 🌺 1
这也太扯了

中英文的比较这些年有很多的共识:

1、中文的信息嫡明显更高一些,有数据支撑。

汉字的静态平均信息熵一般认为是 9.65 比特,如冯志伟通过大量实验得出此结果。孙帆和孙茂松基于《人民日报》的 11,978,549 字语料库,得到基于字符直接计算出的一阶熵、二阶熵与三阶熵分别是 9.62、7.15、6.65bit。

一般来说,英文字母的平均信息熵约为 4.03 比特。

若不考虑马尔科夫链因素,香农测算出英文的单位符号平均所承载的信息量约为 1.3bit。

2、对应的,同样的信息,中文材料只有英文的2/3或者一半那么多。

3、至于英文不断造新词之类造成精英与普通人的信息隔离,这个早就为人所诟病了。代码屎山名副其实。

4、中文初学确实难。但是中文到了1000个字量以后,难度就开始明显下降了。

5、有人号称AI逻辑会不自觉的使用中文语言进行逻辑分析,而对于机器来说,所有的语言都不过是一堆数字代码而已,所以它会自动选择最有效的途径来进行分析。这事听着感觉不太靠谱,但我不懂其原理,不做评价。

所以这篇文章所描述的,本身就是完全靠谱的事情。

通宝推:大道至简,潜望镜,


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河