西西河

主题:关于《字表》我也不得不说几句 -- 类反词典

共:💬38 🌺88
全看分页树展 · 主题 跟帖
家园 大多数统计是很快的

当年没有计算机,其统计难度可想而知,但老一辈专家做出来的东西现在仍然难有大的改动。可见当年的学术风气。而现在,象字频、词频这些东西,就是8小时也可以把所有的数据跑个几个来回了。但我们得到了什么?

其实,把这些数据严谨地统计一遍已经是很有意义的工作了。由于当年的条件限制,现在补充这些数据也是很有意义的。我倒是建议这些统计要做多、做好,从而排除很多人为因素。比如,为什么一级字表是3500字?为什么不是3721字?按理科是思维,优化的一级字表数是可以从统计数据计算出的,而不是人为指定的。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河