西西河

主题:【原创】官话诗词 -- jent

共:💬33 🌺171 新:
全看分页树展 · 主题 跟帖
家园 一个中等规模的统计,关于同音字

一个中等规模的统计,关于同音字

2021-04-05

对于我们的汉语,大家都知道,字,比音多。就是说,有很多的同音字。

那么,究竟有多少呢,这些同音字又从何而来?有人说,这有何难,翻一番新华字典不就知道了么?是的,有些东西,光翻新华字典,是不能知道的,比如,下面我要说的。

在跟着女儿学习了71首古诗词,一千多个汉字之后,算是有了一个中等规模的结论。之所以说是中等规模,是因为常用汉字约2500左右。一千余汉字,分布在从先秦到共和国时代的历朝历代古诗词中,而且几乎有一半是在现今中国大陆的小学课本里的必学必背古诗词,剩下一半也都是大家耳熟能祥的,比如“明月几时有,把酒问青天”,或者“所谓伊人,在水一方”之类的名篇,这样的一千余汉字,应该算得上有一定的代表性,算得上中等规模的数据,在其上所得出的结论,应该可以算得上中等规模的结论了。

当然,不排除未来更多的汉字学习加入到这个统计,并导致一些结论的改变,但是我相信,大致的结论是不会有什么误差的。

OK,言归正传。

目前已经收录在女儿的汉语学习资料库里的1096个汉字,在国语/普通话拼音读音体系下,同音字最多的一个音(不管其声调),是“yi”这个音,目前总共有24个字:

“已右以异夷衣依意伊倚羿遗疑忆憶亿億亦易一乙佚溢浥”

。而第二多的,是“qi”这个音,目前总共有20个字:

“弃绮骑企气岂起其棋期旗岐歧祇齐妻萋凄泣七”

。第三多的,是“shi”这个音,目前有19个字:

“氏世时市师使始诗事是势石识轼饰蚀失十湿”

。。。接下来,是“ji”这个音,17个字,“yu”这个音,17个字,“zhi”这个音,15字,“wei”这个音,14字,“jie”这个音,14字,“wu”这个音,13字,“jian”这个音,12字,“jing”这个音,12字,“fu”这个音,11字,“xi”这个音,11字。。。

这么粗略一看,至少有13个读音,是各自超过了10个字的,这还不是完全统计(1000余常用汉字)。

有人问,超过就超过呗,有什么了不起的?

不,说一个大家都知道的事情:汉语拼音输入法,超过10个字的音,是否总是需要翻页翻来覆去查找所需要的字?如果要加上汉字智能排序,是否翻来覆去查找一个汉字更为不方便?

嗯,同样的这一批汉字,在官话语音体系中,分布是这样的:

同音字最多的音,是“yu”这个音15个字,接下来,是与“弃”同音的,有14个字,与“为”同音的,14字,与“以”同音的,13个字,接下来就是“zhi”12字,“wu”12字,“shi”11字,嗯,目前看就这7个音各自超过了10个字。

至于为什么,那就是很多人都知道的两个原因:1,尖团合流,比如在普通话里读“qi”这个音的20个字,里边就包含了官话里与“弃”同音的14个字,与“齐”同音的4个字,这18个普通话同音的汉字,分尖团的话,就分别为两组不同音的字了。2,入声排入:普通话/国语语音体系里边是没有入声的。而目前女儿所学到的20个读作“qi”的汉字里,有两个官话发音体系里的入声音:“泣”,“七“。同样的例子在普通话“yi”这个音里边的24个汉字里,只有13个在官话体系里边读作“yi”,剩下的,全部11个都是入声音,ktp结尾的分别是6个,4个,和1个。

另外两个不那么为人所知的原因,一个是官话体系里边的闭口韵归入到普通话体系里的前鼻韵,比如“剑”这个字,在官话体系里边既是舌后团音,又是闭口韵,用拉丁字母表示应该读作“giiam”这个音,但在尖团合流,以及闭口韵归前鼻韵的普通话/国语体系里,就读做“jian”这个音,和“箭”(官话里读作“ziian”)这个字同音同调了。另外一个小原因则更不大为人所注意,那就是在普通话/国语体系里,元音颚化之后所造成的,这里不再多说。

嗯,民间科学爱好者的小研究。喜欢的话点个赞吧。

通宝推:尚儒,80后30,审度,桥上,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河