西西河

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
分页树展主题 · 全看首页 上页
/ 102
下页 末页
    • 家园 文化有高低,语言没什么高低

      其实汉语优越鼓吹者说来说去无非就是汉语精简。

      那又怎么样呢?

      文言文更精简,你把上面文章用文言写写看呀。

      所以实在不明白有什么逻辑关系

      • 家园 你是文科生吧?中文编码效率,容错率,构词能力,易学性都好

        楼主和后面的讨论从信息论角度充分论证了中文的优越。

        语言是编码工具,这时候编码效率,容错率是硬指标,就好像CDMA比GSM好一样刚刚的;

        语言又是思维工具,是知识的传播工具。大家又在抽象能力, 新词构造能力,新词暗示能力(易学性)等方面论证了中文的优越性。

        综上所述,中文具有无可辩驳的优越性。至于古文,失之太简,编码效率高,但容错率,易学性等太差。现代汉语正是修补了这些问题而发展起来的。

        关键词(Tags): #汉语#编码效率#构词力通宝推:羊年大发,
        • 家园 汉语还有一个很大的优势就在于:很容易引进别的字母语言

          但反之,字母语言很难引入汉语。

          字母语言在一些局部的地方也有优点,比如希腊或者英文字母在表达数学的时候,但这些优势很容易被汉语引进。其实,我们现在就可以认为汉语已经完全引入这些英文和希腊字母,只不过我们不这样提而已。

          同时,至少我不能想象字母语言如何系统引入汉语。他们可能可以引进一两个汉语的词,但这一定是支离破碎的,而不能系统化。

          通宝推:支持中文,
    • 家园 如果把部首看成字母的话,你得到了汉语是二维的英语这个结论

      然后你所有的结论,都没意义了

    • 家园 关于中文的纠错能力,一点小想法

      语言是用来交流的。语言在交流的过程中可以存在以下过程。

      1.录入过程,就是人们把心中的文字变成纸张上或屏幕上的文字的过程。

      2.传递过程,指的是,从录入方录入完成,到读取方开始读取,之间的过程。

      3.读取过程,可以分成两个子过程。

      一是把纸张上或屏幕上的文字,还原成心中的文字。

      二是把心中的文字,最终复原成语音。(这个子过程不一定会发生。)

      下面谈纠错:

      1.首先看录入过程。对于一种语言,语音是一个encoder,文字是另一个encoder。中文的语音和文字是脱节的,所以只能依靠文字的encoder进行纠错。拼音文字的语音和文字相互关联,所以可以实现两个encoder相互纠错。所以拼音文字在录入过程中的纠错能力比中文强。

      2. 然后看媒体传递阶段。纠错靠冗余。同样的内容,中文英文各搞一份,然后做压缩。中文文件在大多数情况下size小于英文文件,说明汉语的冗余小。中文的冗余小所以潜在的纠错能力把英文弱。

      3. 最后看看读取过程。

      先是把纸张上或屏幕上的文字,还原成心中的文字这个子过程。这里,无论英语还是中文都要靠上下文。但是,中文不使用空格断词,所以同样是词(word)级别的错误,中文有机会让它升级到上下文的层次。这样对于中文,通过上下文纠错就变得不那么可靠了。

      最后是复员语音。由于中文的文字与语音分离,朗读的人无法通过文字提示读音,读了错别字,自己是无法意识到的,自然也就无法进行纠错。

      • 家园 拜托您在提出这些理论的时候先做个思想实验,不要想当然

        语音与文字,极少见到同时使用两者的。要么就是用语音交流要么就是用文字交流。敢问两者都不同时使用,怎么两者的编码还能同步互相纠错?拼音文字哪里来的纠错能力比汉语强。案例在哪里?你能不能在英文里找出一个这种交叉纠错的案例,然后再搜索一下中文对话,看看是不是真的找不到类似的案例。

        冗余度的大小与纠错能力没有必然联系。你把一句话重复说30遍,冗余度很大,抗噪能力不错,但纠错能力有多大?其次,过大的冗余度影响交流效率。

        词级别的错误到底有多少?升级到上下文的概率有多大?升级到上下文所以必然影响纠错?就算这些都有,那英文的多义词对上下文造成的理解偏差又该作何论处?

        朗读的人读错了又怎么样?这么说吧,这年头还有多少机会能碰到“你需要从别人的朗读中得到必要信息”、“对方读了个白字”、“而你就无法理解了”这三个要素同时出现的情况。你能不能给我讲讲你近20年以来碰到的这种案例。话说我不记得近20年以来我碰到过这种情况。

        • 家园 反腐成败关键在于给人民更多的民主权和 jian du 权

          毛新宇不拘一格,在依靠单一汉字编码器失败以后,直接切换到语音编码器+拼音编码器的模式,利用两种同步交织的编码器最终成功的输出了内容。他有一颗自由的心,不愧"新宇"这个名字。

          再说个记单词的例子。作为语言,中文需要记忆的是字,英文需要记忆的word。无论中外,大家都是,能记多少就记多少。一般中文使用者,能记住3000个汉字,而一般的英文使用者可以记忆10000 - 20000 words,为什么?不是因为外国人聪明,而是因为拼音文字可以实现语音与文字同步互相纠错,降噪的同时也就提高了记忆力。

          说起来,汉语思维害死人,很多国人(包括我)本着“语音与文字,极少见到同时使用两者的。”的汉语思维,象记汉字一样死记了多年英文单词,收效甚微,比起毛少将,真是蠢死了。

          • 家园 送花成功。感谢:作者获得通宝一枚。

            一般中文使用者,能记住3000个汉字,而一般的英文使用者可以记忆10000 - 20000 words,为什么?不是因为外国人聪明,而是因为拼音文字可以实现语音与文字同步互相纠错,降噪的同时也就提高了记忆力。

            熵值低的语言抗噪能力强,就能记忆更多的有效词汇信息。一般美英高中生可以记忆50000个单词,而丘吉尔的词汇量达到90000左右。

            中国人的大脑一点也不比外国人差,也就是操作硬件一样,那么操作语言的差别就是决定性的。

            两个软件公司的同类型产品,在同一台计算机上运行必然有优劣差别,象形文字同拼音文字的差别就是这两个软件公司的产品的差别。

            老铁的西西河平台比其它中文论坛平台比较有优势。同样一台计算机,使用下来的感觉就是如此。

            • 家园 什么叫记得多所以熵值低抗噪强啊?

              你怎么就理解不出信息含量高,表达力强,根本用不着记那么多呢?

              一种明明只有26个字母,却不依靠语序、逻辑来适应进化的语言,单词已经扩充到25万个之多,被你鼓吹成发展方向,真有意思。

            • 家园 看来您是坚定的二进制语言支持者

              还在纠结那个9.65比特吧,既然您这么推崇这个数据,干脆您直接用二进制得了,秒杀现有一切自然语言。咱要求不高,不要求您记个几十万单词,就按您说的90000好了。用这么先进的二进制语言才记这么点单词,您真是占了大便宜了。怎么样?有胆子试试吗?

            • 家园 5W?9W?

              丘吉尔的词汇9W典出何处?欧美一个成年人的词汇量在2-3W应该是可信的,5W的高中生不敢说没有,但是我高中还记得住各种常数呢。。。演讲大家、文学家的词汇量肯定更大 但是丘吉尔他老人家似乎6W左右的词汇量还是比较靠谱的数据吧

              你们说的其实都在理 我也不想搅进这场文字表达效率之争 但是汉字和英文的words本身就不是对应关系的 这个已经反复强调过了 为啥还要拖出来讲。。。如果一定要比 拜托请计算下中文有多少个词汇而不是多少个汉字。。。

          • 家园 学英语靠“博闻强记”的确是吃力不讨好

            话说大街上随便一个高中生都比你词汇量大,这边还是考GRE的,按说学这么多年英语而且研究生毕业的老中智力记忆力应该都强一筹才是,事实却相反,想想我们小时候的英语学习,确实不得法。

分页树展主题 · 全看首页 上页
/ 102
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河