西西河

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
分页树展主题 · 全看首页 上页
/ 102
下页 末页
          • 家园 说了我一些我类似的看法,量词的存在是中国形象思维正反馈

            的结果,也是原因。

            几年前一次乘车,路过一片水域,迷糊中转眼看见一片叶子漂在水上,想这叶子似乎大了点,就马上转回头,才看到原来是一条小舟停在静静的水面上。于是,马上想到一个名词,带量词的名词——“一叶扁舟”。量词就是叶,中国的量词还是很有意思的!之前自然知道这个,但没那么深的体会!

            所以我想,除了形象思维,中国的文字因为古代文学的原故,很强调意境,也这是促进中国量词很丰富的原因之一吧!

          • 家园 条,支,杆,根当量词用是副业, 本身也是名词,形容词。

            中文里的量词其实是不固定形态的组合词。条鱼,根棍,没有数量前缀的话,本身并不比鱼,棍包含更多内容,没有意思。一匹鱼,一粒棍就是和毛茸茸的月亮一样,属于乱用形容词了。

        • 家园 看来您很忙

          发表主帖上中下,在河里您就是专家了,这个答的有点草率吧。

          事物存在就有其存在的理由,不然就要消失。

          不少小品有拿老外用错汉语量词的段子来逗乐的,有空了再接再砺分析考据一下,说不定就解决了孔子学院广大教师们的大难题呢。

          • 家园 何必作嘲讽状,其所谓没有必要并不是没道理的吧

            存在的理由也可能是还没来得及消失或演化成另一个样子。

            不管怎么样,主贴写出了俺很久以来就想表达的东西,个人觉得这篇文章是当下所急需的,只恨学识有限,不能成篇。

            写出一篇好贴子,并且能在随后跟进补充,即或随意,也是好事,不宜苛求了吧?

            • 家园 有时间就给点建设性意见

              不要揣测别人的意思,尤其是往恶意的方向想带来负面的后果,成熟的人会欢迎大家提问来完善自己的作品,以前大家就乐于帮萨苏的文章挑虫子。我本没有炒粉,你冒出这么一句不管主观上多么善意,但客观上起到了撺掇群众斗群众的效果,最好del吧。

              • 家园 没有就好哈,误解善意,幸勿见怪,都不必删了,就放着吧。

                也请理解我这可不是挑动矛盾,而主动站边作斗争状了呵呵,或许多余,但也算立场鲜明了吧。之所以如此,只为这主题实在值得珍惜。

                祝好

    • 家园 中文的问题还是概念模糊

      首先,是采样失真。一个新的概念被发现,需要用词汇加以定义。这个定义的过程是对客观世界采样的过程,也是下面逻辑思维的基础。

      在数字移动通信领域,工程师针对话务设计了Speech codec。这种Speech codec不同于一般的audio codec。它是在统计的基础上,针对人类语音设计的。它的编码效率高,可以用有限的数据流量把人类话音传递的惟妙惟肖。Speech codec也可以用于encode and decode音乐,但是质量很差。因为Voice codec不是设计用来传递任何audio的,它是单单用来分析和过滤人类语音信号的。

      外链出处

      中文在设计思想上与speech codec非常相似。汉语的codec就是这上万个汉字,其中包含了农耕时代以及农耕时代以前,中国人通过实践和幻想所建立的全部概念。但问题是:

      1.汉字不能无限创造。事实上,我们也没有大量创造汉字。

      链接出处

      链接出处

      2.人类的大脑无力接受太多的汉字。一般人,5000字就是极限了。

      所以当中国人面对各种新知识,新概念爆炸的时代,不得不用一套针对过去时代设计的codec采样。汉语一方面编码效率高,另一方面存在采样失真的问题,就好象用手机听音乐一样。当然,在日常这根本不是问题,但是对那些需要挑战智力巅峰的聪明人就是一种制约。

      具体来说,当一个新的概念形成以后,我们会组个词来定义这个概念。

      对于英语,这是个精确定义的过程。在今后的使用中不存在模糊的空间。如果不知道词义只能查字典。

      对于汉语,存在两种可能:

      1.不精确定义。组个词就当是定义了。汉语的词一般不长,很难做到精确定义。按照PBS的说法就是“取样步长过大,造成细微细节缺失”。

      2.精确定义。但是每个汉字都是表意的,所以每个新的词语都存在两个含义:一个是字典上的精确定义,一个是字面含义。两个含义同时存在就是模糊,就是不精确。现实中,我们必然望文生义,因为表意文字的内核就是望文生义。

      所以汉语的不精确在采样阶段就已经产生了。最终的出路只能是大量引入外来语,就是楼下陈经说的。其实从现实来看,中华文明目前在地球的地位就是“次生文明”,所以直接用原生文明的发音来指代是“最简单的方法”。过去我们这样做过,汉语中大量的现代词汇都是日语。

      其次,中文是一种非常消耗脑力资源的语言。

      1.楼主指出了,中文是“压缩存储”。压缩存储是要额外消耗CPU的。

      2.中文是前置为主。前置需要表达者一次性组织整个句子,占用宝贵的内存资源。

      3.中文组词容易,所以词汇泛滥。同样的程度的人,“中国人的词汇量比美国人大得多”。检索这么多的词,必然要额外占用CPU和内存。这个cost有时甚至超出临时组词的cost,所以中文表达者经常临机造词。

      这些消耗不是没有代价的。逻辑思维同样需要资源。资源不够,聂卫平会走臭棋,诸葛亮会变成臭皮匠。如果不信,你用one,two,three代替1,2,3,看看同样的高考数学卷子是不是还能满分?


      本帖一共被 5 帖 引用 (帖内工具实现)
      • 家园 感觉你提出的另一个重要概念是

        口语与书面语言其实是有着不同的目的性的,因此这个同音字多义字的问题在不同语言中的应用,还需要受其使用中的目的性考验。

        简单说,口头语一般抽象概念比较少,或者说使用的抽象词汇比较少,使用的也与书面字的存在为前提,因此口头语的主要问题-同音字,在大量的用语为直观的概念前提下产生的影响不大。

        而书面语言,其实同音的问题反而不重要,遇到没有见过的生词,读不出来从本质上并不影响对含义的理解,这时候中文有望文生义的可能性,英文有拉丁拼音的可能性,但是中文可能按笔画去猜却不会读音,把罂粟读成姚莉的比如就不少,但可能不影响理解;而英文也可能闹类似笑话,但是按字母读出个八九不离十的音,如果这个词不认识,靠猜是很难的,尤其专业词汇,只有翻字典一条道。但是英文中的多义词在这种情况下,仍然是于事无补的,因此两个不同的含义可能风马牛不相及,还是只有翻字典。

        那么如果是比较正式的口语场合,比如新闻联播,这时候书面语的一些要求就会出现,如果一个词汇没有在书面语中学过,这时候从口语中听到仍然是无法理解的,甚至望文生义的问题在口语中也会出现。大家都从小经历过对不了解的成语发生误解的笑话,或者在大脑产生混乱印象,情急之下出现,迅雷不及掩耳盗铃这样的组词现象。那么在这样的情况下,听者如何抗噪呢?

        • 家园 关于语言, 晓兵提过一个非常有意思的概念

          就是语言的维护性。感觉这里有很多问题值得探讨:

          1.对于一种语言,什么是必须要维护的?

          2.一种语言在多大程度上可以实现自我维护?

          3.怎样维护?维护本身的负担有多重?

          4.谁来维护?(一个政治问题

          5.具体到英语和汉语呢?

          各位河友,如果有兴趣,可以说说看法。应该满有意思的。

          • 家园 money talks loud

            1. 农村基层组织的变化 [ 领域时空 ]

            "农村基层组织虽然没有完全瘫痪,但是其性质已经在慢慢改变。改变的快慢与利益的量有关,如果我村有拆迁补偿之类的巨额利益存在,性质估计就不像现在这么简单。邻村举报的那个,因为有村工厂和大型土地出让,因此性质就严重许多。而基层组织现在还处于恶化阶段,一时看不到好转的迹象和出路"

            城镇化=tgs strategic 预备队, I wrote about this before about 2 years ago; it is a big deal and not an easy one, more difficult now than then.

            how tg figure that(城镇化) out, now with manufacturing and export sector topped out?

            2. has tg topped out economically, particularly in terms of its "北京共识" model, as a challenge to 欧美社会公理?

            3. topped out=still ok

            if nothing else, tg 子弟兵当家, even 張德江 was "discovered" by 鄧穎超, when she visited 張's college where and when 張 was number 2 boss, and number 1 boss was not there that day, and 張 hosted 鄧, and 鄧 was very happy and appreciated 張, from there on, 張 started his political career,..

            as such and for all other reasons , tg has been number 1 super 3d human organization in human history

            4. even if tg has "topped out", the process could be N years, and some kind of good luck could still come to help out

            money talks, may not as loud as before, still very loud, and that is good enough for tg's sys admin folks

            ---------------

            語言高能輻射:out of "经典能譜" [ 晓兵 ]

            头像晓兵

            乐善4

            声望2366

            发短信 趋加追订 屏蔽

            1

            "语言实际上是把人的思想通过发音器官变成一串频率不同、波形不同的声波,然后有另一个个体的听觉器官和相关的脑部组织重新转变回思想。"

            very good points, but not 声波, not-conventional 通訊, not any "能量守恒" type of business of low profit margin, etc.

            语言 as conventional 通訊+语言 as conventional logic processing tool=经典能譜, actually no big deal, remember your post about

            "Moravec的悖论10 Fuhrer 字3601 2013-01-25 19:08:59",

            AI will take care of all of them, and there will be some differences between less 正交 语言 such as chinese and those more 正交语言 such as english, still no big deal

            2.

            where is the big deal?

            big deal=語言高能輻射 or qm 量子隧穿效应 in

            1)invoking an important and substantial delta/change in a large population's 思想意識, effectively and in a relative short time period, such as in a war/national/idealogical conflict type of serious situations, and large scale political/marketing campaign and those less serious situations, etc

            2) in long term "brain washing", "世界观" education, etc.

            語言 used to be used as a powerful weapon as such becasue it is often 披著"经典能譜"羊皮(可見光,聲音,文字, picture, etc) but often does

            a 狡猾的狼's "一本万利" kind of work, such as 高能輻射, 量子隧穿 people's brain and make them do the heavy lifting work, such as: love you 1314 as some kind of idol, fight a war, buy your stuff, elect you into an important political official post, etc;

          • 家园 从楼里的讨论看到的答案

            1.显然对于一种语言,必须要维护的是其文字。铁手楼下的帖子比较全面的说明这个问题,同时对许多人在文字上的争论,也说明了文字本身是语言的生命线。没有了文字的语言,比如作为一种方言,消失很可能是几代人之间的事。

            2. 语言的生命力在于引入新字(或词,有人对这个定义很注意)或者造字的能力。汉语的组词能力强是一大优势,相对来说英语的造新词能力也不差,或者说旧词新用(多义词大概都是这样产生的),这个在汉语中也常见,比如港台对大陆“同志”一词的不同使用,“老公”的发明并在大陆流行等都是语言维护的自发现象。因此,我对语言的维护主要从新词的出现,或者说语言的新陈代谢这个角度去观察。

            3. 负担如果你的意思不又是从计算机编码角度讲的话,可以从观察一种语言的新词出现率与造词的难易度来衡量。我个人的看法是,汉语的白话文是对古典文字的一个革命性变革,就是因为从此组词创造新词而对更新语言的能力提高了许多,发展到今天甚至可以说文字中大部分含义与使用方法都出现了不同,几乎可以说与古文是两种不同的文字了。而莎士比亚时代的英文放在今天却并不会让人有很大的难度去理解,这个变化中说明了中文在付出高昂代价(与古文的割裂)之后,极大的降低了维护的成本轻装前进了。

            4. 维护应该是民间自发的,而不应该是个政治问题,比如中文的白话文,汉语的简化字等,主要的动力仍然是民间的潮流。政府与字典出版商的作用只是过一段时间的更新以反映实际使用状况,不至于脱节。说到底,政治的作用远远抵不上文化潮流的人心向背,语言永远是追随着文化的步伐走,互联网的作用更是把口头语上的这个趋势进一步扩大到书面文字上,比如,如果中文键盘输入可能的话,中文造字的出现是分分钟的事(楼里有人专门说这个事),因此拼音文字在这方面现在具有天生的优越性。

            顺便看到今天的新闻说到27岁的美国新墨西哥大学学生Jeffrey Knockel解构了TOM-Skype中的代码,公开了中国用于审查的关键词黑名单,这些词汇或许会成为一些新词的来源,这样的维护虽然与政治有关,但是却是通过副作用而产生的。

            这个名单可以在这里看到:http://cs.unm.edu/~jeffk/tom-skype/

            http://cs.unm.edu/~jeffk/tom-skype/dlist-5.5s/LATEST.plain

            http://cs.unm.edu/~jeffk/tom-skype/dlist-4.0/plainfile

            警告,以上链接国内访客点击小心触动警报被请喝茶。

            • 家园 看史记要翻译吗?怎么就割裂了?

              孙子论语之类的书籍,不用翻译也能看个大概吧。

            • 家园 拜托不要想当然了。

              没有文字的语言在中国存活了几千年。很多少数民族的语言都是在建国后才给他们配套发明文字的。

              英语组词能力就那么回事了。因为音节的问题而不得不重复使用大量的单/双音节词,造成大量的多义词。以至于隔行如隔山,单独拿一个词出来都不知道这是哪一行的、表示什么意思。汉语首先采用多音调,使得音节变短,可以比较容易地采用多音节词来更清晰地表述。而且汉语还用读音与文字脱离,从而构造了大量同音词来彻底解决这个问题。

              各个主要语言在发展过程中都经历过巨大的变革。汉语说白了,只有一次,就是在近代,而那也不过就是把严格书面语和口头语统一起来而已。事实上如果看看雍正批的奏折,就会发现,那时候非严格的书面语和今天的书写并无明显差异。而英语嘛。你想看看中世纪英语些什么样子吗?你不妨读读下面这一段:

              Jone, e wyf of Chuse, procuratour of Eroude, and Susanne, and manye oere, whiche mynystriden to him of her riches.

              你觉得这段好懂么?确认你都懂了么?来,这里是现代英语(Luke 8:3)

              Joanna the wife of Chuza, the manager of Herod’s household; Susanna; and many others. These women were helping to support them out of their own means.

              上面那段离莎士比亚还不到两百年(出版于1384年)。还真以为英语万世一系啊?未免太妄自菲薄了。再看下面这一段

              “秋,七月,钟羌良封等复寇陇西、汉阳。诏拜前校尉马贤为谒者,镇抚诸种。冬,十月,护羌校尉马续遣兵击良封,破之。”

              成书于1064年。

              ——————————————————————————————

              汉语早就过了需要大规模造字的时代了。事实上汉语的使用的字的数量在过去几百年里反而开始萎缩。不说康熙大字典,就说新华字典里,都有很多已经不用的字。

              造字根本不是汉语的问题。Unicode里汉字有两万多个(简繁都有)。简体字与繁体字不同的,总共只有两千多。所以实际上汉字资源现在至少有一万八千以上。常用汉字才三四千。大量罕见汉字都可以重新定义使用。比方说“缲”现在几乎不用了。未来需要形容某种特别的纺织品,完全可以用这个字。汉语字库中蕴含了大量现在根本不用的汉字。连已有的汉字都用不完,还用担心能不能造字的问题么?

              所以民众可以自发拿出一个不用的汉字重新定义使用,这是现在就在发生的事情。比如“囧”,比如“兲”,比如“嬲”。你想当然地以为不能造字所以汉字就无法发展,完全是杞人忧天。未来甚至可以把简化字与对应的繁体字分离开来,比如“進”完全可以重新定义。

              通宝推:羊年大发,天煞穆珏,南山南,大红罗卜,
              • 家园 你这里的例子反而与你的结论相反

                看这里的古英语与现代英语比较,变化主要集中在词汇的拼法上,这样的“变革”与中文古文与现代文的句法变化比起来,哪个大?你不妨把你那段古文用现代文重写一遍,尽量靠拢古文的断句,看看现代中国人是不是这样说话。而古英语的变化显然是拼音文字音节辅音结构的普遍变化(而不是某个词),这在多种拼音文字中互相融合的过程中是个常见现象,但在使用上现在的英文影视的“古装剧”仍然可以使用莎士比亚式的英文,一般英语教育的人群并不会觉的不便。反观中文的“古装剧”,可见有谁还在那里“秋,七月,钟羌良封等复寇陇西。。”的之乎者也?

                汉语早过了大规模造字的时代?我们看到的是从五四起到现在汉语的大规模造字运动。所谓想当然的使用汉字中不再使用的字,事实上没有引起没有什么兴趣,枉有庞大的字库,却出现了大量的组词,新词,为什么呢?你这里的几个例子比如“囧”,比如“兲”,比如“嬲”,是个别的,比起组词形成的新词是绝对少数,白话文以后的中国人,至少在北方语言区,与古文就是差不多两种语言。中国教育虽然还有古文课程,但是看看影视作品,就知道古文的通晓程度,更不用提严格的法律文件,诗歌作品了。说个笑话,现在的80后90后,可以问问有多少人是通过读原文而不是看连环画来了解三国,西游记的,估计在你这个帖子里送花的人中都不是多数。

                中国字在近代的使用数量萎缩,改变为造词形成词组的发展过程,与英文中艰涩难记的词不如短语常用的发展过程是一致的。这里面的原因是人的记忆过程在起作用,虽然在效率上有损失,但是显然词组与短语在记忆上更容易有关,在中文使用上更有避免同音字的好处。

                英语中许多音节相近的词但是靠音长短辅音来区别,不代表难以区分,只是对于中国人来说是个很大困难,但同样的音调对于西方人也是很大困难,以此两点来论述中文与英文的长短完全没有借鉴意义。相反,同音字才是中文的重大缺陷,如果不考虑同音字的话,使用四个辅音来起中文四声的作用,中文中所有的字都可以用英文或任何一个拼音文字来代替,至于音节长短,存在音调就自然要求音节有一定长度,至少不比加了辅音之后的总长度更短。之所以感觉英文语句比中文长的原因是语法与语言特点本身决定的,比如:

                I have nothing. I don't have it/anything

                中文往往一句“我没有”就够了,但中文严重依赖上下文,这里的“我没有”单独听不知道是指我没有某个东西,还是我没有吃饭,还是什么。所以有时还要说“我什么都没有”,或“我没有干过”。因此因为中文允许很灵活的使用而作为信息效率的优势,就不客观了。

                现在的语言维护许多都是通过互联网在进行的,看看春晚的小品相声中借用了多少网上用语就知道了。这里面有多少是在造字,又有多少是通过组新词,是不需要争论的。至于专业领域的新词,英文中的情况中文中也有,什么熵了,耦合了,不知道的谁会去了解这些词。

                从语言的角度,中文与英文一样都是生气勃勃的在发展,不断的有新词,新的含义产生出来,但是从文字角度讲,中文的一大劣势是由于键盘,没有人否认中文的输入效率低于英文,因此中文的一大发展趋势是压缩词,即把多个音节压缩为单音节,另一个是更极端的简化字,总之目的都是为了提高输入效率。因此,那种古文重用,繁体字上网的想法完全是书生之见,根本没有生存的基础。英文中也有所谓的网上用语,比如lol等,但是不同的是,这些词对大部分网上英文媒体没有什么冲击,而中文的网上造字造词则对中文主体有大得多的影响,大有成为中文主流的趋势。这里的关键因素是中文在网上媒体的效率问题有着比英文大的多的劣势。

                一个希望是未来的计算机语音输入的完善,使键盘成为摆设,那么中文输入的效率可能得到本质提高,但是随之而来的问题也存在,比如中文语音输入的难度因为同音字的原因,可能就比较大,比如现在我使用拼音输入法,都不能做到准确的猜到多字词的组合,经常要找来找去,说明这个难度是不小的。进一步看,未来语义网与人工智能的语义理解上,中文高度的灵活性无疑也存在着比英文更大的难度,一句“我没有”,计算机至少要去猜三四个意思。

                因此,是不是中文应该抛弃图形文字拥抱拼音文字,我看不是需要争论的焦点。因为现在文字都是作为符号使用,如果西方人是通过语音来记忆并掌握语言的话,中国人多了个通过图形符号辅助对语言的掌握,也不一定是坏事,因为人的大脑对空间图形天生有着更强的操作能力,在语言层次就固化这部分的智力开发,也许是中国人的一个智力优势,这方面都没有结论。

                但是中文现在主要的问题不是人,而是电脑。这个世界的未来更多将进入虚拟世界,或者说人类文明的一大部分在未来是从虚拟世界中发展出来的,这个没有人有疑问。那么,作为人与人,或者人与机器在这个虚拟世界中沟通的工具,中文能不能得心应手,将成为未来文明的一个重要因素。

                • 家园

                  有一点不太认同的:

                  因为现在文字都是作为符号使用,如果西方人是通过语音来记忆并掌握语言的话,中国人多了个通过图形符号辅助对语言的掌握,也不一定是坏事,因为人的大脑对空间图形天生有着更强的操作能力,在语言层次就固化这部分的智力开发,也许是中国人的一个智力优势,这方面都没有结论。

                  我觉得语音和图形是两个独立的信道,两套独立的编码。

                  西方人和中国人一样,不仅通过语音来记忆并掌握语言,同时也通过图形帮助记忆和掌握语言。英语和中文的不同是,英语的这两条信道和两种编码可以实现相互纠错,中文的两条信道和两个编码不存在相互纠错的机制。结果是,智力平平的西方人可以记忆几万条单词(语音+图形),而聪明的中国人只能记忆几千个字(图形)。于是中国人必须把语言表意化,通过组词来扩充语言的容量。底层的活儿由顶层来干。代价是汉语的使用过程中脑力消耗沉重,可能影响到其它思维。

分页树展主题 · 全看首页 上页
/ 102
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河