西西河

主题:孩子回国比较一下才明白大陆学生比海外华人的小孩平均差了十万八 -- forger

共:💬190 🌺992 🌵33
分页树展主题 · 全看首页 上页
/ 13
下页 末页
        • 家园 ai用你的鬼子语去

          这里是汉语主流论坛,滾

        • 家园 说到逆向种族主义,这就来了

          汉语是孤立语,单词没有形态变化,一个词根就只有一种表现形式,孤立地存在。我就是我,不为尧存,不为桀亡,不为单复数变化,不为主语是你我他变化,不为过去现在未来变化,如果需要变化,则加修饰词来限定。

          构词则从原始的身体感知出发,层层抽象,创造出几万个汉字,常用的仅仅1000多个,认识6000个汉字的已经击败99%的人。小学三年级阅读报纸没有任何障碍。以🐏为例,我们没有sheep, goat,lamp,只有羊为抽象,加各种修饰或组合。将来有无数种羊,只要加修饰即可。

          对于新的领域出现的名词,则可以根据其来历或特征,随便组合,例如激光, 射频。

          发音则是简单的韵母+声母的两部分组成,每个字清晰,一共才700多种发音,加上声调,将近3000种。汉语的发音是如此简单高效,极端符合高效编码原则。通俗地说,英语日语相当于调幅,中国则是调频,且是脉冲编码调频,抗噪声性能远超我所知道的各种语言。这个原理,其实老外也懂,由于单独一个英语字母的发音不太清晰易懂,传递邮件地址这种信息的时候人们往往使用一个单词来代表字母,如用 boy 代表 B ,用 dog 代表 D,用Roger代表R。你细品,是不是用类似中文发音的逻辑来传递绝对不能错的信息?

          汉语的单位时间信息密度远高于其他语言,语速又快,天天练,极大锻炼了人的智力。

          因此无论从语法,还是构词,汉语都是世界第一的语言,是中国人智商领先的一大保证。说汉语落后,又讲不出令人信服的逻辑,就是逆向种族主义者。

          有意思的是英语正在朝汉语的方向演进,组合新词已经成为常态,software, hardware, homework,语法也在演进,复杂时态用的人越来越少,仅仅是写文章的人用来炫耀自己的水平。

          通宝推:strain2,脑袋,hattie,青青的蓝,崂山一道士,冬晓,河兮兮,俺本懒人,广阔天地,秦波仁者,潜望镜,肖羽,起于青萍之末,newbird,
          • 家园 汉语的模块形式在历史上阻碍了代数学,几何学的发展

            在现代,也对软件的发展产生了负面影响。

            几何学诞生于欧洲,代数学诞生于阿拉伯,没有诞生在中国,一个很大的原因就是中国使用汉字,而西方(包括阿拉伯)使用字母。

            几何学要研究一条线,一个点,一个面,这些用字母来标识很方便。

            代数学用一个字母来标识一个未知量,从而形成以未知量来表示的等式(即汉语所谓的方程),这是阿拉伯人在历史上的大发明,而中国人的方程在数学史上就是一整套具体的矩阵计算方法。

            就方程而言,中国因为汉字形式 导致中国没有建立抽象化的方程理论,而只是建立了具体的方程的解法。

            中国古人的矩阵法解决方程问题和九章算术等等一样都只是属于“术”或者说技术的范畴。

            而古希腊人,阿拉伯人则是依托字母文字发展出了一个严密的理论体系,而具体的方程解法不过是这个理论体系发展的一个小小的果实。

            正是因为古希腊人发明了几何,阿拉伯人发明了代数,文艺复兴以后笛卡尔,费马将两者结合在一起发明了解析几何即用代数的方法来研究几何问题。

            中国没有相应的概念体系,只有一套矩阵解法,怎么发展出解析几何?

            而解析几何最重要的进展是由费马发现的求切线斜率与求面积,两个计算互为反运算,即微分和积分互为反运算,然后被牛顿应用于伽利略力学,应用于万有引力证明了开普勒三大定律,然后微积分开始走上历史舞台。

            中国的矩阵计算法发展不出解析几何,也就更不可能发展出微积分 在科学上就被欧洲远远甩开。

            在今天,数学也离不开字母表示,不然你用汉字表示一个变量会发生什么

            点A

            线AB

            三角形ABC

            你用汉字怎么表示?

            xyz你用汉字怎么表示?

            为什么通用操作系统首先出现在西方,也与西方的字母文字有关,一个西方字符只要几个二进制代码就可以表示,一个汉字就需要更多很多的代码。

            更进一步的问题是,正如我在河里指出过的是,国人的思维严谨性,例如西西河的思维严谨性,概念使用的严谨性很差,一个原因在于西方人在应用一个词语的时候往往会进行定义,特别是科学研究中,对新的事物往往会进行定义,而国人则往往用一个含义相近的词语一笔带过。

            汉字本身就具有强烈的表意特征,往往一个汉语词汇的词义人们猜都猜得到,这导致国人不习惯于使用定义(即归纳)的方式对一个词语(概念)进行内涵的确认,结果就是国人例如西西河的网民常常是你说东我说西,看起来在说同一个东西,其实两个人争的是不同的概念。

            语言对思维模式确实是有影响的,中国几百来科学的落后确实与汉语的文字特征有关。

            但汉语并非完全没有优势,个人认为科学发展到更进一步的阶段,汉语的优势会体现出来。

            以周易为代表的中国古代文化其科学内涵肯定会被进一步发展的数学研究出来,而周易研究的是“象”

            一个汉字就代表一种“象”

            “象”可以理解为系统的相似性的分类,即某些系统彼此相似,这些彼此相似的系统就拥有一个共同的象。

            也就是说当科学发展到更高高度的系统论的时候,汉语的优势会体现出来。

            总之不要妄自菲薄,也不要自高自大

          • 家园 在目前AI训练中更加体现了汉语的优越

            正如陈王所说”掌握1000个字可以应付日常交流,认识6000个汉字的已经击败99%的人。小学三年级阅读报纸没有任何障碍“,同样的表达内容中文版的联合国文件永远是最薄的。举一个简单的例子:同样是没有任何军事常识的人,中国人看到护卫舰、驱逐舰、巡洋舰就会知道大概都是军舰,而说英语的人看到Frigate、Destroyer、Cruiser未必知道它们是什么,之间有什么共性。

            查一下牛津词典可知:

            《牛津英语词典》(Oxford English Dictionary;OED)习称《牛津大词典》[2],是由牛津大学出版社出版的20卷词典,截至2005年11月30日,该词典收录了301,100主词汇,字母数目达3亿5千万个。词典亦收录了157,000个以粗体印刷的组合和变形,以及169,000个以粗斜体印刷的短语和组合,令词典收录的词汇达到616,500个。另外,词典共列出137,000条读音、249,300个词源、577,000个互相参照和2,412,400句例子

            包括英语在内的字母语言,由于造词方便,所以制造新词汇成为一种随意而为的时髦行为。但是都是随着社会发展的复杂性,英语词汇已经庞大到匪夷所思的地步,比如牛津词典收录的英语主词汇已经有30多万个,一个人想掌握几十万词汇是完全不可能的,因此形成的语言壁垒达到了非专业人士已经完全不能理解该专业的特有词汇的地步。

            在AI训练的难度上,中文导致的歧义也远远领先于英语,比如Mouse,如果不结合上下文,你很难知道说的是“老鼠”,还是”鼠标“。随着大模型规模增大,英文相比于中文的难度就会指数级增大,需要的算力还有电力相比中文版也都是巨量,成本也会更大。今后的智能社会基础设施建设中文的优势只会越来越明显。

            通宝推:时间的影子,秦波仁者,
            • 家园 是的,汉语的优越性是体现在生产力上

              其实通过语言学本身论证汉语是否优越,意义终究有限。还是实际应用,更能体现汉语的优势。

              其实,我们大规模学英语,也不过几十年;

              昂撒大规模学英语,其实也不过几百年;

              之后我们继续使用汉语,包括迭代出来更优秀的版本。

              我的切身体会是,随着AI的应用,普通人在交流时,可以花更多精力在想表达的内容上,而不是形式上(纠察错别字)。可预见的结果就是,交流的深度和广度都将被拓展。我猜测,未来生僻字、甚至小篆的使用都会比现在广泛。

            • 家园 护卫(用途)舰(类型)是多维结构。10*10=100*1
            • 家园 这个是比较核心的区别

              同样是没有任何军事常识的人,中国人看到护卫舰、驱逐舰、巡洋舰就会知道大概都是军舰,而说英语的人看到Frigate、Destroyer、Cruiser未必知道它们是什么,之间有什么共性。

              英语为代表的拼音语言是一种记录发音的“助记符”,并非完整的“语言文字”,拼音语言只能说是一种“语言”,还没有达到文字的程度。拼音语言的“文字”,只是用来帮助记录发音的,本身的含义少到几乎没有,没有内在逻辑(比如Frigate、Destroyer、Cruiser),而汉语的语言和文字含义都非常的饱满,文字甚至都可以独立于语言,而拼音文字是记录发音而已,没有含义,很难说是真正的“文字”。所谓我认为拼音语言更象是一种“语言”,并非是完整的“语言文字”。

              从语言文字发展角度来说,人类早期肯定都是类似汉语的语言文字的,中国,埃及,巴比伦都是大量的象形文字,不是只用来记录发音的。我个人认为,地中海文明早期还是流行汉语类似的语言文字,但埃及文明被毁灭后,文明退化,周边地区,只能使用简单的拼音助记符来记录以前的事来重新建立文明。但正因为简单,好像也能应付,于是重新回到完整的语言文字就变困难重重。人类就是这么一种很偷懒的动物。

              所以对比来说,汉语还能保持成为语言文字,要依赖于我们的文明从未中断。如果我们的文明曾经中断,我认为很可能我们现在使用的也是拼音语言。

              通宝推:广宽,hattie,青青的蓝,潜望镜,燕人,
              • 家园 【讨论】看到过一个有意思的观点

                字母文字的起源基本都可以追溯到腓尼基文字,而腓尼基字母则是从埃及圣书体象形文字上简化形成的。

                这是因为,埃及象形文字在扩散过程中,表意的部分遗失了。

                原因是埃及祭祀阶层在向下层书隶传授象形文字时,有意不传授或者禁止奴隶掌握圣书文字的神圣的表意部分,工具人只要会用工具就好了。

                只掌握了表音部分的下层书隶们再将学到的表音文字简化传播开去,如同日语借用中文的‘训读’一样,各种没有文字的种族利用简化的象形文字来标记自己的语言。

                随着埃及祭司阶层的消亡,象形文字的表意部分再无人掌握,只留下简化后的表音部分传播发展成字母文字。

                • 家园 和以前的朝鲜语有点相似

                  朝鲜的上层使用汉语,下层使用“训民正音”。训民正音是15世纪朝鲜开始用的音素文字,由24个基本字母组成。开始主要由下层人民使用。

                  越南也使用汉语,越南的拼音化是16世纪由殖民者法国强迫的,遭到了很强的反抗,越南的历史古迹,汉字很常见的。

                  拼音文字的确有入门简单的特点,这也是基本一两百年就能形成一种语言的原因。如果今天我们为亚马逊某个大部落设计一种拼音语言,可能两三年就够了。

                • 家园 这个视角非常有趣

                  不管是否未统治阶级刻意造成的结果,使用字母文字的普通人其实类似于古代中国大部分普通人那样只会说话却不认识字,两者之间并没有本质区别。由于专业领域的词汇越来越艰深复杂,普通人很难去学习这些内容,从而也无法理解和获得各个专业领域的深度知识,最终他们无非就变成一个比完全不识字好一点的“高级文盲”。

                  目前西方的快乐教育其实也是一种“愚民政策”,事实上很多权势家族的孩子学习的强度并不比中国孩子弱多少,这种情况加剧了权势阶层与普通平民的知识断层,形成了事实上的阶级隔离,也就是类似于“埃及祭祀阶层与下层书隶”的阶级区隔。这也说明他们社会并没有表面上的那么平等,实质上与阿三的种姓制度大同小异。所以有人才觉得美帝社会在逐渐“印度化”的印象。

              • 家园 老兄这个说到点子上了!

                中文常用字并不多,但是按照上面那位老兄的的说法:其组合出的多维结构可以说是千变万化。例如区区几十字的唐诗宋词非常简洁,其表达的内涵,意境、美感却能胜过千言万语,可以说是人类文明中登峰造极的存在。

                这种简洁但内涵信息丰富的特征恰恰是非常符合现代社会对于计算机、大数据、人工智能领域的底层需求,可以大大减少计算量,简化对于硬件系统要求的难度,这正是从业者梦寐以求的。

                那些认为中文落后的,如果是伪装成中国人的白皮的话那我表示尊重。如果说是中国人我只能说是自轻自贱的井底之蛙。

          • 家园 汉语是不断发展的

            其实古汉语里面,也是每种东西一个字的

            比如光是“马”就有:

            骊、骝、駃、骠、骝、骢等

            实际是越来越抽象了

          • 家园 我也认为这个结论草率了

            根据我的观察,包括我家以及周围孩子学习汉语,英语的过程。我认为汉语的一个问题是入门的门槛还是偏高的,最开始的记忆量很大。美国学校在学生负担不重的情况下,不怎么强调记单词,背单词,孩子基本上2,3年级阅读没什么问题了。写作上词汇量也比较丰富了。而我们小时候学汉语,伴随整个小学,起码4年级之前,记汉字,默写汉字是重点。一个东西初始门槛高是不好的,意味着有可能会打击一批孩子。 这倒是符合主贴的筛选原则。

            汉语每个字必须带元音,这样声音清晰是优点。但是说实话,对初学者来说,特别没有语言环境,那四个声调的变化既难分清,又难以记忆。 这也是双刃剑。汉语相对发音少,这样编码效率低;为了弥补,又加了四个音调,但这一定程度上抵消了发音简单清晰的优势。英语相对发音也不多,但是允许辅音单独发音。所以组合增加了。 好像有研究,最后英语汉语的编码效率是差不多的。

            最后,其实语言是载体。大家学语言很少是为了学载体,而是关心载了什么。用某种语言创造的好东西多了,大家为了学那些好东西,所以学语言。或者,为了挣钱,找工作之类的。像当年大陆人学粤语,也不是粤语有多先进,而是香港好赚钱。你创造的知识越多,你的语言就越强势。就像如今的互联网,虽然我们用汉语翻译了英文。但是,如何解释以太网,以太是什么。为什么叫万维网,万维从哪里来?蓝牙,这个倒是中文能看懂,但是一个蓝色的牙怎么就和两个设备连接扯上关系了。所以即使你翻译了,别人的文化也沁入你的语言系统里了。所以,从这个逻辑入手,简化汉字是对的。降低入门门槛,让更多的人快速的掌握这个工具,然后用它创造好的东西。这才是存续这个语言的关键。

            这就像假如中国的文化强势了,别人也要试图理解“罄竹难书”,为什么竹子和书联系在一起一样。

            • 家园 后边500年应该是汉语优势轮了,这种优势是客观局

              拼音文字的500年优势轮已经过去了。现在还有点余晖,活字印刷,纸张,拼音文字的生态化反是欧洲和西方文明前边500年领先的客观基础。或者是中国落后李约瑟难题的客观答案。但随着信息化时代到来,优势和劣势开始反转了。

              实际回到文字本身,老子和许慎实际都分析过。

              小国寡民,使民有什伯之器而不用,使民重死而不远徙。虽有舟舆,无所乘之。虽有甲兵,无所陈之。使民复结绳而用之。甘其食,美其服,安其居,乐其俗。邻国相望,鸡犬之声相闻,民至老死不相往来。

              老子道德经里,民复结绳实际就是用拼音文字。拼音文字实际最早就是左边一根棍子,棍子上绑上几根绳子,每根绳子上打结,绑个小木棍,贝壳啥的,这就是字母,把读音通过绳子传递。所以拼音文字一般是自左向右,横向的。

              这个有什么问题那?

              古者包羲氏之王天下也,仰则观象于天,俯则观法于地,视鸟兽之文与地之宜,近取诸身,远取诸物,于是始作《易》八卦,以垂宪象。及神农氏,结绳为治,而统其事,庶业其繁,饰伪萌生。黄帝之史官仓颉,见鸟兽蹏迒之迹,知分理之可相别异也,初造书契。“百工以乂,万品以察,盖取诸夬”;“夬,扬于王庭”。言文者宣教明化于王者朝廷,君子所以施禄及下,居德则忌也。仓颉之初作书,盖依类象形,故谓之文。其后形声相益,即谓之字。文者,物象之本;字者,言孳乳而浸多也。著于竹帛谓之书。书者,如也。以迄五帝三王之世,改易殊体。封于泰山者七十有二代,靡有同焉。

              译文

               古代庖羲氏统治天下的时候,上则观察星象于天,下则观察现象于地,又看到乌兽的纹理和地理的形状,近则取法于身,远则取象于物,于是开始作了八卦,用它来表示法定的图象。至神农时代,用结绳的办法记录事物,诸事繁杂,饰伪的事情不断发生。黄帝的史官仓颉,看到乌兽足迹,知道纹理可以互相区别,始创造了文字。“百官以乂,万民以察,大概取象于分别,”“分别了,扬于王庭,”这就是说,文字是在王者朝廷里宣教明化的,是百官用以对下布施教化,增修德行,明白禁忌的。仓颉在开始创造文字的时候,大抵是依照事物的形象画出它们的图形,所以叫做“文”。后来形旁声旁相互结合就叫做“字”。“文”是表示事物的本然现象,“字”就是由文孳生出来而逐渐增多的。写在竹帛上的叫做“书”,“书”就是“如”的意思。到了五帝三王的时代,文字逐渐改变成不同形体。在泰山祭天地的有很多朝代,使用的文字竟然没有相同的呢。

              这是东汉 许慎说文解字的开篇。 在提到结绳的时候。 “及神农氏,结绳为治,而统其事,庶业其繁,饰伪萌生。” 用绳子记录的拼音文字,太容易被篡改造假了。

              实际上,如果我们客观思考一下黄帝,蚩尤战争时代。 游牧化,联邦化的黄帝政权统治地盘更大,各地人发音不同,直接语言转化结绳太容易产生错误了。 所以仓颉造字,实际是一种大范围上层政令标准化的需要。这种政令需要穿透万里疆域从逐鹿直接到海南岛上的部落,也保证意义不能被误解。所以,黄帝时代,以玉为兵,实际就是上层政令很可能是用标准象形文字刻画在小玉石板上。这些玉石板上的比如让海南岛部落出50人去攻打黎族的政令是不允许有歧义的,更不能轻易篡改。或者,某种意义上,正因为半游牧半农耕地域广大的黄帝部落集团有这种保证政令传递万里的手段,才真正击败了农业更发达的蚩尤集团。

              通宝推:秦波仁者,
              • 家园 拼音文字的创立和日语差不多

                最初也是象形字,但是南来北往的,总有异族的一些新鲜东西出来,就拿一些简单的象形字用作标音用。其实A,B,C这些字母也是有意义的。好像A就是牛角,E是眼睛。也有点原始形声字的意味。象形文字后来没人用有被入侵,文化断了的原因,其实也有用文字的阶层越来越低(从贵族到商人,甚至普通百姓),大家愿意用简单的东西。

                象形文字的确有自带解释功能,而且确保意思和读音分割。让一个巨大疆域里的人可以通过文字交流。否则粤语,吴语必然成为一个新的语言。欧洲就是个例子。其实语言的内核都差不多,但是就是没法交流。缺点就是学习起来有门槛。特别是对非母语的人来说。

                至于未来能不能反转,我倒觉得语言未必是多么重要的事情。主要还是科技/经济这些硬指标。非要说语言有一个进化的方向呢。我的观察是语言是要拼音化的。人毕竟是懒的。既然说话能听懂,说明仅凭声音也可以交流。未来汉语会不会强调使用拼音输入法即可而不强调记住字形,反正电脑也会自动纠错。另一个是孤立语话。法语据说新一代的人说话已经不那么讲究各种格, 很多词就一个格乱说,大家也能接受了。

分页树展主题 · 全看首页 上页
/ 13
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河