西西河

主题:【原创】和本嘉明兄商榷关于汉字拼音化 -- 羽羊

共:💬140 🌺103
分页树展主题 · 全看首页 上页
/ 10
下页 末页
            • 家园 同意! 实际上大多数英文字母基本无意思,和汉字笔划一样.

              英文字母的ABC,对应的是汉字笔划横竖撇捺折弯勾点提. (请教大家汉字笔划还有超出以上更多的吗?)

              字母a可以是一个常用单词, 笔划一也是一个常用汉字.

              在单字的基本构成上, 可以看出汉字远胜于拼音文字.

              在同样书写空间表达语意的多寡上, 也是汉字远胜于拼音文字.

              之所以很多人感觉英文比汉字简单,是因为拿汉字和拼音字母比较了. 试想"马"和字母H可以比吗?而"马"和"horse"书写比较起来又有多少差呢? 而英文中通过大量创造书写较短的新词来避免用原有词来组合形成书写较长的新词, (比如猪肉不叫pig-meat,而叫pork, 羊肉不叫sheep-meat,而称mutton), 这很象古代中国用单字表意. 至于为什么后来的国人越来越倾向于用字组词,而不是创造新的单字来表意,这就是一个值得注意和细思的地方了.

            • 家园 哈哈,这样一算的话,英文吃大亏了

              汉字笔画不过横竖撇捺折,手机笔画输入就按这个设计的,呵呵

          • 家园 汉字单字就具备词的属性,您说的在理

            有人常常将汉字和字母做对比。从信息学的角度,这是不公平的。因为汉字所包涵的信息量远远大于字母。真正应该拿来和汉字做对比的应该是单词。掌握六千多汉字基本覆盖了全部的日常应用;要是只掌握六千英文单词的活,嘿嘿,恭喜您脱贫

            您说的在理,汉字词的多音化是近代开始的一种趋势,而从缘起来看,汉字中名词是单字成词的,而汉字和字母相比,恰恰忽略了汉字单字作为词的固有属性,例如龙,即为单字词,芯,也为单字词,二者均具备其固有含义,龙芯一词,观者也可望文生义,当然,汉字的构词法是繁复多样的,此例或许以偏概全,但是无论构词法如何多样,也仅仅是规则而已,而汉字单字则构成了现代汉语这样一种类似自解译的符号系统(说白了就是望文生义)。

            从语言学的角度来看,语言是以词汇为建筑材料的,而汉语自解译的特点,对应拼音文字而言,letter和word之间是无法形成这种自解译关系的,表音文字当中,和word形成这种自解译关系的是词根,而常用词根的数量和汉字常用字的数量相比,恐怕要大得多,这样就决定了掌握语言基本构件——词汇——的数量要求上,远远比字母构词的拼音文字优越,这恐怕也是汉语难入门,但入门之后,掌握用于交流就不难了,而如英语这样的表音文字,学会拼读不难,用于交流,真的就是6000词汇刚脱贫了。

        • 家园 每个字母都认识,大部分词都不认识还不是一样?

          国内识字的人去医院填表,大概总还知道啥病基本上在啥部位;

          前几天看河友的帖子,国外上医院填单子,看到一个单词就头晕,无他,病名和器官名称根本无对应,每个病都是贼长的字母组合

          你认识字母,知道发音能怎样?和鹦鹉差不多

          这种文化输出的事,顺其自然便是,削足适履使不得

          三弄两弄邯郸学步了都

          • 家园 对词的认识只能靠日常的积累。

              这在表音和表意字都一样,表意字稍好点,有部分词意就是字的组合。但汉文同样有大量的与组成的字意不相干的词,如具没见过同样认识字不认识词。

              但我们讨论这个问题不能脱离我们这个中文环境,咱们从小学说话就学了大量的中文词,中国人学语文的第一步只不过是让你把会说的话写出来,而不是象学外文一样连词意都要学。

              就象俺,26个字母都认识,组在一起就不认识了。

              还有个字库问题,虽然现在计算机的内存对保存中文字库不算问题,但各种字体还是占了相当大的存储器,这对一些简单的应用系统更是个困难。象用单片机的系统如果要显示汉字,显示汉字的内存和显示器就占了成本的相当大部分。现在基本上人人都有的手机,输入汉字就要比字母困难得多。

              计算机的开发中国不比外国人晚很多,为什么所有的编程语言全部是外国人创造的使用字母的,这与汉字的数量、复杂性有很大关系。

            • 家园 话分两头,各表一枝

              关于词的积累,您提到了一个关键,您26个字母都认识,合在一起一个都不认识,可是您认识了3500个常用字(其中2500个常用字和1000个次常用字,国家语委的说法,其实日常应用恐怕还远远没有这么多)之后,读报纸不会有问题,羽羊的小侄子3年级,认不了3500个字,已经可以看报纸了,羽羊学英文,大学的时候还捧着朗文猜times(当然这个和天资也有关系),这个如果往深了说,跟汉语的发展又有关系了,汉语本来就是单字表意成词的,多音化是个近代发展的趋势而已,回到汉字拼音化这个论题上面来,您提到了这个例子恰恰说明,汉字在学习方面,没有表音化的必要。因为诚如沉宝兄所言,一个困难转移到另外一个困难,何必呢?

              第二您提到了汉字的处理方面,羽羊现在干的就是it,恰恰在这方面有点发言权,您提到的汉字输入和显示,远远没有您说的那样困难,也许国内的宣传导致的?汉卡和汉语平台外挂时代,确实有其历史地位,但并不具备独创性,无非读取字库数据,在屏幕上面打点而已,和英文没什么原理上的区别,至于现在的矢量技术,两方面更是没有质的差异了。

              计算机的开发中国不比外国人晚很多,为什么所有的编程语言全部是外国人创造的使用字母的,这与汉字的数量、复杂性有很大关系。

              这个说法有点拉郎配的意思了,编程语言就是个简单到极致,精准到极致的符号系统,就算是使用英文,也没用多少单词,c才30个关键字而已,说穿了,高级语言,您的code就是个代号而已,用汉语还是英语,其原因并非和复杂性以及汉语英语的数量有什么关系,顺便说说,code,中文有非常传神的翻译,代码,信达雅兼备。

              题外话关于汉语编程,国内确实有人实现过,但是其必要性和迫切性以及和英文编程的比较,又得是一篇长文,而且不是羽羊这等人说的清楚的,不过羽羊总觉得,应该不能成为您的论据,您说呢?

              关于 letter word root,中文的翻译也非常牛,字母,字(现在译为单词,最早译为“字”),词根,最早翻译这三个word的人,羽羊望天一拜,这才是学贯东西的大学问家阿!

              字母、字、词根,看着这五个字,只要略微琢磨一下,作为中国人,恐怕您也体会到汉字之美了吧。

              • 家园 说得是,很多人把拉丁字母等同于符号系统。叹息认知水平啊
              • 家园 汉字输入怎么说也没有字母方便吧?

                  至于汉字显示,最低分辨率的也得16X16,英文(拼音字母)8X8就行了,这就差了4倍,再加上英文字符不超过128个,一级汉字3755个,二级汉字3008个,相差52倍。

                  就拿16X16点阵的字库来说(矢量字库数据量更大,只适用于高分辨率的),两级汉字就要200多K字节,如果用常用的51系列单片机64k连一级汉字都不够。

                  就说“大”屏幕显字屏,显汉字至少要比字母多一倍的点阵(假设很长)

                  你学英文不如小侄子学汉文是因为汉文是你们的母语,讨论这个不能脱离这个环境,小侄子3年级汉语至少已经学了8年了,而且是在汉语环境中,从小开始可以说随时随地都在学。你学英文有这个条件吗?

                  最简单地说,只要你会说普通话m汉字拼音化后你学了个新词知道说马上就知道怎么写,而方块字学了词你还得学怎么写。最常见的是问姓名:“你姓zhang?弓长张还是立早章?”。

                后面那个也说不上是拉郎配,这正说明了汉字在计算机上的应用比字母困难不少,汉字的计算机编码比数量少的字母困难,所以汉字编码要出现的迟。

                  再翻回到以前不用计算机的时候,发电报,字母包括大部分标点符号只要用六键直接完成,一个汉字要四键一个数字,再四个数字一个汉字,多费一道翻译,所以中国电信局都有专门的译电员从数字译成汉字(当时发电报一个字三分,译电另加半分),要经过相当的培训,字母一步译成很容易。

                  以前的汉字打字机,一个大盘几千个铅字在上面,不经相当的培训上去几分钟都找不到所要的字。所以那时的汉字打字机都有专业打字员,字母打字机可以说识字的人都能用,只是速度有所差别。但这个熟练和不熟练的差别要比用汉字打字机小得多。

                • 家园 那咱们就讨论一下计算机汉字相关技术

                  计算机在处理汉字方面是有其特殊的困难的,但是这些困难恰恰和您强调的输入输出没什么关系。您打错靶子了

                  一般而言,矢量字库是比点阵字库略小的,关于这一点您的论据是存在错误的。

                  关于编程语言的问题,还是请您不要再拿来作为论据了,编程语言不过是个指代而已,无论用什么语言,第一自然语言的复杂程度和编程语言选用何种自然语言作为符号系统蓝本没有关系,因为横竖编程语言就那么多关键字,第二,说到底,最后都是010101,就是选用蚯蚓文,只要编译器或者解释器能翻译能01就得了。

                  至于说英文的情况,您在偷换概念了,我们一直在讨论词汇量的问题,3年级的小儿在能够认识的汉字数量上,绝对不到3500,大学的羽羊,4000词汇量是没有问题的,但是在阅读上的困难,英文远大于汉语。汉字能够形成一种自解译的系统,3500个汉字的掌握背后,是数量远远要多的词汇的掌握,这就是汉语在阅读方面比英文优越的多的原因。

                  您还说到了

                  最简单地说,只要你会说普通话m汉字拼音化后你学了个新词知道说马上就知道怎么写,而方块字学了词你还得学怎么写。最常见的是问姓名:“你姓zhang?弓长张还是立早章?”。

                  ok,既然这样,羽羊斗胆穿越一次,照您的意思,咱们改拼音啦

                  cong han yu de fu za xing ,yi ji zai ji suan ji deng fang mian cun zai de gu you chu li nan ti deng deng yuan yin .njyd lao xiong ren wei ,han yu shi xu yao jin xing da dao kuo fu de gai ge de .

                  以上一段,能读能写,意思呢?您明白了?您真明白了?您真不怕棒子上你们家门口散步去?

                  • 家园 你理解错我的意思了。

                      我说点阵字库大是指最低分辩率的字库,前面说了16x16点阵的二级字库有两百多K,我查了一下Windows里的汉字矢量字库,最小的也有接近4M。

                      为什么用最低分辩率的字库比,因为现在的计算机存储器都很大,几M根本不算什么。但对简易的单片机系统(51系列)来说,超过64K就要采用特殊方法了。

                      对编程语言也一样,现在技术条件当然没问题,但在早期刚开始发展的时候就是这繁简的差别造成汉字使用落在后面。一开始大家都是010101,就是因为表意字字数太多的原因,计算机处理汉字落在字母后面,编程语言使用汉字也落在后面,造成现在没有一种编程语言是用汉字做指令的。

                      如果说偷换概念,那不是我。我一直在说我们处于汉文这个环境中,“3年级的小儿在能够认识的汉字数量上,绝对不到3500,”,但他能掌握的汉文词汇远远超过你大学时掌握的英文词汇。说汉文的字好学还是英文的字(我说的字是指认识、阅读),你这中国的3年级的小儿要与在英国长大的3年级的小儿比,用中国三年级的中文去与中国大学生的英文比是没有可比性的。

                      再说说你最后的汉语拼音,真正汉语拼音的书写是以词为组,不是象你这样一个字一个字拼。

                      就这样俺给你翻译一下:

                      “从汉语的复杂性,一在计算机的方面存在的固有处理难题等等原因,njyd老兄认为,汉语是需要进行大刀阔斧的改革的。”

                      蓝字疑为“直”,zi。

                    至于汉语拼音写法,应该象下面这样,词与词分开,同一个词内的字连在一起:

                    cong hanyu de fuzaxing,yiji zai jisuanji deng fangmian cunzai de guyou chuli nanti dengdeng yuanyin .njyd laoxiong renwei ,hanyu shi xuyao jinxing dadaokuofu de gaige de .

                      这样写起来是不是更象英文?

                      

                      当然,这样写法也有少量容易混淆的词,如档案和单干写成汉语拼音都是dangan,这需要想法解决。就是现在的汉语拼音方案也不是十全十美,要不推广会容易得多。

                    • 家园 谢谢您帮羽羊这个忙

                      再说说你最后的汉语拼音,真正汉语拼音的书写是以词为组,不是象你这样一个字一个字拼。

                        就这样俺给你翻译一下:

                        “从汉语的复杂性,一级在计算机的方面存在的固有处理难题等等原因,njyd老兄认为,汉语是需要进行大刀阔斧的改革的。”

                        蓝字疑为“直”,zi。

                      感谢您的翻译,谢谢您证明了汉语拼音化固有的难以解决的问题

                      1、蓝字疑为“直”。。。不是“直”,是“及”,以及的及,就算结合上下文,您还是没把意思搞懂,而且一直和以及完全不同音。

                      2、我那段话,说的不是“汉语”,是“韩语”,哈哈,好吧,我承认我开了个小玩笑,不过也说明了同音词判断的难度了。

                      题外话,现代韩文其实也是表音的,可是棒子还用了几百年的汉字不是,改了表音系统之后,还得多学一份儿汉字,没办法阿,不学自己祖宗姓什么都不知道了。

                      • 家园 这就是现在的汉语拼音方案不完善的地方,

                          我前面也说过,现在的汉语拼音方案无法表示四声,而在汉语中四声是非常重要的。

                          因为很少用拼音,我打字也不用拼音,就这样我还是把绝大部分都读出来了,只是错了一个词。如果大家一直在用拼音读写,不敢说不出错,但能肯定的是错误会大大减少。

                          就是用汉字,也经常有人写别字,但同样可以结结巴巴的读出来。

                          现在的汉语拼音方案还不完善,因为要凑世界上应用最广泛的英文字母。如果自己创造一套字母可能能比较好的解决,但这又与最常见的英文键盘不配合。所以虽然拼音文字优点比较多,但真正改起来是很困难的。

                          拼音文字读写比较方便,也易学,这是不可否认的事实。但一种已经续了几千年的文字要改字母也是很困难的,当然也有很多缺陷。改用汉语拼音最大的缺陷我看就是隔裂了现代普通人与传统文化的联系,如果完全使用汉语拼音,几十年后普通人就看不了古籍,只有那些专门研究“古”汉语的人才懂。

                        • 家园 这样讨论才不是口水战,呵呵,部分观点羽羊赞同

                           现在的汉语拼音方案还不完善,因为要凑世界上应用最广泛的英文字母。如果自己创造一套字母可能能比较好的解决,但这又与最常见的英文键盘不配合。所以虽然拼音文字优点比较多,但真正改起来是很困难的。

                          羽羊的小玩笑,表明的是汉语拼音的困难,不是汉语拼音化的困难,这一点是羽羊必须说明白的,否则不是严肃的辩论态度。

                          从老哥您的回帖,羽羊斗胆估计您也认为现有的拉丁字母体系难于对汉字进行完美的拼音化,那么,为了进行拼音化改革,必须创设一套能够完美表达汉语的表音符号系统,这一努力,中国人从来没放弃过,笔划的,字母的,拉拉杂杂多少种,修成正果,效果最好的就是汉语拼音方案了。

                          好吧,咱们假设这套系统已经存在,那么他肯定和现在的拉丁字母体系关系不大,用起来会怎么样呢?这个不用讨论了,韩国是个例子,汉语表意的好处他们全丢了,表音文字的好处他们倒是沾了一点,好像也不多,倒是连自己国家的史书都不如中国人看的明白。

                          拼音文字读写比较方便,也易学,这是不可否认的事实。但一种已经续了几千年的文字要改字母也是很困难的,当然也有很多缺陷。改用汉语拼音最大的缺陷我看就是隔裂了现代普通人与传统文化的联系,如果完全使用汉语拼音,几十年后普通人就看不了古籍,只有那些专门研究“古”汉语的人才懂。

                          这一点,羽羊阐述一下自己的意见,之前也说过多次,语言文字的趋势,仅能总结,而不能设计,将来什么样,将来知道,刻意设计的结果,多半不乐观,从现代汉语的情况看,无疑是汉语言发展过程中非常好的一个阶段,成熟的汉字表意体系和统一的汉语拼音表音体系,两条腿走路。把汉语言的事情交给人民,把未来的事情交给未来,多好。非要砍掉一条腿,何必呢?何苦呢?

分页树展主题 · 全看首页 上页
/ 10
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河