西西河

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
分页树展主题 · 全看首页 上页
/ 102
下页 末页
        • 家园 主要还是计算机处理文字的能力没有全面开发出来

          智能识别方面的水平太低,只能做低水平的字、词处理,还不能解决句子和段落的综合分析。

          总体来说,这不是语言的问题,而是智能识别能力提高的问题。

          关键词(Tags): #杂谈
        • 家园 AI:"海量文字数据挖掘,自然语言人机交互"

          1

          if I may use the following analogy:

          human brain=原子,離子, 神经细胞, a lot of 離子, not too bad;

          语言=some kind of 光譜, 原子@混合态,非定态,电荷分布随时间振荡,辐射, well, our brain has to perform 能量交換 ,interacting with 光场 from/of other human brains, close;

          2.

          so, social 语言场 with "量子化" should be more close to semi conductor type, less close to 经典通信 model, which has been managed by wall street and tg, basically, with huge pricing power, and therefore a huge tax to society in general

          In "semi conductor"聲子场,phonons are basically 量子化 of heat reservoir of a solid, "heat" as an energy fully utilized;

          In social 语言场 (such as in this 语言 post), a lot of "over heat" of emotions generated, then what?

          3. now, google, fb folks come in, what they see?

          1)can't compete with ws and tg, even with a "better" 经典通信 model

          2) 经典通信 model as a macro, coarse grain,"low speed" approximation of the underlying "qm logic"/s-cat type based social 语言场, really loses a tons of information in its basically 熱力學統計 model basd processing, and losing information is really "bad".

          4 what do I do as goog/fb AI

          1)"海量文字数据挖掘,自然语言人机交互", trying not to lose information, before doing anything else.

          2) 路徑積分 "歧义"

          for example: “我女朋友下面给我吃”的一般理解即动词“下”的面,非要歧义理解成介词“下面”就是无聊了"

          http://www.ccthere.com/alist/3847181/3

          what the boy and girl try to do here?

          “下”既可做动词,又可做介词",

          having a dinner, then ml, or together, AI will try to figure it out and then help them out, there is no "无聊" , but AI will try to 路徑積分 "歧义" in understanding this chinese "s-cat", qm model to start with:

          第四章双原子分子的振动和转动. §4-1 分子光谱概述. 1. 带状光谱. 对于原子而言,原子的能量是量子化的,只能取某些确定值。例如,He. 原子,在中心场近似下,各能...

          etc

          5.

          As such, goog/fb AI would eventually emerge out without making a lot of fuss, gradually wiping out possibly a lot of US attorneys, and tg's 政委 as well, in future?

          in future, people "cell/mass" 自己管理and/or解放自己 peacefully, @much lower cost, and become more productive socially: basically like 波函数自组织,量子化学 kind of model.

          Is there anything "wrong" with that?

        • 家园 我觉得原理上差别不大,实现技术有差异

          虽然说象英文这些有人工划分单词,但是词组或语句的意思才是更多场合下要用的。汉语相比较而言主要就是多个分词的过程。后面的语义分析应该是基本类似。现在的计算能力和存储能力,分词的花费也就相对较小了。

          其实可以比较一下计算机对中英文语句的平均理解速度。也许在单词水平上中文不见得占优,但在句子或短篇水平上就可能会占优。

        • 家园 人机交互落后是因为从事这方面研究的太少,时间太短

          产业还没完全发展出来而已

        • 家园 写汉语时养成空格的习惯应该会有帮助

          一个句子里 不是说只有到了标点符号处 才有相临字间的分离。 词组和词组之间 根据意义自然空格即可。

          我在网上写东西 都是这样的。这种操作的灵活性 要超过英语的 词和词之间必空格 之原则。但如果人们要坚持 一句话里无标点就不断句, 那就是主动放弃 汉语的一个优势。

          本来汉语没有标点,但现在大家都知道 标点好。我希望 根据意思自由空格 未来也会成为 被大家接受的常态。

          • 家园 词与词之间空格和标点到问题,可能主要是美观的问题

            你这个想法我以前也尝试过,在句子把词组用空格分开,后来发现难度很大。

            难度之一是要另外加一个步骤确认自己分词正确,速度就下来了。

            难度之二,其实是空格后的美观度远不如连在一起的。

          • 家园 互联网 的 产生 已经 彻底 改变 了 许多 东西

            互联网 的 产生 已经 彻底 改变 了 许多 东西。你 说 的 这种 空一格 (也 就是 词语 分写) 的 方式 在 互联网 产生 之前 或许 通过 下 一纸 行政命令 就 可以 达成, 可是在 互联网 产生 之后 再 要 那样 做 就 很 困难 了。过去 日本 采用 限制 汉字 使用 的 政策, 但是 现在 互联网 出现 了, 一个 日本人 要是 只会 教科书 里面 的 那 1945个 汉字 或许 连 看 网络小说 都 会 觉得 吃力。另外我觉得语言使用要考虑的是母语者的便利,而不是外语学习者或者计算机的便利,汉语词语分写或许对老外和计算机有利但是对母语者来说只能是蛋疼。

          • 家园 传说的 空一格

            委员长 驾到!!!

          • 家园 貌似多此一举。

            如何空格没有可以形成标准的规则。如果每个人都按照每个人的习惯来空格,则彼此之间习惯的不同反而造成阅读上的障碍。

            实际上,对于现代汉语来说,空格并不必要。因为在学习汉语的时候,通过学习组词,就已经在字与字之间建立了亲缘联系,类似于“此处无声胜有声”,也可以说是“此处无空胜有空”。假如一句话读上去令人费解,那么这就意味着作者应当把句子组织得更合理一些,文字组织应当更符合常规的意识流动的规律,而不是通过增加空格来提高可读性。读中文读到空格就象走路走到沟沟坎坎。多此一举。

          • 家园 说实话,你这段带空格的话看起来很累

            至少从看的习惯上,不需要空格

      • 家园 清华紫光,该是北大方正吧?

        原来说联合国文稿,总是中文的最薄;这一计算机了,中文双字节,拼音单字节,我当时想完了这下可比英文占地儿了

        现在看存储空间算啥呀,根本不是个事儿

分页树展主题 · 全看首页 上页
/ 102
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河