西西河

主题:关于《字表》再“表表态” -- 端娘

共:💬92 🌺189 新:
全看分页树展 · 主题 跟帖
家园 关于GB13000.1与GB18030的关系,并不是简单

的不分应用层次的问题。GB18030 准确的说是 GB2312 的超集,而在 GB2312 出现的时代(上世纪八十年代),ISO10646 还没有影子(1990年第一份初稿)。而 Unicode/ISO 10646 这张编码表要在现代计算机上实现需要做一些变换,这也是为什么其实现被称为 Unicode Transformation Format 。

现在一般来说 GB18030 地位等同于现在常用的 UTF-8 和 UTF-16 。至少在使用中 GB18030 与 UTF-8 、 UTF-16 一样可以看成是 ISO10646 在计算机上的实现,其变换都是基于 Unicode 的。之所以要执行 GB 18030 很大的原因是要兼容早期的 GB 2312 文档。

对于电脑字库来说, Unicode 本身只是参考。一个字体会说覆盖了 Unicode 的编码范围从多少到多少。对于字体来说这是可以脱离相关编码而存在的。事实上,中文字体的实现是完全按照《字形表》的要求。

所以说《字形表》与汉字编码是两个层次上的事,程序员的比喻就是一个核心算法,一个是用户界面。综上所述,我不认为工信部在《字表》的问题上会有什么分歧,本身国标给出的字形(Unicode 中的代码图表其实是一个参考)中的汉字部分其实就是现代汉语通用字表的翻版。换句话说工信部是在实行《字表》,至于制定《字表》并不是工信部的事。

说到这里,不能不指一下 Unicode 的历史,在早期,这是两个机构各自制定的两个不同的标准,但是一旦意识到这个世界不需要两种字符编码标准,他们就承诺保证这两个不同名称的标准在实质上是一回事。两家标准相互竟争是不可想像的。而且在这些标准制定的过程中,也没有人会更改 ASCII 码,只能不断的给出超集。

最后说一下无论 GB 2312 收字合理与否,或是 ASCII 码有多么讨厌,都已经是过去的事,无论新的业者是否觉得合理都已经不可能再废止了。成千上万的信息已经以这种编码方式存在,无可更改。

说一句不该说的话,一百年前的传统是传统,那三十年的传统就不算传统了吗?我们成长在三十年的这个传统下,而不是一百年前的那个传统下。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河