动态组字

本页使用了标题或全文手工转换,现处于中国大陆简体模式
求闻百科,共笔求闻

动态组字是一种汉字电脑等领域的编码理论及技术。

拼音文字英文字母,一套字体只要制作26个字母和一些标点符号就足够使用。但汉字是一种意音文字,若无数千到数万个字符数量,便不足以应付基本的讯息交换。即便已有数万个字符,往往在面对古籍时还有缺字的问题。这造成汉字无论是制作、储存、使用、或交流,成本都远高于表音文字,这对汉字的文化发展非常不利。

鉴于此,中国大陆台湾都有人在研究“动态组字”技术,这个技术的目的是解除电脑系统对汉字的束缚。作法是,只在记忆体中储存少量(约数百至一千多)的字根部件,并用程控,以递回的方式根据部件做即时的“二维组字”,显示到屏幕上。“字根”在此就相当于拼音文字的字母,差别只在于字母表音而字根表意。

有了动态组字,用户便可因应各式需求自行造字,再无缺字之虞。此外,组字的过程反向操作(也就是拆字),就可以作汉字理解,也有助于人工智能手写辨识及中文PDA手机手持式设备开发。亦可延长储存设备寿命。

Unicode

Unicode标准从3.0开始,开始有表意文字序列(Ideographic Description Sequence,IDS),为采用表意文字组合符(Ideographic Description Character,IDC)与文字部件的组合,为缺字描述定下一个标准基础,只要加上解译描绘的机制,也是一种动态组字的实现。

参考

仓颉系统

这是最早产品化的系统,由早年电脑中文化的开拓者朱邦复所提出。编码上采文传码,是一种定长度编码,也就是说可造字有限。

文传码分为两版:

  • 2 byte版的文传码,上限是15 bits(三万二千字),第一个bit为避开ASCII
  • 4 byte版的文传码,每个输入码占6 bits共5组,每个6 bits为仓颉输入码(26个)+ 5个重复字(1号重复,2号重复)所以理论上有超过一千万个码位。

该系统精巧快速,但因以8086组合语言写成,故需要重新解译才能跨平台使用。组字方式纯粹取决于字形外貌,配合仓颉输入法字根作部件基础,未必符合文字学原理,如“门”取码为“日弓”,乃取其首尾字根形状(“日”和“亅”)。优点:如果拼音文字,可组出符合中文构字原理的任何字,理论上可达一千万个字。目前只有在香港文化传信授权制造的特定的嵌入式硬体才有实作此技术。

相关项目