我们使用的汉字,不论是国家标准GB2312-80的6763个汉字,还是GB18030-2000 的2万7千多个汉字,或是更大的汉字集,所有的汉字都是前人创造出来的,以固定形式存在的。
汉字是固定的,那么组成这些字的字形要素,也就是确定的。这些要素是基本笔画,字根,与字形结构。汉字的基本笔画是横竖撇点捺与对应的折笔画,字根大致为600多个,汉字结构是独体字、二块字、三块字等,或是上下结构,左右结构、内外结构等。
汉字字形编码方案的设计,就是把汉字的组成笔画与字根,按照易学易记的要求,进行合理的分区分位排布成一个字根表,根据汉字结构的特点,按照易学易用的要求,制定一个单字取码方法。字根表与单字取码方法就是汉字字形编码方案的主要内容。
对于现存的固定的汉字集,确定的字形要素,在易学易记易用的要求下,汉字字形编码方案不会是无限多的。
大家知道,中国围棋的下法是无限多的,因为双方比的是复杂难懂的排布方法,但如果围棋对弈的双方,比的是用最简单最易懂的方式排布棋子,那就只有一种排布方式,即黑子做两个棋眼占半边,白子做两个棋眼摆在另半边。
道理相似,如果字形编码的目的是难学难记,那几千个汉字的编码,比下围棋还要复杂得多,编码方案也有无限个。所幸的是字形编码方案追求的是易学易记易用,这样合格的字形编码方案就有个数了。
在易学易记易用的要求下,汉字字形编码方案(字根表与单字取码方法)也就存在几类几种,最具代表性的有以下几类。
1单笔画类:如手机上的各种笔画输入法;
2双笔画类:如二笔输入法;
3字根类:五笔字型,表形码,郑码,仓颉码,和码等。
值得庆幸的是,汉字形码还存在一个最好最终的方案。
各种汉字字形编码输入法采用的编码符号不外乎两种:英文字母与数字。
五笔字型,表形码,郑码,仓颉码等都采用英文字母做为编码符号。
用字母符号编码的输入法,能在电脑大键盘上使用,但不能直接地应用于手机与数字小键盘。
字母与数字没有易记易用的对应关系,且字母的顺序号难直接读出,如‘G’的顺序号是7,‘J’的顺序号是10,是难于直接读出的。
因此字母符号不方便在数字键盘上直接输入,而是把26个英文字母印在10数字键上,2~3个字母共用一个数字键。因此26个字母符号编码的输入法,在手机上就变成了10个码元的输入法,重码率就大幅度上升。
另外,有的形码输入法,把汉字字根与英文字母,通过形相似(称为“形托”)联系在一起,以求增加易学易记性。
汉字字根与英文字母是没有任何关系的,把汉字的‘口’看成是‘O’,‘阝’看成是‘P’,那么‘王、木、人、女、氵、心’又象那个英文字母呢?在两个本不相关的事物中找关系,就难免主观,牵强。
笔画输入法,和码等采用数字为编码符号。
数字代表的是顺序,而不是形,如12345,一二三四五,与ⅠⅡⅢⅣⅤ表示的是相同的序性,而不是符号形状。序性是最基础的逻辑性。
和码有25个数字输入码,由12345五个数字两两组合而成:
在手机与数字小键盘上,通过12345五个数字键输入25个数字码:
在电脑字母大键盘上,通过25个字母键输入25个数字码。
和码采用25个数字码对汉字编码,实现了同一个字根表,同一种单字取码方法,在电脑字母大键盘,数字小键盘与手机上的统一通用。这是以往的各种汉字输入法都没有做到的。
因此为了使汉字形码在不同的输入设备上>统一通用,编码符号应采用数字符号。