二、字根表的分区分位方法

汉字形码输入法的基本内容有两个:字根表与单字取码方法。形码的易记与否,主要看字根表分区分位的合理性。

1、“五笔字型”86版字根表如下图示:

Word-statistic

五笔字型把键盘上的英文字母键,划为五区五位,又把汉字的基本笔画分为“横竖撇点折”五类,其中“折”类包括横折,竖折,撇折。因此把字根表分为“横竖撇点折”5个区与5个位。字根的第一个笔画作为该字根的“区”,第二个笔画作为该字根的“位”。但只有约50%的字根是按区位规则排布的。

原因是字根在“横竖撇点折”5区5位的分配极不均匀。如字根起笔以横最多,折最少;以点为区,以竖、撇、折为位的字根很少,这些键位就成为空位;以横为区,以横或竖为位的字根就很多,这些键位上就“根满为患”。为了使每个键位上都能分配到一些字根,以降低重码率,许多字根都是打破区位规则排布的。

这就使得“五笔字型”字根表的很多字根排布无规律,难记,需要借助于口诀死记硬背,如:

G: 王旁青头戋(兼)五一;
F: 土士二干十寸雨;
D: 大犬三(羊)古石厂;
S: 木丁西 ;
A: 工戈草头右框七;

2、和码的字根表如下:

25个字形字母表

Word-statistic

和码将汉字的基本笔画归纳为“横竖撇点”四类,把横与横折放在一起,竖与竖折放在一起,撇与撇折放在一起。考虑到横与横折起笔的字根与汉字最多,在对汉字分区时,就把横分为两个区,即把与其它笔画相交的横起笔的字根(如:十土艹木米等)单独作为一区(第三区)。

和码把字根表分为“横竖十撇捺”五个区,每个区又把笔画与字根,按其对字形与字义的限定性大小(由简到繁)的顺序分为5个位。

和码字根表,是25个字形字母表的扩展

Word-statistic

三、衍生字根的概念

汉字中许多字根是在字形或字义上是同源的,如:日→白(丿日);目→自(丿目);木→禾(丿木);厂→广(丶厂);冂→门(丶冂);王→主(丶王)、木→耒(一一木)、火→灭(一火)等等。

在核心形义字根前加上单笔画而形成的字根叫衍生字根。

和码字形技术引入核心形义字根及其衍生字根字根的概念,进一步简化了字根表。单字分块取码时,核心字根优先取码,使单字编码更多地提取主要形义信息。

在其它的汉字形码中,没有衍生现象的概念,同源字根,如:日→白;目→自;木→禾;厂→广;冂→门;王→主、木→耒,都被分开排布在不同的码上。

衍生字根是汉字字形的一个重要概念,是和码字形技术首次提出的。

单笔画+多笔画字根(核心字根)=(组合成)衍生字根

Multiple stroke char
(Core Char)
Derivative
Char
Sample Words
(丿日) 魄原绵谐魏
(丿木) 科乘透梨诱秦
广(丶厂) 序鹿遮俯渡糠
(丶冂) 阀阔润闹
(丶王) 集售隽