汉字形码输入法的基本内容有两个:字根表与单字取码方法。形码的易记与否,主要看字根表分区分位的合理性。
五笔字型把键盘上的英文字母键,划为五区五位,又把汉字的基本笔画分为“横竖撇点折”五类,其中“折”类包括横折,竖折,撇折。因此把字根表分为“横竖撇点折”5个区与5个位。字根的第一个笔画作为该字根的“区”,第二个笔画作为该字根的“位”。但只有约50%的字根是按区位规则排布的。
原因是字根在“横竖撇点折”5区5位的分配极不均匀。如字根起笔以横最多,折最少;以点为区,以竖、撇、折为位的字根很少,这些键位就成为空位;以横为区,以横或竖为位的字根就很多,这些键位上就“根满为患”。为了使每个键位上都能分配到一些字根,以降低重码率,许多字根都是打破区位规则排布的。
这就使得“五笔字型”字根表的很多字根排布无规律,难记,需要借助于口诀死记硬背,如:
G: 王旁青头戋(兼)五一;
F: 土士二干十寸雨;
D: 大犬三(羊)古石厂;
S: 木丁西 ;
A: 工戈草头右框七;
25个字形字母表
和码将汉字的基本笔画归纳为“横竖撇点”四类,把横与横折放在一起,竖与竖折放在一起,撇与撇折放在一起。考虑到横与横折起笔的字根与汉字最多,在对汉字分区时,就把横分为两个区,即把与其它笔画相交的横起笔的字根(如:十土艹木米等)单独作为一区(第三区)。
和码把字根表分为“横竖十撇捺”五个区,每个区又把笔画与字根,按其对字形与字义的限定性大小(由简到繁)的顺序分为5个位。
和码字根表,是25个字形字母表的扩展
汉字中许多字根是在字形或字义上是同源的,如:日→白(丿日);目→自(丿目);木→禾(丿木);厂→广(丶厂);冂→门(丶冂);王→主(丶王)、木→耒(一一木)、火→灭(一火)等等。
在核心形义字根前加上单笔画而形成的字根叫衍生字根。
和码字形技术引入核心形义字根及其衍生字根字根的概念,进一步简化了字根表。单字分块取码时,核心字根优先取码,使单字编码更多地提取主要形义信息。
在其它的汉字形码中,没有衍生现象的概念,同源字根,如:日→白;目→自;木→禾;厂→广;冂→门;王→主、木→耒,都被分开排布在不同的码上。
衍生字根是汉字字形的一个重要概念,是和码字形技术首次提出的。
单笔画+多笔画字根(核心字根)=(组合成)衍生字根
Multiple stroke char (Core Char) |
Derivative Char |
Sample Words |
---|---|---|
日 | 白(丿日) | 魄原绵谐魏 |
木 | 禾(丿木) | 科乘透梨诱秦 |
厂 | 广(丶厂) | 序鹿遮俯渡糠 |
冂 | 门(丶冂) | 阀阔润闹 |
王 | 主(丶王) | 集售隽 |