第五章 单字与词组取码


第一节 简单字的取码

和码字形编码时,单字被区分为简单字与复杂字。

简单字:最多只有三个字根的汉字。简单字依字根排布顺序取码。

码数 字例 图片 编码 相似的字 特点
1 HanZi 11 丨乚丿丶乙 单笔画
1 HanZi 24 又王十土木米女火心 多笔画
2 HanZi 32 55 旧吕回因江汉如什圣 相离
2 HanZi 11 34 千白自万巨另去丑 相接
2 HanZi 25 34 本来必里电束内东 相交
3 HanZi 23 11 24 品圆画压盼劳论烟闷 相离
3 HanZi 21 11 24 至舌兴壮音改笑任香 相接
3 HanZi 41 11 32 理事块君讲更吨兔 相交

第二节 复杂字的取码

复杂字:字根数多于三个的汉字。复杂字的取码规则有两个。

规则1:分块取码。单字分三块,每块取一个码,依书写顺序排序。

字例 分三块 图片 三个主要码
艹住灬 HanZi 33 42 54
艹句攵 HanZi 33 44 45
阝立早 HanZi 32 55 25
土木戈 HanZi 32 34 34
尸古刂 HanZi 12 31 21
阝有辶 HanZi 32 32 53
日召灬 HanZi 25 14 54

规则2:复杂字中,衍生字根优先取核心字根码。

衍生字根的概念:

单笔画+多笔画字根(核心字根)=(组合成)衍生字根,如:

核心字根(多笔画字根) 衍生字根 例字
白=(丿日) 魄原绵谐魏
自=(丿目) 鼻熄
=(丿土) 造靠选
禾=(丿木) 科乘透梨诱秦
天=(一大) 凑添
广=(丶厂) 序遮俯渡糠
门=(丶冂) 阀阔润闹
主=(丶王) 集售隽

单笔画字根,即字根表中码11,21,41,51中单笔画,单笔画字根没有特别的形义,在汉字中分布最广。

核心形义字根,由两个或以上单笔画组成的字根,有基本的形义。

衍生字根,在核心字根的前面或后面¬,¬加上一种单笔画字根,都构成其衍生字根。

在复杂字中,衍生字根取码时,核心字根优先。即衍生字根上只取一个码时,就取核心字根码。


衍生字根概念是和码字形技术的新概念,把核心字根与其衍生字根归类在一起,对减少字根数,简化字根表有重要作用。 

复杂字中,衍生字根取其核心字根码,如:

字例 分三块 衍生字根 图片 三个主要码
王白石 HanZi 15 25 35
禾宀豕 禾宀豕 HanZi 34 23 45
水水水 水水水 HanZi 53 53 53
壬口辶 HanZi 32 24 53
门亻戈 HanZi 23 42 34
开刂土 HanZi 33 21 32
亡月王 HanZi 13 23 15

单字第四码(辅助码):复杂字,取完三个主要码后,在剩余笔画与字根中,取一个辅码(辅助码)作为单字的第四码。下一节再介绍第四码。和码输入软件提示第四码(辅助码)。

因此,复杂单字有4个码,3个主要码 + 1个辅助码。 


第三节 字根的码值概念

单字取字根码时,我们总是优先选取单字中的大字根。

如:字根‘木’由‘十八’组成,在字‘杜杏困相’取码时,我们取‘木’而不取‘十’或‘八’。又如:‘火’由‘丷人’组成,在字‘灶烘灼淡’取码时,我们取‘火’而不取‘丷’或‘人’。这都是对的,即取大优先的原则。

一般地,笔画数多的字根大,因此‘木’大于‘十’与‘八’,‘火’大于‘丷’与‘人’。但如果比较‘丷’与‘人’的大小呢?

为了便于比较,和码给每个字根一个码值,码值就是字根大小的值,也是该字根对单字字义与字形的限定性大小的尺度。在数字上,码值刚好是字根数码的反数。如:‘丶’的数码是51,码值则是15;‘人’的数码43,码值34,‘口’的数码是24,码值则是42。以点区为例:

码名 字根 码值 汉字中的分布
51 15 最广
52 25 很广
53 35 广
54 45 次之
55 55 次之

码值的大小可以用于字根排序。如:‘火’的码值54,‘口’的码值42,‘人’的码值34,它们的码值从大到小的顺序为:火→口→人。

复杂单字有四个码,三个主要码取完后的,在“剩余部分取最大值码”是第四码(辅助码)取码的一个参照规则。

单字 图片 剩余部分字根 最大字根(码值) 第四码
HanZi 丿丶一 丶(15) 51
HanZi 一口子丶 子(51) 15

第四节 词组的取码

词组的编码是根据单字的编码生成的。

每个词组(最多)四个码。

字数 词例 规则
2 国家(24 15 51 23) 2+2=4个码
3 联合国(15 43 24 15) 1+1+2=4个码
4 中国人民(24 24 43 12) 1+1+1+1=4个码
>4 和码输入法(41 35 35 43) 1+1+1+1=4个码

特别地,对于二字词,如果第一个单字只有一个码,如:日期,心里,小心等,那么第二个字就取前三码。

词组的最大码长为4,但有的词组的码数不足4个。如:“小心”的编码只有两个:54 55; 心里:55 25 32;中国人:24 24 43。


第五节 练习

简单字与复杂字举例:

字型 单字 编码 单字 编码
简单 日(日) 25 木(木) 34
简单 白(丿日) 41 25 禾(丿木) 41 34
简单 皇(丿日王) 41 25 15 和(丿木口) 41 34 24
复杂 碧(王白石) 15 25 35 程(禾口王) 34 24 15

通过单字与词组取码卡片,复习字根码,练习取码方法。

Word-statistic

和码字形技术的在线练习软件中有:单字分块取码,衍生字根,与词组取码的练习项目;

在线教学软件:
复杂字与词组取码练习:www.HeChinese.net/HeInput/Lesson04

Word-statistic

Word-statistic

10以上的中国学生1-2小时,外国成年学生2-3个小时,5-6岁的儿童4-6个小时,能学完本章的内容,课后需多做练习以提高熟悉程度。