识别码的组成和判断 -第12课
小崔老师: 我们知道,一个合字体的取码规则是这个字的一、二、三、末字根,这只是针对四个字根以上的汉字。如果是这个字只有二个或三个字根构成,比如“叭”,这时怎么输入呢?
小磊同学: 只键入这两个字根的编码不行吗?
小崔老师: 我们试试,在状态下键入“叭”的两个字根的,KW,我们发现出现在第一条的是“只”字,原来“叭”与“只”都是由字根“口”和“八”组成的,其编码也是KW。
小磊同学: 那怎么办呢?
小崔老师: 由于编码少,信息量不足,会造成重码。我们要想办法把这两个字加以区别。
你注意到没有,“叭”是左右型汉字,“只”是上下型汉字。
我们给这两个字加上字型代号,以区别它们:
叭: K W 1 只: K W 2
小崔老师: 我们把后面这个数字叫做字型代码,用来补充字根的不足。现在这两个字的编码就不一样了!
小磊同学: 噢,我猜到了!是不是用这个数字作为识别码?输入KW1就是“叭”,输入KW2就是“只”?
小崔老师: 假设你说得对,我们再看下面这个例子怎么办:
比如“洒”、“沐”、“汀”三个字,字根编码都是IS,并且字型都是左右型的,字型代码都是1。
小磊同学: 噢,看来字型代码并不能消除重码!
小崔老师: 别泄气,我们再找一找这些字有什么不同。你注意到没有,这三个字的最后一笔是不同的。“洒”的最后一笔是横,“汀”的最后一笔是竖勾,“沐”的最后一笔是捺,这些笔划都有区位代号,你还记得吗?
小磊同学: 噢,知道,横竖撇捺折,分别在12345区。
小崔老师: 这样,我们就可以用最后一个笔划代号来区分这几个字了。“洒”是IS1,“汀”是IS2,“沐”是IS4。我们把这个数字叫做末笔代码。
小崔老师: 现在我们有两个数字来区别基本字根相同的字,一个是字型代码,一个是末笔代码。这两个识别码都是数字,不便直接输入,最好能把它们转化为字母代码。你还记得我们前面讲的区位号吗?
小磊同学: 记得,就是11、12、13,一直到55的那些数字吧!
小崔老师: 不错。既然字型代码和末笔代码单独都不能区分所有的重码,我们就把这两个数字合起来,组成一个数字,我们把这个两数字与区位号联系起来,用区位号对应的字母作为识别码。
小磊同学: 原来我一直以为那些区位号没有什么用,原来可以当作识别码!
小崔老师: 我们来看看识别码的构成。把汉字的末笔代号作为十位,字型代号作为个位,就组成了一个二位数,对应区位上的字母,就是识别码,又称为“末笔字型交叉识别码”。