重码汉字与补加末笔识别码_补码规则第1节
◆ 第四节 补码规则
一、重码汉字与重码率
当几个汉字的编码相同时,则这几个字被称作“重码汉字”。
在整个编码中重码汉字与所有入编汉字的字数之比,称作该编码的“重码率”。“重码率”低,就意味着汉字输入的便捷、快速,这是我们所追求的。
下面举些“够根汉字”及“一根汉字”重码的字例,因为这两类汉字皆无须加识别码。这样做,既能对重码的情况先有个了解,又能复习“编码规则”及“取码规则”。
1.够根汉字重码的举例
(1)多根汉字重码的举例
“锤”字取码即为编码:“钅丿一土”(qtgf),舍去的第4码是:“艹”(a);
“锺”字取码即为编码:“钅丿一土”(qtgf),舍去的第4码是:“曰”(j)。
(2)四根汉字重码的举例
“凭”字取码即为编码:“亻丿士几”(wtfm);
“赁”字取码即为编码:“亻丿士贝”(wtfm)。
2.一根汉字重码的举例
在一根汉字中,25个键名汉字与5个单笔画汉字是没有重码的,只有字根汉字(加附) 有重码,举例如下:
(1)字根汉字重码的举例
“雨”字,“单敲根”+“敲笔”即为编码:fghy;
“寸”字,“单敲根”+“敲笔”即为编码:fghy。
(2)字根部首重码的举例
“卩”字,“单敲根”+“敲笔”即为编码:bnh;
“阝”字,“单敲根”+“敲笔”即为编码:bnh;
“凵”字,“单敲根”+“敲笔”即为编码:bnh。
二、为何要补加末笔识别码
1.加末笔识别码的作用
“少根汉字”(三根汉字、二根汉字)的输入皆需补加末笔识别码。为何要多此一举呢?这是五笔字型编码为降低汉字编码的重码率而采取的一项措施。
那么为何补加末笔识别码后就能降低汉字编码的重码率呢?这是因为:
(1)少根汉字依字根而编的码,其编码字母数不足四个,允许在其末尾补加一码。
(2)少根汉字依字根而编的编码虽然相同,它们的末笔画不一定相同;即使末笔画相同,它们的字型不一定相同。补加末笔识别码就有可能使原先有重码的汉字不会重码。
比如说,有两个人叫“张军”,“张军”两字“不可能”把这两个人区分开来;但如果在“张军”后面加上个性别,变成“张军(男)”与“张军(女)”,这样就“有可能”把这两个人区分开来。“有可能”比“不可能”要好一些,这就是要补加末笔识别码的道理。
2.举字例说明
(1)三根汉字的字例
“甙”字的取码为:“弋艹二”(aaf);
“苷”字的取码为:“艹艹二”(aaf)。
“甙”与“苷”依字根而取的三码是重码,且末笔画也相同 —?— 都是“横”。但它们的字型不相同,“甙”是杂合型字,“苷”是上下型字(关于字型类别下面就讲到)。
将杂合型的“横”定为第3种“横”,其识别码为“d”,
将上下型的“横”定为第2种“横”,其识别码为“f”,
于是:“甙”字的编码为:aafd,而“苷”字的编码为:aaff;
这样一来这两个汉字就不会重码了。
(2)二根汉字的字例
“茸”字的取码为:“艹耳”(ab);
“邛”字的取码为:“工阝”(ab)。
“茸”与“邛”依字根而取的二码是重码。但“茸”字末笔画是“横”,而“邛”字末笔画是“竖”。它们的字型也不相同,“茸”是上下型字,“邛”是左右型字。
将上下型的“横”定为第2种“横”,其识别码为“f”;
将左右型的“竖”定为第1种“竖”,其识别码为“h”。
于是:“茸”字的编码为:abf,而“邛”字的编码为:abh;
这样一来这两个汉字就不会重码了。