汉字的拆分原则和识别码 - 五笔速成自学教程第4节
一、书写顺序:拆分“合体字”时,一定要按照正确的书写顺序进行。例:“新”只能拆成“立、木、斤”,不能拆成“立、斤、木” “中”只能拆成“口、丨”,不能拆成“丨、口”;“夷”只能拆成“一、弓、人”,不能拆成“大、弓”。
l 、取大优先:“取大优先”,也叫做“优先取大”。按书写顺序拆分汉字时,应以“再添一个笔画便不能成其为码元”为限,每次都拆取一个“尽可能大”的,即尽可能笔画多的码元。例1:世:第一种拆法:一、凵、乙(误)第二种拆法:廿、乙(正)显然,前者是错误的,因为其第二个码元“凵”,完全可以向前“凑”到“一”上,形成一个“更大”的已知码元“廿”。例2:制:第一种拆法:、一、冂、丨、刂(误)第二种拆法:、冂、丨、刂(正)同样,第一种拆法是错误的。因为第二码的“一”,作为“”后一个笔画,全可以向前“凑”,与第一个码元“”凑成“更大”一点的码元“”。总之,“取大优先”,俗称“尽量往前凑”,是一个在汉字拆分中最常用到的基本原则。至于什么才算“大”,“大”到什么程度才到“边”,这要等熟悉了码元总表,便不会出错误了。
2、 兼顾直观:在拆分汉字时,为了照顾汉字码元的完整性,有时不得不暂且牺牲一下“书写顺序”和“取大优先”的原则,形成个别例外的情况。例1:国:按“书写顺序”应拆成:“冂、王、丶、一”,但这样便破坏了汉字构造的直观性,故只好违背“书写顺序”,拆作“囗、王、丶”了。例2:自:按“取大优先”应拆成:“亻、乙、三”,但这样拆,不仅不直观,而且也有悖于“自”字的字源(这个字的字源是“一个手指指着鼻子”)故只能拆作“丿、目”,这叫做“兼顾直观”。
3、 能连不交:请看以下拆分实例:于:一十(二者是相连的)、二丨(二者是相交的)丑:乙土(二者是相连的)、刀二(二者是相交的)。当一个字既可拆成相连的几个部分,也可拆成相交的几个部分时,我们认为“相连”的拆法是正确的。因为一般来说,“连”比“交”更为“直观”。
4、 能散不连:笔画和码元之间,码元与码元之间的关系,可以分为“散”、“连”和“交”的三种关系。如:倡:三个码元之间是“散”的关系;自:首笔“丿”与“目”之间是“连”的关系;夷:“一”、“弓”与“人”是“交”的关系。码元之间的关系,决定了汉字的字型(上下、左右、杂合)。
(a)几个码元都“交”“连”在一起的,如“夷”、“丙”等,便肯定是“杂合型”,属于“3”型字,不会有争议。而散根结构必定是“1”型或“2”型字。
(b)值得注意的是,有时候一个汉字被拆成的几个部分都是复笔码元(不是单笔画),它们之间的关系,在“散”和“连”之间模棱两可。如:占:卜口两者按“连”处理,便是杂合型(3型)。两者按“散”处理,便是上下型(2型正确)。严:一厂后两者按“连”处理,便是杂合型(3型)后两者按“散”处理,便是上下型(2型正确)。当遇到这种既能“散”,又能“连”的情况时.我们规定:只要不是单笔画,一律按“能散不连”判别之。因此,以上两例中的“占”和“严”,都被认为是“上下型”字(2型)。
(c)作为以上这些规定,是为了保证编码体系的严整性。实际上,用得上后三条规定的字只是极少数。
当一个字拆不够4个码元时,它的输入编码是:先打完码元码,再追加一个“末笔字型识别码”,简称“识别码”。
一、“识别码”的组成:它是由“末笔”代号加“字型”代号而构成的一个附加码。由于教不得法,以前许多人对“识别码”望而生畏。其实,按如下做法,你只要5分钟定能学会:
“1”型(左右型)字:码元打完之后,补打1个末笔画即等同于加了“识别码”。例: 沐:氵木丶(“丶”为末笔,补1个“丶”)汀:氵丁丨(“丨”为末笔,补1个“丨”)洒:氵西一(“一”为末笔,补1个“一”)
“2”型(上下型)字:码元打完之后,补打由2个末笔画复合构成的“码元”即等同于加了“识别码”。例:华:亻匕十(末笔为“丨”,2型,补打“”作为“识别码”)字:宀子二(末笔为“一”,2型,补打“二”作为“识别码”)参:厶大彡(末笔为“丿”,2型,补打“”作为“识别码”)
“3”型(杂合型)字:码元打完之后,补打由3个末笔画复合而成的“码元”即等同于加了“识别码”。例:同:冂一口三(末笔为“一”,3型,补打“三”作为“识别码”)串:口口丨(末笔为“丨”,3型,补打“”作为“识别码”)国:囗王丶氵(末笔为“丶”,3型,补打“氵”作为“识别码”)至于为什么这些“笔画”可以起到“识别码”的作用,你只要仔细研究一下区位号的设计与“识别码”的定义便会恍然大悟。
五笔速成自学教程: