汉字的分类与码法规则 - CDS教程3第1节
的码法是从汉字中拆分出1~4个字根,再根据字根所属的码键来给汉字编英文字母代码的一种码法。而汉字的结构比较复杂:在有的汉字中字根很多(多于4个),而在有的汉字中字根又很少(仅1个)。多了怎么办?少了又如何处置?从汉字或汉字的一部分中拆分字根,往往因拆分方法不同会导致所拆取的字根及其字根的个数不相同。而且,组成汉字的各字根有时是交织在一起难以截然分开,某一笔画归属于前一字根与归属于后一字根其编码结果会不相同。所以说五笔字型编码要制定的一些“码法规则”是必需的。
编码的编制者要遵循这些“码法规则”来编制打字软件;编码的使用者在使用该软件时也要遵循这些“码法规则”才能以该软件进行电脑打字。
五笔字型编码所制定的码法规则有:“编码规则”、“取码规则”及“补码规则”。全部汉字皆需用到“编码规则”,大部分汉字还要加用“取码规则”,有一部分汉字还要再加用“补码规则”。
◆ 第一节 汉字的分类与码法规则
一。汉字的分类
汉字按是否为字根而分的分类如表1所示。
表1 按是否为而分的汉字分类表
—————————————————————————————
1 键名汉字 (25个) 汉 一根汉字 < 2 (加附) (100个) 3 单笔汉字 ( 5个)
—————————————————————————
1 够根汉字 (6000多个) 字 非一根汉字 < 2 少根汉字 (400多个)
—————————————————————————————
说明如下:
1.一根汉字
字根个数为1的汉字称作“一根汉字”。
一根汉字又分“键名汉字”、“字根汉字(加附)”及“单笔汉字”三种。
(1)
代表码键键名的“一根汉字”称作“键名汉字”;它们就是“键名字根”,其数量是25个。在讲五笔字根时称其为“键名字根”;在讲输入“汉字”时称其为“键名汉字”。
(2)字根汉字(加附)
除键名汉字之外,由两个及两个以上单笔画组成的“一根汉字”称作“字根汉字(加附)”; “字根汉字(加附)”又分为“字根汉字”及“字根部首”两部分。
注:“字根汉字(加附)”这个名称很别扭,这是没有办法的,知其是“字根汉字”还要附加“字根部首”就行了。在以往的五笔教材中被称作“成字字根”,则连理解都有困难:“成字字根”中竟包含有“不成汉字”的“部首字根”;且“字根”与“汉字”在阐述上也分不开。
A.字根汉字
在“字根汉字(加附)”中有68个其本身是汉字,称之为“字根汉字”;它们就是“汉字字根”。在讲五笔字根时称其为“汉字字根”;在讲输入“汉字”时称其为“字根汉字”。
B.字根部首
在“字根汉字(加附)”中有32个其本身不是汉字(它们是“汉字的偏旁部首”),称之为“字根部首”;它们就是“部首字根”。在讲五笔字根时称其为“部首字根”;在讲输入“汉字”时称其为“字根部首”。
注:
在表1中把“字根部首”划归于“汉字”的范畴内。这不好理解,但可这样来理解:从正常意义上讲“部首”不是“汉字”,但从能以五笔打字软件打出“字符”这一角度上讲,在五笔编码中我们把这些“字根部首”视同为“汉字”。
(3)单笔汉字
仅由一个单笔画组成的“一根汉字”称作“单笔汉字”;它们就是“一”、“丨”、“丿”、“丶”、“乙”这五个字。
2.非一根汉字
字根个数多于1的汉字称作“非一根汉字”,又称“一般汉字”。非一根汉字又分“够根汉字”及