转换汉字拆分表为多多码表

使用此工具可以将一个格式化的汉字拆分表转换为码表文件。程序使用一个按键映射表文件,将汉字拆分表中的拆分文字替换为按键映射表中定义的键盘按键,从而达到汉字拆分表到多多码表转换的目的。

注意 注意

该工具主要针对于一般的形码类编码方案,即汉字由拆分的字根组成,字根由按键映射定义。
可以理解为,使用键盘映射表替换拆分文件中的字根字符为按键字符。

汉字拆分表

汉字拆分表应该是一个一行多列的文本文件,每列使用Tab字符间隔。

程序认为,该文件每一行定义一个汉字的多种拆分组合。其中,第1列必须为被定义拆分的单字,其余列为改字的多种拆分串。

注意 注意

该文件可以使用Excel导出(或复制--->粘贴)获得

啊	口阿	口阝可	口阝~口	口阝K口
阿	阝可	阝~口		阝K口
埃	土矣	土厶矢		
挨	扌矣	扌厶矢		
哎	口艾	口艹~/口艹乂		口艹A
唉	口矣	口厶矢		
哀		亠口~		亠口Y
皑	白岂	白山己		
癌		疒品山	疒口口口山	
...

键盘影射表

键盘影射表应该是一个一行两列的文本文件,每行的第一列定义一个按键字符,第二列定义使用此按键的所有字根。由于每个字根均只有一个字长度,因此各字根之间不需间隔符号。

q	犬(犭)
w	无(旡)尢(兀)夂攵囗
e	卩()阝
r	人(亻入)彳日(曰⺜)
t	亠
y	月(⺝)言(讠)羊()衣(衤)聿(肀)
...

如果准备工作已经完成,请按照如下步骤生成码表文件

  1. “工具”菜单上单击“单字码表生成”

  2. 在弹出窗口上,单击“拆分序列表”。选择您的汉字拆分表文件。

  3. 单击“键盘映射表”。选择您的键盘映射表文件。

  4. 确认所有文件路径无误后,单击“生成”按钮。

  5. 如果成功,程序生成的码表文件将与"拆分表"保存在同一路径,使用固定文件名为“[ 生成的单字码表 ].txt”。生成过程中出现的错误记录在文件“[ error_码表生成 ].txt”中

  6. 注意 注意

    可以在窗口左侧文本框中,直接输入以上所述的三个文件路径。确认无误后,单击“生成”按钮

  7. 生成完毕后,结果应类似下图所示:

命令行调用格式为:

mbEditer.exe /do=单字码表生成 /单字拆分表文件="文件路径" /键盘映射表文件="文件路径"

以下内容试图使用自然语言方式描述此工具的运作流程,仅供参考。

  1. 对于已知的键盘映射表,读取该文件后应可获得字典表KeyDic。使用KeyDic,对于给定的一个字符,可求出唯一对应按键。

  2. 对于已知的汉字拆分表,使用Tab字符作为间隔,读取该文件每一行中的多列内容,表示为Hanzi1,Cai1,Cai2,Cai3...

  3. 求取Cai1中的每一个字符在KeyDic中的对应按键,保存为Res1

  4. 将字符串 Hanzi1+(Tab字符)+Res1+(换行符) 保存到结果文件中

  5. 如果存在,保存 Hanzi1+(Tab字符)+Res2+(换行符),保存 Hanzi1+(Tab字符)+Res3+(换行符) 

  6. ...

  7. 直到文件末尾