原始码表格式说明

原始码表是多多生成输入法的主要依据文件,该文件必须是扩展名为txt的文本文件。多多支持文本的编码格式为UNICODE、ASIIC或UTF8。

的	de
一	yi
是	shi
了	le
不	bu
在	zai
人	ren
有	you
国	guo
他	ta
我	wo
这	zhe
中	zhong
大	da
个	ge
和	he
...

多多的原始码表格式,可以简单的看成两列,左列为词条,右列为编码,两列之间使用“Tab字符”分割。简单的做法是,您可以从微软Excel中复制两列,然后粘贴到文本文件中形成多多码表。但是,为了准确地实现更加丰富的功能,建议您仔细阅读以下内容。

  1. 文件中应每行定义一个编码和词条(可以是任意的文字组合,该词条也称为候选字词),对于同码词条,请分开多行定义。

  2. 每行使用“字词”+“Tab”符号+“编码”的格式保存(不包含引号)。

    • “Tab”是普通键盘上的Tab按键产生的字符;

    • 微软Excel表格复制到记事本文件中的列间隔字符与此Tab字符相同;

    • 候选字词中如果包含Tab字符,应使用“\t”(引号内,不包含引号)表示;

    • 候选字词中如果包含换行符,应使用“\r”(引号内,不包含引号)表示;

    • 候选字词中如果包含“\”字符,应使用“\\”(引号内,不包含引号)表示;

    • 编码中如果需要包含“#”字符,应使用“##”(引号内,不包含引号)表示;

  3. 候选列表显示时,原始码表中越靠前的字词显示的位置越靠前。

  4. 如果您需要使用小键盘中的字符按键作为编码键,请使用全角字符定义编码,否则多多自动将半角字符识别为主键盘上的按键。如:

    小	234
    键	3111551111254
    盘	33541425221
    笔	3143143115
    画	12512152
    ...
  5. 可使用“#1”(引号内,不包含引号)后缀置于编码末尾,指示该行字词为次显字词。所有的次显字词归类为次显码表,平时状态下,次显码表不被显示在候选列表中,当用户按下“码表切换”键时,显示次显码表,隐藏主码表候选。当用户再次按下“码表切换”键时还原为平时状态。

    我	wo
    沃	wo
    卧	wo
    薶	wo#1
    撾	wo#1
    龏	wo#1
    仴	wo#1
    ...

    如上示例,用户输入“wo”时,显示 我、沃、卧三个候选。当按下“码表切换”键时,显示 薶、撾、龏、仴四个候选,再次按下“码表切换”键时显示 我、沃、卧三个候选。

    更为详细的描述,请参见 多多次显码表

  6. 可使用“#a”(引号内,不包含引号)后缀置于编码末尾,指示该行字词为固顶字词。所有的固顶字词均不参与调频操作,即使用户开启了“自动调频”选项。

    以	yi
    已	yi
    一	yi#a
    ...

    如上示例,yi 一 总是排列在输入编码“yi”的对应候选列表第一位,用户开启“自动调频”时,只调整“以 yi”、“已 yi”两个候选。

    更为详细的描述,请参见 多多词频调整策略