Skip to content

更新单字信息

原始数据:

  • 字音和字频信息: ./tools/data/chars.txt
  • 辅助码编码和拆分信息: ./tools/data/moran_chai.txt

执行如下命令以更新所有单字信息:

bash
make quick

INFO

辅助码编码和拆分数据是有序的。第一个编码被视为「正码」,其他编码被视为「容错码」。词库中收录的编码将仅由「正码」构成。

本方案所采用的自然码底表没有区分「正码」和「容错码」,因此有些顺序可能还没纠正过来。如果发现了相关问题,请考虑提出 issue 或提交 PR。

更新词库辅助码

如果修改了单字辅助码的正码,必须更新内置词库的辅助码:

bash
make all

若有其他词库还需要转换,可用如下命令:

bash
uv run tools/schemagen.py update-compact-dict --rime-dict <rime词>

该命令仅支持 compact 格式的词库。

导出方案

make dist 命令会将构建好的方案整体拷贝到一个单独的目录中,便于后续处理。

bash
make dist
make dist DESTDIR=<指定另一个地>

导出简化字方案

bash
make dist
./make_simp_dist.sh

此时 dist 目录下就是简化字版的配置。

添加词库

少量词语添加可直接无码增加到 moran.words.dict.yaml 中。

如需添加大量词语,请将词库整理成如下 Tab 分隔的格式,保存为一个 tsv 文件(如 ciyu.tsv):

词语	ci yu	114
你好	ni hao	514

然后使用如下命令:

bash
uv run tools/schemagen.py gen-dict --input-dict ciyu.tsv --compact

INFO

--compact 表示输出词库只使用「正码」。若无该选项,则词语编码会枚举所有正码和容错码的组合。

若使用 --compact,则日后可用 update-compact-dict 更新辅助码。若不使用,则建议保留原始输入,在更新单字辅助码后重新生成。

此时该工具会输出符合格式的词条:

词语    ci;ys yu;yw     114
你好    ni;re hk;nz     514

这些词条就可以直接导入 Rime 词库了。

方案测试

要测试方案的出厂行为,可先导出一份干净的方案,然后在对应的目录中运行 rime_api_console

bash
rm -rf dist
make dist
cd dist
$LIBRIME_DIR/build/bin/rime_api_console

注意, rime_api_console 可能没有附于 Rime 发行版或 librime 包裹中,因此你可能需要手动 编译 librime

此外,本方案还有 Mira 单元测试集。要运行这些测试,需要首先 自行编译 mira,将它安装到 PATH 中。安装完成后,直接运行 make test 即可。