更新单字信息
原始数据:
- 字音和字频信息:
./tools/data/chars.txt
- 辅助码编码和拆分信息:
./tools/data/moran_chai.txt
执行如下命令以更新所有单字信息:
make quick
INFO
辅助码编码和拆分数据是有序的。第一个编码被视为「正码」,其他编码被视为「容错码」。词库中收录的编码将仅由「正码」构成。
本方案所采用的自然码底表没有区分「正码」和「容错码」,因此有些顺序可能还没纠正过来。如果发现了相关问题,请考虑提出 issue 或提交 PR。
更新词库辅助码
如果修改了单字辅助码的正码,必须更新内置词库的辅助码:
make all
若有其他词库还需要转换,可用如下命令:
uv run tools/schemagen.py update-compact-dict --rime-dict <rime词库>
该命令仅支持 compact 格式的词库。
导出方案
make dist
命令会将构建好的方案整体拷贝到一个单独的目录中,便于后续处理。
make dist
make dist DESTDIR=<指定另一个地址>
导出简化字方案
make dist
./make_simp_dist.sh
此时 dist
目录下就是简化字版的配置。
添加词库
少量词语添加可直接无码增加到 moran.words.dict.yaml
中。
如需添加大量词语,请将词库整理成如下 Tab 分隔的格式,保存为一个 tsv 文件(如 ciyu.tsv):
词语 ci yu 114
你好 ni hao 514
然后使用如下命令:
uv run tools/schemagen.py gen-dict --input-dict ciyu.tsv --compact
INFO
--compact
表示输出词库只使用「正码」。若无该选项,则词语编码会枚举所有正码和容错码的组合。
若使用 --compact
,则日后可用 update-compact-dict
更新辅助码。若不使用,则建议保留原始输入,在更新单字辅助码后重新生成。
此时该工具会输出符合格式的词条:
词语 ci;ys yu;yw 114
你好 ni;re hk;nz 514
这些词条就可以直接导入 Rime 词库了。
方案测试
要测试方案的出厂行为,可先导出一份干净的方案,然后在对应的目录中运行 rime_api_console
。
rm -rf dist
make dist
cd dist
$LIBRIME_DIR/build/bin/rime_api_console
注意, rime_api_console
可能没有附于 Rime 发行版或 librime 包裹中,因此你可能需要手动 编译 librime。
此外,本方案还有 Mira 单元测试集。要运行这些测试,需要首先 自行编译 mira
,将它安装到 PATH
中。安装完成后,直接运行 make test
即可。