更新单字信息
原始数据:
- 字音和字频信息:
./tools/data/chars.txt - 辅助码编码和拆分信息:
./tools/data/moran_chai.txt
执行如下命令以更新所有单字信息:
make quickINFO
辅助码编码和拆分数据是有序的。第一个编码被视为「正码」,其他编码被视为「容错码」。词库中收录的编码将仅由「正码」构成。
本方案所采用的自然码底表没有区分「正码」和「容错码」,因此有些顺序可能还没纠正过来。如果发现了相关问题,请考虑提出 issue 或提交 PR。
更新词库辅助码
如果修改了单字辅助码的正码,必须更新内置词库的辅助码:
make all若有其他词库还需要转换,可用如下命令:
uv run tools/schemagen.py update-compact-dict --rime-dict <rime词库>该命令仅支持 compact 格式的词库。
导出方案
make dist 命令会将构建好的方案整体拷贝到一个单独的目录中,便于后续处理。
make dist
make dist DESTDIR=<指定另一个地址>导出简化字方案
make dist
./make_simp_dist.sh此时 dist 目录下就是简化字版的配置。
添加词库
少量词语添加可直接无码增加到 moran.words.dict.yaml 中。
如需添加大量词语,请将词库整理成如下 Tab 分隔的格式,保存为一个 tsv 文件(如 ciyu.tsv):
词语 ci yu 114
你好 ni hao 514然后使用如下命令:
uv run tools/schemagen.py gen-dict --input-dict ciyu.tsv --compactINFO
--compact 表示输出词库只使用「正码」。若无该选项,则词语编码会枚举所有正码和容错码的组合。
若使用 --compact,则日后可用 update-compact-dict 更新辅助码。若不使用,则建议保留原始输入,在更新单字辅助码后重新生成。
此时该工具会输出符合格式的词条:
词语 ci;ys yu;yw 114
你好 ni;re hk;nz 514这些词条就可以直接导入 Rime 词库了。
方案测试
要测试方案的出厂行为,可先导出一份干净的方案,然后在对应的目录中运行 rime_api_console。
rm -rf dist
make dist
cd dist
$LIBRIME_DIR/build/bin/rime_api_console注意, rime_api_console 可能没有附于 Rime 发行版或 librime 包裹中,因此你可能需要手动 编译 librime。
此外,本方案还有 Mira 单元测试集。要运行这些测试,需要首先 自行编译 mira,将它安装到 PATH 中。安装完成后,直接运行 make test 即可。