页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

...

词典,用来满足用户根据不同专业领域制定不同的分词规范的需求,从而提高分词准确率。

名称

功能说明

生效范围

优先级

配置方式
界面
自定义词典

用户可以添加业务用词、新词(未被系统自带词典收录的),作为重新组合词序列的规范。

只为当前实验使用。

自定义词典的效果优先级>全局词典>系统自带词库。
(Ansj分词算法除外)

用户可通过两种方式输入自定义词:

  • 手动输入,每行填写一个自定义词;
  • 上传文件,只支持上传txt、dic、dict类型的UTF-8的文件,文件中每行填写一个自定义词且不超过一万行。
Image Removed
全局词典
在系统中所有实验中使用

在系统中所有实验中使用。

配置全局词典请参考引擎设置



Image AddedImage Modified

2.3.3 分词算法

由于不同分词算法各有优劣,产品提供的分词算法可以满足用户根据不同的需求选用不同的算法。

...