词干过滤器的功能目前只适用于英文分词,用于去除词尾。例如:workers,其中s是词尾,work是词根,er是词缀,这个词除去词尾,剩下的worker就是词干。
对话框选项
分词字段
选择要进行词干过滤的分词字段。
文档字段
选择要深度处理的文档字段。
深度处理
如果勾选深度处理选项,包含在文档中的词也会被处理。这意味着,文档本身也发生了变化,同时会耗费更多的时间。
追加原文档
如果勾选此项,即使已经选择深度处理选项,也会保留深度处理的原始文档字段。深度处理后的文档字段和原文档字段都会在输出表中输出。
端口
输入端口
0 |
输入表 |
输出端口
0 |
词干过滤表 |