页面树结构
转至元数据结尾
转至元数据起始

概述

词袋是为了对句子进行分词,根据分隔符将句子分割开来,分成一个个独立的词语或者单词。常用于英文文本分割语句。

输入/输出

输入

一个输入端口,用于接收数据集

输出

一个输出端口,用于输出分隔后的结果

参数设置

参数配置

说明

备注

选择文本项

选择需要分割的文本列

必填

分隔符

输入指定的分隔符

必填

示例

使用“垃圾短信识别”数据,选择需要分割的文本列,设置”/”分隔符进行分割,输出结果如下图: