输入/输出
输入 | 没有输入端口 |
---|---|
输出 | 一个输出端口,与抽取、变换节点组合使用。 |
参数设置
参数名称 | 说明 | 备注 |
---|---|---|
特征项数 | 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 | 必填 |
示例
效果
使用“垃圾短信识别”数据,选择分词后的文本列_c2_seg_words_filtered,设置的特征项数为10,进行统计TF-IDF,输出结果如下图:
输入 | 没有输入端口 |
---|---|
输出 | 一个输出端口,与抽取、变换节点组合使用。 |
参数名称 | 说明 | 备注 |
---|---|---|
特征项数 | 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 | 必填 |
效果
使用“垃圾短信识别”数据,选择分词后的文本列_c2_seg_words_filtered,设置的特征项数为10,进行统计TF-IDF,输出结果如下图: