正在查看旧版本。 查看 当前版本.
与当前比较 查看页面历史
« 前一个 版本 4 下一个 »
OneHot编码是将类别变量转换为机器学习算法易于利用的一种形式的过程。它是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的索引之外,其它都是零值,它被标记为1。(即:标记位置为1,其他位置为0)我们编码后的结果是一个稀疏向量,稀疏向量就是有特征数量,特征索引和特征值组成。
输入
一个输入端口,用于接收前置节点传下来的数据集。
输出
一个输出端口,用于输出接收到的数据集。
参数名称
说明
备注
选择特征列
用于设置待选择的特征列
必填
使用“动物种类分类数据”,选取type列转换为OneHot编码,输出结果为数组组形式展示,(7,[1],[1.0])表示为总共有7个类别,索引为1的位置标记为1,其他位置都是0。