输入/输出
输入 | 一个输入端口,用于接收数据集。 |
---|---|
输出 | 一个输出端口,用于输出派生列的结果。 |
参数设置
设置派生列的参数:
设置说明如下:
参数 | 说明 | ||
---|---|---|---|
添加表达式 |
| 新增表达式 |
|
修改已定义的派生列列名 | 在列表区选择表达式,单击 在列表区选择表达式,单击 修改 按钮后,修改列名再单击按钮后,修改列名再单击 增加 按钮。 |
目前派生列支持的函数有:
函数 函数名称 | 表达式函数及示例 | 说明 | |
---|---|---|---|
累积 | sum(<column>) over(partition by <columns> order by <columns>) | 对数字型字段进行累计计算。 | 字符拼接(拼接符)
|
字符拼接 (拼接符) | concat_ws("sep",str1,str2,...,strN) | 通过sep连接符将字符串拼接。
| 通过sep连接符将字符串拼接。Sep由用户自定义。Str:表示连接的字符。
|
字符拼接 | concat(str1, str2, ..., strN) | 不需要连接符,直接将字符串连接。 | 不需要连接符,直接将字符串连接。Str:表示连接的字符。
|
字符截取 | substring(<column>, pos[, len]) | 从字段中截取指定位置的len个字符。<column>:表示截取的字段;Pos:表示从第几个位置开始截取,设置为正整数;Len:表示一共取多少个字符,设置为正整数。从字段中截取指定位置的len个字符。
| |
小数点保留 | format_number(<column>, num) | 保留浮点型字段小数点位数。<column>:表示蛇者小数点位数的字段。Num:表示小数点后保留的位数,设置为0和正整数。保留浮点型字段小数点位数。
| |
内容提取(年) | year(<column>) | 截取时间字段中的年信息。 | 获取时间字段中的年信息。<column>:表示截取的字段。
|
内容提取(月) | month(<column>) | 获取时间字段中的月信息。<column>:表示截取的字段。截取时间字段中的月信息。
| |
内容提取(日) | day(<column>) | 截取时间字段中的日信息。 | 获取时间字段中的日信息。<column>:表示截取的字段。
|
内容提取(时) | hour(<column>) | 截取时间字段中的时信息。 | 获取时间字段中的时信息。<column>:表示截取的字段。
|
内容提取(分) | minute(<column>) | 获取时间字段中的分信息。<column>:表示截取的字段。
| |
内容提取(秒) | secondminute(<column>) | 获取时间字段中的秒信息。<column>:表示截取的字段。
| |
向上取整 | ceiling(<column>) |
| |
向下取整 | floor(<column>) |
| |
四舍五入 | round(<column>) |
|
示例
1、原先文本数据源有1000条数据,想要获取Date字段中关于年份的信息,选择派生列节点,表达式为“year(Date)”。
2、输出结果如图: