「字段设置」算子可对接入数据的字段做以下操作:
删除部分字段。
字段重命名。
修改字段类型。
本文在 数据关联 示例基础上,新增「字段设置」功能。
1)在「数据左合并」和「保存到新表」两个算子间新增算子「字段设置」,「字段设置」算子用线条跟「数据左合并」和「保存到新表」连起来。如下图所示:
此时点击「字段设置」算子,可查看左合并后的表字段。如下图所示:
本节为展示「字段设置」功能,将做以下操作:
删除「姓名1」字段
「姓名」字段重命名为「学生姓名」
「英语成绩」和「数学成绩」字段类型改为 int
上述操作做完后,「字段设置」界面如下图所示:
各设置项介绍如下表所示:
要求:
不允许为空
限制长度<=30字符
只能是字母 (a-z A-Z)、数字 (0-9)、下划线(_)、或中文的组合
不能包含空格
不能与其他有效字段名重复
注:重复字段名检测,会根据字段修改的顺序进行判读,发现重名列时报错「Spark列重复」。
例如存在AB字段,将A改为B,将B改为C,由于A改为B时,存在B名称字段,因此会报错。
可设置字段类型:
int
long
float
double
date
timestamp
binary
boolean
varchar
「更改」右侧那列图标:,分别代表删除字段和恢复默认的意思
当字段类型为时间格式时,「时间格式」列才会显示
下拉框内容为:
1)yyyy-MM-dd HH:mm:ss
varchar 转 timestamp 默认填入
timestamp 转 varchar 默认填入
其中,yyyy 表示 4 位的年份;MM 表示月;dd 表示天;HH 表示小时(24小时制);mm 表示分钟;ss 表示秒;SS 表示毫秒
2)yyyy-MM-dd
varchar 转 date 默认填入
date 转 varchar 默认填入
3)yyyyMMddHHmmss
4)yyyyMMdd
点击「保存到新表」算子,目标表选择「自动建表」,表名称为「ceshi1357」。如下图所示:
1)点击右上角「保存」,保存数据转换的设计。如下图所示:
2)回到 数据开发界面,点击右上角「保存并运行」,日志有执行成功信息表示任务成功运行。
可以看到表 ceshi1357 的数据如下图所示:
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
Submitted successfully
Network busy