问题描述:
任务运行失败,报错超出内存限制。
原因分析:
数据开发所占用的内存资源超过工程设置的上限。
解决方案:
可以根据实际运行任务情况,参考 机器要求 适当调整 Tomcat的JVM内存和任务运维的资源控制的数值
使用API取数,点击「数据预览」报错 Http request error,如下图所示:
FineDataLink 默认超时是10s,耗时长的api会提示超时。
参考 FDLTimeout 在API Header 内使用 FDLTimeout 字段设置超时时间。
使用API取数,点击「数据预览」报错 json format is illegal,如下图所示:
4.0.20 版本中加了json格式校验,API 的 body 请求中不再支持写入注释。
清除 body 中的注释即可。
4.0.21 已经支持使用使用注释,可升级工程解决。
任务运行失败,报错提示[数据关联]: Spark执行错误- org apache spark sql. execution joins .exception.N2NInterruptException - null
spark 保护机制,避免数据量极速膨胀触发服务器宕机,通常在关联结果膨胀超过5倍 + 关联数据量大于 1kw出现,属于正常现象。
满足下面所有条件,判定为不合理场景:
1)存在N:N的情况
2)N:N步骤的结果数据量超过1kw
3)N:N膨胀系数>=5
例如,100w 数据和 500w 数据N:N结果为2000w数据,那么N:N膨胀系数为: 2000w/500w =4,或者2000w/100w =20
gpdfist 文件不支持放置路径有空格
放置文件的路径下有空格,换个文件夹放置,并重启gpfdist进程,配置并行装载方案详情参见:配置Greenplum(并行装载)数据源
用户将两个来源的数据通过「Spark SQL」算子 union 后写入到目标表,写入方式为「清空数据再写入」,发现写入的数据不全,只写入了一张表的数据。
数据写不全原因:目标表存在唯一索引(自增 ID 主键),写数时索引冲突。
任务执行成功原因:FineDataLink 写入方式选择「清空数据再写入」时,遇到冲突会默认跳过。
在 配置简道云数据源 中将简道云数据连接请求失败重试次数调整的略大一些,默认值为5.
问题描述:任务运行失败,日志报错Table doesn't exist
简道云字段过长,字段类型不匹配
通过字段设置修改对应字段的长度
数据预览界面报错SparkSQL语法错误: Syntax error at or near 订; line 1 pos 18
SparkSQL 不支持中文字段
在语法中去掉中文。
使用FineDataLink从SAP抽取数据,超过10个任务后面的任务报错:The current pool size limit is 10 connections.
这是SAP服务器配置了最大连接限制
请参考SAP相关配置说明,修改最大连接限制:配置 SAP 服务器的最大连接限制
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
Submitted successfully
Network busy