1. 概述
1.1 版本
FineDataLink 版本 | 功能变动 |
---|---|
3.5.1 | 「数据转换」节点新增算子「JSON 解析」;支持将 JSON 结构的数据输出为行列格式 |
4.1.1 | 将 API body 的响应字段名称从 default 改为 responseBody |
4.1.6.2 |
|
4.1.13.3 | JSON 解析遇到控制字符时不报错,解析后就按照转义字符进行解析 |
1.2 应用场景
通过 API 取数,或者从一些非关系型、关系型数据库里读取数据时,存在取到的数据包含 JSON 格式数据的情况。
而且许多情况下,JSON 格式的数据并不标准,并不能直接映射成二维表数据使用。
「JSON 解析」算子可以解析 JSON 结构的数据,输出行列格式的数据。
1.3 功能简介
「JSON 解析」算子通过获取上游输出的 JSON 数据,将其自定义解析成需要的字段并输出给下游。
示例:
例如某列 JSON 为:
[ { "category": "reference", "author": "Nigel Rees", "title": "Sayings of the Century", "price": 8.95 }, { "category": "fiction", "author": "Evelyn Waugh", "title": "Sword of Honour", "price": 12.99 }, { "category": "fiction", "author": "Herman Melville", "title": "Moby Dick", "price": 8.99, "isbn": "0-553-21311-3" }, { "category": "fiction", "author": "J.R.R. Tolkien", "title": "The Lord of the Rings", "price": 22.99, "isbn": "0-395-19323-5" }]
「JSON 解析」算子解析后,为:
注:JSON 解析时,不支持同时提取不同层级的字段并扩展,用户可以使用多个 JSON 解析算子进行多个层级的解析,详情参见本文 3.4 节。
2. 功能说明
「JSON 解析」算子配置界面如下图所示:
2.1 选择源字段
在下拉框中选择待解析的字段。
4.1.6.2 及之后版本,JSON解析支持同时解析多个字段,减少「简道云输入」多个复杂字段的解析成本,在「JSON解析」中添加解析多个字段的能力。
在源字段选择多个字段后,即可在「选择JSON节点」中同时解析多个字段,如下图所示:
如果上游为「API 输入」算子,一般默认选择 responseBody。如下图所示:
若上游为「DB表输入」或者其他输入算子,则可以选择需要解析的 JSON 来源字段。如下图所示:
2.2 解析后保留所有上游输出字段
未勾选该按钮,解析后的结果:只保留所选源字段解析后的数据。
以 JSON解析算子典型示例 文档中的示例为例:
2.3 解析 JSON 数据
选择 JSON 节点,即可解析:
所有生成JsonPath默认从根节点开始,生成完整的绝对路径,用户可手动修改。
注1:json 解析的时候建议选择最开始的节点,此时为绝对路径下的解析,否则直接勾选指定字段,使用相对路径解析,数据解析结果可能会有错误。
注2:可使用多个「JSON解析」算子解析「嵌套JSON」数据。
可手动编辑、删除字段。如下图所示:
3. 不同场景中JSON解析说明
3.1 解析全量字段数据
在「选择JSON节点」时,用户可以通过粘贴JSON文本的方式修改选择节点的内容,以防止出现上游有多行 JSON 文本流进时,因为第一行的JSON属性较少,导致其他json属性无法直接选择的情况。
例如,若选择节点处缺少需要选择的 JSON 属性,则可以手动粘贴包含需要选择的 JSON 属性文本,如下图所示:
然后即可在节点中选择想要解析的字段。
3.2 解析不同层级的字段
示例:
4.1.6.2 及之后版本,支持同时解析一个 JSON 源字段的数组部分和非数组部分。
例如想要解析在不同层级中的 class 和 name 字段,则可直接选择对应的字段,即可同时解析一个数据源的数组和非数组部分,如下图所示:
4.1.6.2 之前的版本则无法直接同时解析一个JSON源字段的数组部分和非数组部分。
使用「JSON解析」算子解析子表单数据时,希望解析出在不同层级中的 level 和 name 字段,如下图所示解析时,将报错:
json 解析结果行数不匹配。
原因是暂不支持:JSON 解析时,同时提取不同层级的字段并扩展。
解决方案:
可分两次进行解析,先解析出同层级的 level 和 department 字段,第二次解析出 department 下的 name 字段。
3.3 JSON 数据有多层级且不同层级存在同名字段
4.1.6.2 及之后版本,当 JSON 数据存在多层且有同名字段时,会自动给重名字段增加后缀,如下图所示:
3.4 多个 JSON 解析算子解析不同字段但解析后的字段同名
示例:
注:4.1.6.2 及之后版本不会出现此问题。
使用两个「JSON解析」算子,分别解析两个不同字段。但「选择JSON节点」时,两个「JSON解析」算子选择的字段名相同,都为 name 。如下图所示:
此场景下,若有多个「JSON解析」算子,解析后字段名称不能相同,需要修改解析后字段名称。否则,后面的同名字段会覆盖前面的同名字段。如下图所示: