反馈已提交

网络繁忙

分页取数-分页方式为游标

  • 文档创建者:Wendy123456
  • 历史版本:10
  • 最近更新:Wendy123456 于 2024-04-09
  • 1. 应用场景

    用户想要同步钉钉通信录中的用户信息。

    2. 方案一

    4.1.3 以及之后的版本支持的方案。

    2.1 实现思路

    2.1.1 接口说明

    本文方案主要使用的是 获取部门用户详情 接口,要使用该接口,需要获取:Query参数(access_token)、Body 参数(dept_id;cursor;size,size 为分页大小,最大为 100)。

    • dept_id 通过 循环获取所有部门ID 获得,得到 dept_id 字段。

    • cursor 为分页查询的游标,最开始传 0 ,后续传返回参数中的 next_cursor 值。

    • size 自定义即可,最大为 100 。

    2.1.2 方案说明

    实现过程如下图所示:

    序号说明
    准备工作:参考 循环获取所有部门ID 方案,获得 dept_id 字段
    1

    为调用 获取部门用户详情 接口做准备,准备参数access_token、dept_id

    1)参数赋值节点:获取 access_token

    2)参数赋值节点:将 dd_dep 的 dept_id 字段设置为参数,便于后续作为请求参数写入 获取部门用户详情 接口取数

    2

    调用 获取部门用户详情 接口,获取用户数据,用户数据如下图所示:

    31.png

    设置分页取数方式为「游标」,更新初始值0,更新值为返回参数中的 next_cursor,每次分页按照游标参数${cursor}取数。

    分页结束条件为,当最后一次返回参数中,has_more 为 false 则表示没有数据了,停止分页取数。

    2.2 操作步骤

    2.2.1 准备工作

    本文方案主要使用的是 获取部门用户详情 接口,要使用该接口,需要获取:Query参数(access_token)、Body 参数(dept_id、cursor)。

    2.2.2 获取 access_token

    新建定时任务,拖入「参数赋值」节点,使用 获取企业内部应用的access_token 接口获取 access_token。如下图所示:

    将 access_token 作为参数输出。如下图所示:

    2.2.3 将 dept_id 输出为参数

    将 dd_dep 的 dept_id 字段设置为参数,便于后续作为请求参数写入 获取部门用户详情 接口取数。

    使用参数赋值节点,查询出API取数-钉钉获取所有部门ID获取的 dd_dep表中 dept_id 字段,如下图所示:

    将其设置为参数 depIds,如下图所示:

    2.2.4 分页取数

    新增数据转换节点,进入编辑界面后,拖入 API 输入算子,并调用获取用户信息接口,并写入 Query 参数,如下图所示:

    2.png

    勾选高级配置下的分页取数,并设置取数条件。

    分页方式选择游标,更新策略为初始值为 0,也就是分页参数${cursor} 首次为0

    更新值,也就是下一次取的 ${cursor} 值为响应参数 next.cursor,这个值要使用 JSONPath 表达式解析,如下图所示:

    设置分页结束条件为 下一次的响应值中 JSONPath 解析参数 has_more,当其为 false,也就是没有更多数据的时候,停止分页取数,如下图所示:

    该参数值为布尔类型,如下图所示:

    然后在请求参数 Body 中,设置游标 cursor 为分页取数设置的 ${cursor} 参数,并且 dep_id 为 2.2.3 节设置的参数 ${depIds} ,如下如所示:

    其后可以新增 JSON 解析算子,解析取出的用户信息,获取想要的数据,或者直接在响应体处理中解析 JSON ,如下图所示:

    然后即可使用 DB 表输出,将取出的数据写入指定的数据库中

    3. 方案二

    4.1.3 之前的版本支持的方案。

    3.1 实现思路

    3.1.1 接口说明

    本文方案主要使用的是 获取部门用户详情 接口,要使用该接口,需要获取:Query参数(access_token)、Body 参数(dept_id;cursor;size,size 为分页大小,最大为 100)。

    • dept_id 通过 循环获取所有部门ID 获得,得到 dept_id 字段。

    • cursor 为分页查询的游标,最开始传 0 ,后续传返回参数中的 next_cursor 值。

    • size 自定义即可,最大为 100 。

    3.1.2 方案说明

    实现过程如下图所示:

    60.png

    序号说明
    准备工作:参考 循环获取所有部门ID 方案,获得 dept_id 字段
    1

    为调用 获取部门用户详情 接口做准备,准备参数access_token、dept_id、cursor(参数列表中添加任务参数)

    1)参数赋值节点:获取 access_token

    2)数据同步节点:将 dd_dep 的 dept_id 字段写入到 dd_dep_temp 表中;若某部门下用户数小于 100 ,调用 获取部门用户详情 接口一次性将数据取完后,应该将本次循环所用的 dept_id 删除,下次循环用下一个 dept_id 取数,dd_dep 表为部门表,后续可与用户表关联,不能随意删除数据,所以新建临时表 dd_dep_temp

    3)参数赋值1节点:取 dd_dep_temp 表中 dept_id 字段的第一个值

    2

    调用 获取部门用户详情 接口,获取用户数据,用户数据如下图所示:

    31.png

    • 若has_more非空:将 has_more、next_cursor 输出为参数,为下次循环准备

    • 若has_more为空、userid非空,输出用户信息到 userid_test (用户信息表中)

    3

    has_more为false,即该部门ID下数据已取完:

    1)SQL脚本节点:删除本次循环所用的 dept_id

    2)数据转换1节点:参数 next_cursor 置0

    3)参数赋值3节点:将 dd_dep_temp 表的行数输出为参数

    • 参数赋值4节点:若行数大于0(dept_id 未取完),输出 dept_id ,供下次循环

    • 数据转换2节点:若行数小于等于0(dept_id 已取完) ,下次循环的 dept_id 置空

    4

    has_more为true,即该部门ID下数据未取完:

    参数赋值2节点:依然使用本次循环的 dept_id 做下次循环

    循环执行条件:参数 nextDepId 不为空

    3.2 操作步骤

    3.2.1 准备工作

    本文方案主要使用的是 获取部门用户详情 接口,要使用该接口,需要获取:Query参数(access_token)、Body 参数(dept_id、cursor)。

    3.2.2 添加任务参数

    cursor 参数为分页查询的游标,最开始传 0 ,后续传返回参数中的 next_cursor 值。本节为 cursor 赋予初始值 0 。

    新建定时任务,点击右上角参数列表,添加参数 nextCursor ,类型为数值,值为 0 。如下图所示:

    1701855000453094.png

    3.2.3 获取 access_token

    新建定时任务,拖入「参数赋值」节点,使用 获取企业内部应用的access_token 接口获取 access_token。如下图所示:

    1701854816766346.png

    将 access_token 作为参数输出。如下图所示:

    1701859854128317.png

    3.2.4 将 dept_id 输出为参数

    将 dd_dep 的 dept_id 字段写入到 dd_dep_temp 表中。

    若某部门下用户数小于 100 ,调用 获取部门用户详情 接口一次性将数据取完,应该将本次循环所用的 dept_id 删除,下次循环用下一个 dept_id 取数,dd_dep 表为部门表,不能随意删除数据,所以新建临时表 dd_dep_temp。

    1)拖入「数据同步」节点,将 dd_dep 表中的 dept_id 字段写入到 dd_dep_temp 中,写入方式选择清空目标表,再写入数据。如下图所示:

    SELECT dept_id FROM `wendy`.`dd_dep`

    1701860288947468.png

    2)右键点击「参数赋值」节点,选择「运行节点及下游」,在数据库中新增 dd_dep_temp 表,便于后续步骤中将 dd_dep_temp 表中的 dept_id 输出为参数。如下图所示:

    1701860663406735.png

    3)拖入参数赋值节点,将 dd_dep_temp 表中的第一个 dept_id 字段输出为参数 nextDepId 。如下图所示:

    SELECT dept_id FROM `wendy`.`dd_dep_temp` LIMIT 1

    1701860863592796.png

    3.2.5 调用接口取出用户数据

    1701861693100955.png

    循环容器中,调用 获取部门用户详情 接口,获取用户数据,用户数据如下图所示:

    1701861060114760.png

    • 若 has_more 非空:将 has_more、next_cursor 输出为参数,为下次循环准备。

    • 若 has_more 为空、userid 非空,输出用户信息到 userid_test (用户信息表中)。

    3.2.6 调用接口

    1)拖入「循环容器」节点,循环容器」内拖入数据转换节点,进入数据转换节点。

    2)拖入API输入算子,调用 获取部门用户详情 接口,获取用户数据,Body 内引用 nextDepId、nextcursor 参数。如下图所示:

    1701861290326921.png

    点击「数据预览」,如下图所示:

    用户信息在 result 字段中,需要进行解析。

    39.png

    3.2.7 解析数据

    1)拖入「JSON解析」节点,解析 result 字段,选择节点:has_more、dept_id_list、mobile、name、userid、job_number、title、next_cursor。

    需注意,当 has_more 字段为 false 时,是没有 next_cursor 字段的,因此,建议在 dd_dep 表中找到超过 100 用户数的部门ID,赋值给 2.2.3 节中参数 nextDepId 。

    1701862167584994.png

    2)点击「数据预览」,如下图所示:

    1701862215760751.png

    3.2.8 新增一列depids

    用户信息表后续可能与部门表 dd_dep 关联,所以本节新增一列 depids,用于后续作为左右合并的依据,使用「Spark SQL」算子实现。如下图所示:

    42.png

    3.2.9 结果输出

    1)拖入「参数输出」算子、「DB表输出」算子,将这两个算子分别与「Spark SQL」算子相连。

    2)右键点击「Spark SQL」算子,选择数据分发若has_more非空,将 has_more、next_cursor 输出为参数,为下次循环准备;若has_more为空、userid非空,输出用户信息到 userid_test (用户信息表中)。

    1701862682958756.png

    3)使用参数输出算子,将has_more、next_cursor 输出为参数。如下图所示:

    1701862912266910.png

    4)使用DB表输出算子,将用户信息输出到userid_test (用户信息表中),写入方式选择直接将数据写入目标表,userid 设为主键,主键冲突策略选择主键相同,覆盖目标表的数据如下图所示:

    1701863100200978.png

    5)点击右上角「保存」按钮。

    3.2.10 用户数量超过100

    若 has_more 为true,即该部门ID下数据未取完,依然使用本次循环的 dept_id 做下次循环。

    60.png

    1)拖入「条件分支」节点,拖入SQL脚本节点、参数赋值节点,SQL脚本节点、参数赋值节点分别与条件分支节点相连。

    2)设置条件分支节点,若 has_more 为 true ,执行参数赋值节点;若 has_more 为 false,执行SQL脚本节点。如下图所示:

    1701863549234009.png

    3)设置参数赋值节点,然使用本次循环的 dept_id 做下次循环。如下图所示,输出参数 nextDepId 。

    1701863677465507.png

    3.2.11 用户数量未超过100

    60.png

    若has_more为false,即该部门ID下数据已取完:

    1)SQL脚本节点:删除本次循环所用的 dept_id。

    2)数据转换1节点:参数 next_cursor 置0。

    3)参数赋值3节点:将 dd_dep_temp 表的行数输出为参数。

    • 参数赋值4节点:若行数大于0(dept_id 未取完),输出 dept_id ,供下次循环。

    • 数据转换2节点:若行数小于等于0(dept_id 已取完) ,下次循环的 dept_id 置空。

    删除本次循环所用的 dept_id

    本次循环所用的 dept_id 已将用户数据取完,下次循环需要用到下个 dept_id ,所以我们将本次循环所用的 dept_id 删除。如下图所示:

    DELETE  FROM  `wendy`.`dd_dep_temp`  WHERE dept_id = '${nextDepId}'

    48.png

    参数 next_cursor 置0

    参数 next_cursor 置0,为下次循环准备。

    1)拖入「数据转换」节点,进入「数据转换」节点。

    2)拖入Spark SQL算子,将参数 next_cursor 置0。如下图所示:

    select 0 as default_cursor

    49.png

    3)拖入「参数输出」算子,将 0 赋值给参数 nextCursor 。如下图所示:

    50.png

    4)点击右上角「保存」按钮。

    根据部门ID临时表的行数作判断

    将部门ID临时表(dd_dep_temp)的行数输出为参数:

    • 若行数大于0(dept_id 未取完),输出 dept_id ,供下次循环。

    • 若行数小于等于0(dept_id 已取完) ,下次循环的 dept_id 置空。

    1)拖入「参数赋值」节点,将部门ID临时表(dd_dep_temp)的行数输出为参数count。如下图所示:

    1701864633416884.png

    2)拖入「条件分支」节点、参数赋值节点、数据转换节点,将参数赋值节点、数据转换节点分别与条件分支节点相连。

    3)设置条件分支节点,若 count 小于等于0,执行数据转换节点;若 count 大于 0,执行参数赋值节点。如下图所示:

    1701864926657470.png

    4)若 count 大于0(dept_id 未取完),输出 dept_id ,供下次循环。设置参数赋值节点,输出参数 nextDepId 。如下图所示:

    1701865166616356.png

    5)若 count 小于等于0(dept_id 已取完),下次循环的 dept_id 置空 。

    进入数据转换节点,拖入Spark SQL算子,筛选出空数据,如下图所示:

    54.png

    拖入「参数输出」算子,将空数据赋值给参数nextDepId,由于调试值不能为空,此处随意填一个值即可,调试值不参与实际运行。如下图所示:

    55.png

    6)点击右上角「保存」按钮。

    设置循环容器

    设置循环容器节点,循环方式选择条件循环,执行条件为参数 nextDepId 不为空。如下图所示:

    1701866926503668.png

    3.2.12 效果查看

    「循环容器」节点执行情况如下图所示:

    某部门ID下有 303 个用户,分四次写入。

    1701867166869683.png

    3.2.13 后续步骤

    用户若想定期执行任务:

    1)需要在最前面加个节点,清空 userid_test 数据。如下图所示:

    62.png

    2)设置 执行频率 即可。








    附件列表


    主题: 数据开发
    已经是第一篇
    已经是最后一篇
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭

    联系我们
    在线支持
    获取专业技术支持,快速帮助您解决问题
    工作日9:00-12:00,13:30-17:30在线
    页面反馈
    针对当前网页的建议、问题反馈
    售前咨询
    采购需求/获取报价/预约演示
    或拨打: 400-811-8890 转1
    qr
    热线电话
    咨询/故障救援热线:400-811-8890转2
    总裁办24H投诉:17312781526
    提交页面反馈
    仅适用于当前网页的意见收集,帆软产品问题请在 问答板块提问前往服务平台 获取技术支持