本文以 MySQL 資料同步為例,將 demotest 資料庫中的「訂單資訊」、「庫存資訊」、「成本中心對照表」實時同步至 demo1 資料庫中。
需準備一個獨立部署的 FDL 工程,該工程已註冊 資料管道相關功能點
注:對外 Demo 平台上已準備好環境,可到 對外 Demo 平台 上從本文 2.2 節步驟開始建立管道任務。
根據實際情況選擇源端和目標端資料庫,資料管道支援的資料庫請參見:資料管道支援的資料源類型
在資料連結管理中配置源端和目標端的資料連結,便於在管道任務配置程式中,透過選擇資料源名稱來控制同步任務的讀取和寫入資料庫。詳情請參見:建立並管理資料源
基於需要設定資料管道任務的資料源,授予資料源配置的帳號在資料庫進行相應操作的權限。詳情請參見:資料庫環境準備概述
部署 Kafka 開源流處理平台作為中間軟體。詳情請參見:部署Kafka、配置傳輸佇欄
若需要使用資料管道的使用者不是超級管理者,則需要為對應使用者分配資料管道的使用權限。詳情請參見:管道任務管理權限
注:管道任務的來源端若為 MySQL、SQLServer、Oracle,若同一個庫中的多張表都需要實時同步,建議在一個管道任務中實現;若同一個庫中的多張表,每張表單獨配置一個管道任務,資料庫將承受較大壓力。
進入 FDL 工程,點選「資料管道」,建立一個管道任務。如下圖所示:
資料源選擇 fdl_demotest 資料連結後,點選右側的「資料源權限檢查」按鈕,可以查看資料源是否有日誌讀取權限。
同步類型選擇「存量+增量同步」,先對所有存量資料同步,然後持續同步新增變化。
同步物件選擇 demotest 資料庫中的「訂單資訊」、「庫存資訊」、「成本中心對照表」。如下圖所示:
更多設定項介紹請參見:配置管道任務-選擇資料來源
更多設定項介紹請參見:配置管道任務-選擇資料去向
1)如下圖所示:
2)點選「下一步」。
1)我們發現,目標表中表名稱標紅,這是因為目標表名稱中不能包含中文、特殊字元。
依次為待同步的三張表:修改目標表名稱,為目標表設定邏輯主鍵,如下圖所示:
「成本中心對照表」對應的目標表為cost,「訂單資訊」表對應的目標表為order,「庫存資訊」表對應的目標表為stock_test。
2.3.2 節步驟中,我們開啟了「同步時標記時間戳」按鈕、「目標端執行邏輯刪除」,目標表中新增_fdl_update_timestamp、_fdl_marked_deleted欄位。如下圖所示:
本步驟中,目標表可以選擇已存在表、可批量修改表名、主鍵相關說明等,詳情請參見:配置管道任務-表欄位映射
如下圖所示:
更多設定項介紹請參見:配置管道任務-管道控制
當某次任務運作期間髒資料達到1000條後,任務會異常中止
注1:限制最多10w行,且重啟任務後,會重置臨界值統計。
注2:若需要對產生的髒資料進行處理,詳情參見:髒資料處理
將源表結構變化、異常或髒資料導致的任務終止資訊以郵件形式通知用戶
1)可查看讀取行數、寫入行數。如下圖所示:
可看到「庫存資訊」表同步時產生 1 條髒資料,可參考 文檔 對髒資料進行處理。
2)demo1 資料庫中可查看到已同步的 3 張表。
「成本中心對照表」對應的目標表 cost 表資訊如下圖所示:
3)demotest 資料庫中的「成本中心對照表」中:
刪除 collid 為 1.01.02 的資料。
collid 為 1.01.03 的資料,fname 改為產品研發部。
新增 test 欄位。
demo1 資料庫中的 cost 表如下圖所示:
QQ 信箱收到源表結構變化的資訊:
點選「任務維運>管道任務>任務管理」,可查看任務運作狀態、資料同步效能、檢查異常情況、以及對異常進行處理等。如下圖所示:
詳情請參見:管道任務維運
實時管道任務運作一段時間後,想新增/刪除表物件、修改任務控制(2.3.4節)、修改進階設定(2.3.2節)、修改同步方式等,可參考 維度表輸入&資料聯動 進行操作。
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
反馈已提交
网络繁忙