建立並管理資料源

  • 文檔創建者:Roxy
  • 編輯次數:24
  • 最近更新:Nikozhan 于 2025-06-03
  • 1. 概述

    1.1 版本

    FineDataLink 版本功能變動
    4.0.21
    • Tomcat獨立部署FDL, 「管理系統>資料連結>資料連結管理」處,遮蔽不支援的資料源類型

    • 資料連結名稱支援特殊字元` ~ ! @ # $ % ^ & * ( ) _ - + = { } [ ] | \ : " ; ' < > , . ? /

    4.1.3增加 fetchsize 參數配置
    4.1.5.1
    新增設定項:空閑連結強制回收臨界值、空閑連結可用性定期檢查時間臨界值
    4.1.12.3
    • 資料連結可放到資料夾中進行管理

    • 支援透過資料連結名稱、資料源類型、建立人搜尋已配置好的資料連結

    • 建立資料連結時,資料源分類優化,可透過資料源分類、支援形式、適配模組篩選資料源類型

    4.2.4.2建立資料連結選擇資料源類型時,基於當前工程環境,控制展示的資料源類型
    4.2.6.2

    1)資料連結管理處,點選某個資料夾時,表格中:

    • 新增測試結果

    • 閒置連結數的值中,不再展示最大閒置連結數

    2)資料連結管理處,資料連結目錄樹支援收起

    3)資料連結編輯頁面跳出後,頁面不進行重新整理,若有人從其他入口進入資料連結編輯頁面,會有編輯衝突提示

    4.2.6.4新增「引用關係」功能,支援查看資料連結和資源的引用關係

    1.2 應用場景

    FineDataLink 的資料開發、資料管道、資料服務、資料管理模組支援連結多種資料源進行資料的處理操作。

    在使用 FineDataLink 處理、同步資料前,您需要先定義資料連結,以便在執行資料處理操作時,透過「資料庫>資料連結名稱>資料表」,來確定資料的讀取和寫入位置。

    1.3 功能簡介

    本文講解如何在 FDL 中配置資料連結和管理資料連結。

    2. 建立資料連結

    2.1 前提條件

    詳情請參見:前提條件

    2.2 步驟說明

    1)管理者進入 FDL 工程,點選「管理系統>資料連結管理」頁面。點選「建立>資料夾」,可以使用資料夾對資料連結進行分類管理。如下圖所示:

    注:資料夾名稱不可為空,不可重名,不能超過 60 個字元;只可建立一級資料夾。

    在某資料夾中建立資料連結。如下圖所示:

    2)輸入資料連結名稱後,選擇資料庫類型,點選「下一步」按鈕。

    可透過搜尋資料庫名稱來快速選擇資料庫類型;也可透過資料源分類、支援形式、適配模組來篩選資料庫類型。

    注:所有資料夾下的資料連結名稱,均不能重名。

    注2:4.2.4.2 及之後版本,可選擇的資料源類型由當前工程環境控制。

    滑鼠懸浮在資料名稱右側的問號標識上,可顯示該資料源適配的模組。如下圖所示:

    注:4.2.4.2 及之後版本,問號標識處顯示的內容由當前工程環境控制。


    3)輸入資料庫的相關資訊。如下圖所示:


    以下為資料連結資訊的詳細解譯,不同資料庫要設定的連結資訊不同。

    每個資料庫的資料連結設定項請在 FDL 說明文檔中搜尋查看(範例:配置Oracle資料源)。

    配置
    介紹
    資料連結名稱給這個資料連結一個名稱,按使用者自己的習慣起名即可
    驅動

    連結資料庫所需要的驅動:

    • 預設:一小部分資料庫中內建了資料庫驅動,使用預設即可

    • 自訂:FineDataLink 中未內建驅動,需要使用者自訂驅動,詳細操作請參見:驅動管理

    資料庫名稱輸入要連結的資料庫的名稱
    主機輸入資料庫所在主機(或伺服器)的 IP
    輸入資料庫所在主機(或伺服器)的埠
    認證方式

    若資料庫支援多種認證方式,則點選會出現認證方式下拉框:

    • 帳號密碼:輸入資料庫的帳號和密碼

    • Kerberos認證:填入註冊過 kdc 的使用者端名稱和 keytab 金鑰路徑,詳情請參見:[平台]資料連結Kerberos認證

    編碼推薦使用預設
    模式
    • 部分資料庫需要選擇模式,需要先連結成功後才能選擇模式

    • 當資料庫不存在模式選擇,則無需進行模式選擇

    • 如果這些資料庫未進行模式選擇,則預設選擇的是第一個模式

    • 連結多模式的資料庫時使用 SQL 語句需要帶上模式名前綴進行搜尋

    注:需要正確選擇資料庫對應的模式,否則會導緻新增資料庫表時顯示「當前資料連結中無可用表」,只能透過 SQL 資料集進行取數

    資料連結URL自動生成的 URL ,無需特意配置

    點選「測試連結」,即可測試是否可以連結成功。

    若使用者不需要設定連結池,即可點選「儲存」。完成資料連結配置。

    2.3 連結池設定

    在連結資料庫時,可能需要進行一些進階設定,但大部分情況下是不需要設定的。

    我們可以根據需要選擇性設定,如下圖所示:


    2.3.1 進階設定

    名稱  druid學名預設值
    含義  
    最大活動連結數maxActive50
    連結池在同一時間能夠分配的最大活動連結的數量
    校驗語句validationQuery預設語句
    用來檢查連結是否有效的 SQL 語句,要求是一個查詢語句,常用select 'x' 。使用者可自訂該語句。
    獲取連結前檢驗testOnBorrow申請連結時執行 validationQuery 檢查連結是否有效
    最大等待時間maxWait10000

    獲取連結時最大等待時間,單位毫秒

    注:值設定為 0 不代表永不逾時,根據實際情況設定值的大小

    2.3.2 更多設定(不常用,如無特殊場景不建議修改)

    名稱
    druid學名預設值含義
    初始化連結數
    initialSize0初始化時建立物理連結的個數
    最小空閑連結數minIdle0
    連結池最小連結數量
    歸還連結前校驗testOnReturn
    歸還連結時執行validationQuery檢查連結是否有效
    開啟空閑回收器校驗testWhileIdle
    指明連結是否被空閑連結回收器(如果有)進行檢驗,如果檢查失敗,則連結將被從池中去除
    空閑連結回收器休眠時間timeBetweenEvictionRunsMillis-1
    在空閑連結回收器執行緒運作期間休眠的時間值,以毫秒為單位
    空閑連結回收檢查數

    numTestPerEvictionRun

    3
    在每次空閑連結回收器執行緒(如果有)運作時檢查的連結數量
    保持空閑最小時間值minEvictableIdleTimeMillis1800s

    連結保持空閑而不被驅逐的最小時間

    某資料連結空閑時間若超過保持空閑最小時間值,檢查


    空閑連結強制回收臨界值maxEvictableIdleTimeMillis25200s

    也就是7小時

    若資料連結空閑時間超過該值,該資料連結將從連結池移除
    空閑連結可用性定期檢查時間臨界值keepAliveBetweenTimeMillis

    80000ms

    也就是80s

    空閑連結的保持存活時間,可以確定在空閑一段時間後連結不會被意外關閉
    • fetchSize 設定

    fetchSize 參數是用於控制從資料庫中獲取資料的成成成批處理大小的設定。較小的 fetchSize 值會減少每次資料庫查詢的記憶體消耗,但可能需要更多的資料庫往返來獲取完整的結果集;較大的 fetchSize 值可以減少資料庫往返次數,但會增加記憶體使用量。可以根據你的需求透過設定 fetchSize 參數值,來優化資料庫查詢效能。

    若參數值 ≤ 0(例如:-20)則表示不開啟 fetchSize 參數。

    1)Oracle、DB2、Postgre 這三種資料庫必須設定 fetchSize 參數,所以若設定了≤0 的參數值,會自動分別被取代為 128、50、10000。

    2)其他資料庫預設情況下不開啟 fetchSize 參數。


    3)若為空則表明不配置此項參數。

    2.3.3 SSH 設定

    若使用者安全性要求高,需要使用 SSH 。可以直接勾選「使用SSH通道」,輸入對應資訊。

    注:驗證方法支援密碼和公用鍵,其中選擇「公用鍵」需要將檔案放置在 %FineDataLink%/webapps/webroot/WEB-INF/resources 下。

    點選「測試連結」,若提示連結成功,點選「儲存」儲存該配置。

    2.3.4 SSL 設定

    注:暫只支援 MySQL 資料庫

    1)在%FineDataLink%/webapps/webroot/WEB-INF/resources/certificates 中put 命令 CA 證件、使用者端證件以及使用者端金鑰,如下圖所示:


    2)勾選「使用SSL通道」,將檔案新增進對應位置。如下圖所示:

    3)點選「測試連結」,若連結成功點選「儲存」儲存該配置。

    3. 管理資料連結

    3.1 單個資料連結管理

    資料連結建立成功後,介面如下圖所示:

    注:使用者建立的資料夾、資料連結,預設具備使用和管理權限。

    滑鼠懸浮在資料連結名稱右側,可對資料連結做編輯、重新命名、複制、刪除、測試連結操作。如下圖所示:

    注:刪除資料連結前,可先查看資料連結的引用關係,確定該資料連結可以被刪除,不影響其他資源

    「資料連結管理」各設定項說明如下表所示:

    設定項說明
    測試連結測試資料庫配置是否成功
    編輯修改資料連結配置項
    重新命名重新命名該資料庫,不可重名,不可為空
    複制複制該筆資料庫,且資料連結名自動加 1 
    刪除刪除該資料庫
    資料連結資訊顯示資料庫類型和建立者

    需要注意以下幾點:

    • 未適配的資料庫類型右側不顯示圖示。

    • 在管理資料連結時,資料連結的名稱不能隨意改動。更新到本地的表與資料庫匹配依靠的是資料連結的名稱,如果修改資料連結的名稱,從該連結中取出的表將無法再更新。  

      如果是 SQL 資料集,也會導緻沒有「修改 SQL」的按鈕。

    • 如果更新本地儲存的表中的資料庫,例如由開發環境變化到生産環境,表名與表結構均一緻時,只需要修改資料連結的 URL 即可。本地儲存的表依照資料連結名依然可以更新資料。

    3.2 資料夾管理資料連結

    1)資料管理頁面介紹

    獨立部署工程:

    點選資料夾或根目錄,可透過資料連結名稱(不區分字母大小寫,支援模糊搜尋)、資料源類型(可多選,為表格中已有的資料源類型)、建立人(可多選,為表格中已有建立人)、測試結果(可多選,4.2.6.1 及之後版本新增搜尋資料連結。如下圖所示:

    表格內容介紹如下表所示:


    列名說明
    活動連結佔比

    當前活動連結數/最大活動連結數

    1)「最大活動連結數」為連結池最大可建立的連結數,若最大連結數是 10 ,程式已申請 10 個連結,而且一直在使用,第 11 個連結申請時報錯:active 10 maxActive 10

    2)支援對值進行排序

    3)若值為空:未測試資料連結或測試失敗

    閒置連結數

    1)當前處於閒置狀態的連結, 隨時會轉成活動連結

    活動連結數+閒置連結數=實際物理連結數

    2)4.2.6.1 及之後版本,閒置連結數的值中,不再展示最大閒置連結數

    3)若值為空:未測試資料連結或測試失敗

    測試結果

    4.2.6.1 及之後版本,新增該

    1)展示最近一次測試資料連結的結果

    • 若最近一次連結失敗,滑鼠懸浮在資料連結的測試結果上,點選感嘆號圖示,可查看測試詳情:

    8.png

    • 若測試結果為空 OR 針對升級使用者,若未記錄最近測試結果,測試結果列值為--

    2)具體檢查邏輯請參見本文 3.4 節內容

    編輯

    1)A 使用者已進入編輯,B 使用者進行編輯/重新命名/刪除操作,B 使用者將收到提示:該連結正在被XX使用者編輯,請稍後再

    2)未連結 WebSocket簡介時,無法檢查編輯是否衝突

    3)4.2.6.1 及之後版本,資料連結編輯頁面跳出後,頁面不進行重新整理,若有人從其他入口進入資料連結編輯頁面,會有編輯衝突提示

    其他

    4.2.6.1 及之後版本,資料連結目錄樹支援收

    叢集工程:

    資料管理頁面如下圖所示:

    點選連結池資訊中的「詳情」按鈕,展示「活動連結佔比」和「閒置連結數」。如下圖所示:


    設定項說明與獨立部署工程相同。

    2)可對資料夾進行重新命名、刪除操作。如下圖所示:

    資料夾下存在資料連結時,不支援刪除該資料夾。


    3)可將資料連結從 A 資料夾中拖曳到 B 資料夾中;資料夾不支援拖曳到另外一個資料夾中,最多支援一層資料夾。

    3.3 資料連結逾時檢查

    在「資料連結管理>全局設定」中,提供「資料連結逾時檢查」功能,支援使用者自訂資料連結的逾時時間。

    資料連結逾時時,報錯「31300010 kdc伺服器不連通」,可手動調大逾時時間。


    3.4 測試連結檢查項說明

    分類
    說明
    JDBC針對共用配置做JDBC驅動有效性&連結性&認證測試

    使用主機、埠、資料庫構建JDBC URL,使用所配置的帳號和密碼,嘗試連結目標資料

    不論在哪個位置點選「測試連結」按鈕,都要檢查這些設定項

    若檢查失敗,資料連結測試結果為失敗

    針對各業務模組自訂配置做測試

    目前FDL使用的自訂配置有 :

    • Redshift的S3認證資訊

    • Impala資料連結的Kudu連結資訊

    • Hive/星環INCEPTOR/星環ArgoDB資料連結的HDFS連結資訊

    • MaxCompute的Tunnel Endpoint資訊

    • Greenplum/YMatrix資料連結的並行裝載伺服器資訊

    • Doris/StarRocks資料連結的FE節點地址資訊

    檢查邏輯:

    • 資料連結管理處,點選「測試連結」按鈕,檢查這些設定項

    • 資料開發-定時任務、資料開發-實時任務、管道任務中,不檢查這些設定項,且測試連結後的結果不會更新到「管理系統>資料連結管理」頁面中

    • 若工程為FineReport、FineBI工程,沒有包含 FineDataLink,不檢查這些設定項

    檢查結果:

    • 若自訂配置檢查失敗,該表格第一欄說明的共有配置檢查成功,資料連結測試結果為警告

    • 若自訂配置檢查成功,該表格第一欄說明的共有配置檢查成功,資料連結測試結果為成功

    HTTPAPI、使用者端

    舉例:簡道雲、SSH、SAP、SFTP、伺服器本地目錄、Kafka、ES、公共資料源等

    -使用配置中的連結資訊和認證資訊,嘗試連結目標資料庫或平台

    4. 引用關係

    應用場景:

    因業務需求調整,導致資料庫發生變更,使用者需要同步修改任務中使用的資料連結,但是不清楚每個資料連結被多少任務用到,不方便調整。

    4.2.6.4 及之後版本,對有權限的資料連結,支援使用者查看資料連結和資源的引用關係。

    4.1 功能說明

    1)選擇某一資料連結,點選「引用關係」。如下圖所示:

    所有資料連結列表中增加「引用關係」欄位,展示使用該資料連結的任務數。如下圖所示:

    2)在彈窗中,以列表的形式展示該資料連結所有的引用資源,可篩選展示自己有權限的資源。如下圖所示:

    3)展示的模組包含定時任務、資料管道、資料服務API、全局參數;

    引用資源為定時任務時,支援展開查看節點和算子,也支援點選跳轉到對應的資源查看。

    注 1:引用資源為定時任務時,不展示禁用節點;

    注 2:若資源中所使用的資料連結取代名稱,但任務配置中沒有聯動變更,則無引用關係。

    4.2 引用關係的更新策略

    更新策略
    說明
    全量更新工程升級時初始化資源配置引用關係
    增量更新1)定時任務資

    • 開發環境:儲存時更新

    • 生產環境:發佈時更新

    • 刪除、還原任務時更新

    2)其餘資源:保存、刪除還原時更新



    附件列表


    主題: 配置資料源
    已經是第一篇
    已經是最後一篇
    • 有幫助
    • 沒幫助
    • 只是瀏覽
    • 评价文档,奖励 1 ~ 100 随机 F 豆!