FineDataLink 獨立部署版本, 「管理系統>資料連結>資料連結管理」處,遮蔽不支援的資料源類型
資料連結名稱支援特殊字元` ~ ! @ # $ % ^ & * ( ) _ - + = { } [ ] | \ : " ; ' < > , . ? /
FineDataLink 的資料開發、資料管道、資料服務、資料管理模組支援連結多種資料源進行資料的處理操作。
在使用 FineDataLink 處理、同步資料前,您需要先定義資料連結,以便在執行資料處理操作時,透過「資料庫>資料連結名稱>資料表」,來確定資料的讀取和寫入位置。
本文講解如何在 FDL 中配置資料連結和管理資料連結。
詳情請參見:前提條件
1)管理者進入 FDL 工程,點選「管理系統>資料連結管理」頁面。點選「建立>資料夾」,可以使用資料夾對資料連結進行分類管理。如下圖所示:
注:資料夾名稱不可為空,不可重名,不能超過 60 個字元;只可建立一級資料夾。
在某資料夾中建立資料連結。如下圖所示:
2)輸入資料連結名稱後,選擇資料庫類型,點選「下一步」按鈕。
可透過搜尋資料庫名稱來快速選擇資料庫類型;也可透過資料源分類、支援形式、適配模組來篩選資料庫類型。
注:所有資料夾下的資料連結名稱,均不能重名。
注2:4.2.4.2 及之後版本,可選擇的資料源類型由當前工程環境控制。
滑鼠懸浮在資料名稱右側的問號標識上,可顯示該資料源適配的模組。如下圖所示:
注:4.2.4.2 及之後版本,問號標識處顯示的內容由當前工程環境控制。
注2:4.2.15.1 及之後版本,問號識別處顯示的內容與購買的模組相關。例如 PostgreSQL 支援定時管道寫入,若未購買定時管道模組,此資料源問號處將不展示定時管道資訊。
3)輸入資料庫的相關資訊。如下圖所示:
以下為資料連結資訊的詳細解譯,不同資料庫要設定的連結資訊不同。
每個資料庫的資料連結設定項請在 FDL 說明文檔中搜尋查看(範例:配置Oracle資料源)。
連結資料庫所需要的驅動:
預設:一小部分資料庫中內建了資料庫驅動,使用預設即可
自訂:FineDataLink 中未內建驅動,需要使用者自訂驅動,詳細操作請參見:驅動管理
若資料庫支援多種認證方式,則點選會出現認證方式下拉框:
帳號密碼:輸入資料庫的帳號和密碼
Kerberos認證:填入註冊過 kdc 的使用者端名稱和 keytab 金鑰路徑,詳情請參見:[平台]資料連結Kerberos認證
部分資料庫需要選擇模式,需要先連結成功後才能選擇模式
當資料庫不存在模式選擇,則無需進行模式選擇
如果這些資料庫未進行模式選擇,則預設選擇的是第一個模式
連結多模式的資料庫時使用 SQL 語句需要帶上模式名前綴進行搜尋
注:需要正確選擇資料庫對應的模式,否則會導緻新增資料庫表時顯示「當前資料連結中無可用表」,只能透過 SQL 資料集進行取數
點選「測試連結」,即可測試是否可以連結成功。
若使用者不需要設定連結池,即可點選「儲存」。完成資料連結配置。
在連結資料庫時,可能需要進行一些進階設定,但大部分情況下是不需要設定的。
我們可以根據需要選擇性設定,如下圖所示:
1)Fetchsize 設定
fetchSize 參數是用於控制從資料庫中獲取資料的成批處理大小的設定。較小的 fetchSize 值會減少每次資料庫查詢的記憶體消耗,但可能需要更多的資料庫往返來獲取完整的結果集;較大的 fetchSize 值可以減少資料庫往返次數,但會增加記憶體使用量。可以根據你的需求透過設定 fetchSize 參數值,來優化資料庫查詢效能 。
若參數值 ≤ 0(例如:-20)則表示不開啟 fetchSize 參數 。
Oracle、DB2、Postgre 這三種資料庫必須設定 fetchSize 參數,所以若設定了≤0 的參數值,會自動分別被取代為 128、50、10000 。
其他資料庫預設情況下不開啟 fetchSize 參數 。
若為空則表明不配置此項參數 。
2)SocketTimeout 設定
設定套接字逾時時長(連結接等待或資料傳輸的最長時間),超過此時間會強制中斷連結 。
為空或輸入為0時,視為不設定逾時 。
對連結池進行設定,選擇「連結池設定」按鈕,如下圖所示:
獲取連結時最大等待時間,單位毫秒
注:值設定為 0 不代表永不逾時,根據實際情況設定值的大小
作用:在連結建立後、業務查詢執行前,預先設定好對話級別的運作環境,相當於資料連結的"啟動腳本",確定每次連結都帶着正確的參數配置進入工作狀態
範例:
1)hologres:
可設定 FDL 工程的時區,使工程時區與資料庫時區一致
set timezone to 'Asia/Shanghai'
2)Apache Impala:
設定單條查詢的最大執行時間上限以及禁用運算式重寫優化
set exec_time_limit_s = 480;set ENABLE_EXPR_REWRITES =0
更多設定(不常用,如無特殊場景不建議修改):
numTestPerEvictionRun
連結保持空閑而不被驅逐的最小時間
某資料連結空閑時間若超過保持空閑最小時間值,檢查
也就是7小時
80000ms
也就是80s
若使用者安全性要求高,需要使用 SSH 。可以直接勾選「使用SSH通道」,輸入對應資訊。
注:驗證方法支援密碼和公用鍵,其中選擇「公用鍵」需要將檔案放置在 %FineDataLink%/webapps/webroot/WEB-INF/resources 下。
點選「測試連結」,若提示連結成功,點選「儲存」儲存該配置。
1)在%FineDataLink%/webapps/webroot/WEB-INF/resources/certificates 中put 命令 CA 證件、使用者端證件以及使用者端金鑰,如下圖所示:
2)勾選「使用SSL通道」,將檔案新增進對應位置。如下圖所示:
3)點選「測試連結」,若連結成功點選「儲存」儲存該配置。
資料連結建立成功後,介面如下圖所示:
注:使用者建立的資料夾、資料連結,預設具備使用和管理權限。
滑鼠懸浮在資料連結名稱右側,可對資料連結做編輯、重新命名、複制、刪除、測試連結操作。如下圖所示:
注:刪除資料連結前,可先查看資料連結的引用關係,確定該資料連結可以被刪除,不影響其他資源
「資料連結管理」各設定項說明如下表所示:
需要注意以下幾點:
未適配的資料庫類型右側不顯示圖示。
在管理資料連結時,資料連結的名稱不能隨意改動。更新到本地的表與資料庫匹配依靠的是資料連結的名稱,如果修改資料連結的名稱,從該連結中取出的表將無法再更新。
如果是 SQL 資料集,也會導緻沒有「修改 SQL」的按鈕。
如果更新本地儲存的表中的資料庫,例如由開發環境變化到生産環境,表名與表結構均一緻時,只需要修改資料連結的 URL 即可。本地儲存的表依照資料連結名依然可以更新資料。
1)資料管理頁面介紹
獨立部署工程:
點選資料夾或根目錄,可透過資料連結名稱(不區分字母大小寫,支援模糊搜尋)、資料源類型(可多選,為表格中已有的資料源類型)、建立人(可多選,為表格中已有建立人)、測試結果(可多選,4.2.6.1 及之後版本新增)搜尋資料連結。如下圖所示:
表格內容介紹如下表所示:
當前活動連結數/最大活動連結數
1)「最大活動連結數」為連結池最大可建立的連結數,若最大連結數是 10 ,程式已申請 10 個連結,而且一直在使用,第 11 個連結申請時報錯:active 10 maxActive 10
2)支援對值進行排序
3)若值為空:未測試資料連結或測試失敗
1)當前處於閒置狀態的連結, 隨時會轉成活動連結
活動連結數+閒置連結數=實際物理連結數
2)4.2.6.1 及之後版本,閒置連結數的值中,不再展示最大閒置連結數
1)展示最近一次測試資料連結的結果
若最近一次連結失敗,滑鼠懸浮在資料連結的測試結果上,點選感嘆號圖示,可查看測試詳情:
若測試結果為空 OR 針對升級使用者,若未記錄最近測試結果,測試結果列值為--
2)具體檢查邏輯請參見本文 4.4 節內容
1)A 使用者已進入編輯,B 使用者進行編輯/重新命名/刪除操作,B 使用者將收到提示:該連結正在被XX使用者編輯,請稍後再試
2)未連結 WebSocket簡介時,無法檢查編輯是否衝突
3)4.2.6.1 及之後版本,資料連結編輯頁面跳出後,頁面不進行重新整理,若有人從其他入口進入資料連結編輯頁面,會有編輯衝突提示
4.2.6.1 及之後版本,資料連結目錄樹支援收起
叢集工程:
資料管理頁面如下圖所示:
點選連結池資訊中的「詳情」按鈕,展示「活動連結佔比」和「閒置連結數」。如下圖所示:
設定項說明與獨立部署工程相同。
2)可對資料夾進行重新命名、刪除操作。如下圖所示:
資料夾下存在資料連結時,不支援刪除該資料夾。
3)可將資料連結從 A 資料夾中拖曳到 B 資料夾中;資料夾不支援拖曳到另外一個資料夾中,最多支援一層資料夾。
在「資料連結管理>全局設定」中,提供「資料連結逾時檢查」功能,支援使用者自訂資料連結的逾時時間。
資料連結逾時時,報錯「31300010 kdc伺服器不連通」,可手動調大逾時時間。
使用主機、埠、資料庫構建JDBC URL,使用所配置的帳號和密碼,嘗試連結目標資料庫
不論在哪個位置點選「測試連結」按鈕,都要檢查這些設定項
若檢查失敗,資料連結測試結果為失敗
目前FDL使用的自訂配置有 :
Redshift的S3認證資訊
Impala資料連結的Kudu連結資訊
Hive/星環INCEPTOR/星環ArgoDB資料連結的HDFS連結資訊
MaxCompute的Tunnel Endpoint資訊
Greenplum/YMatrix資料連結的並行裝載伺服器資訊
Doris/StarRocks資料連結的FE節點地址資訊
檢查邏輯:
資料連結管理處,點選「測試連結」按鈕,檢查這些設定項
資料開發-定時任務、資料開發-實時任務、管道任務中,不檢查這些設定項,且測試連結後的結果不會更新到「管理系統>資料連結管理」頁面中
若工程為FineReport、FineBI工程,沒有包含 FineDataLink,不檢查這些設定項
檢查結果:
若自訂配置檢查失敗,該表格第一欄說明的共有配置檢查成功,資料連結測試結果為警告
若自訂配置檢查成功,該表格第一欄說明的共有配置檢查成功,資料連結測試結果為成功
舉例:簡道雲、SSH、SAP、SFTP、伺服器本地目錄、Kafka、ES、公共資料源等
應用場景:
1)因業務需求調整,導致資料庫發生變更,使用者需要同步修改任務中使用的資料連結,但是不清楚每個資料連結被多少任務用到,不方便調整。
2)4.2.6.4 及之後版本,對有權限的資料連結,支援使用者查看資料連結和資源的引用關係。
1)選擇某一資料連結,點選「引用關係」。如下圖所示:
所有資料連結列表中增加「引用關係」欄位,展示使用該資料連結的任務數。如下圖所示:
2)在彈窗中,以列表的形式展示該資料連結所有的引用資源,可篩選展示自己有權限的資源。如下圖所示:
3)展示的模組包含定時任務、資料管道、資料服務API、全局參數;
引用資源為定時任務時,支援展開查看節點和算子,也支援點選跳轉到對應的資源查看。
注 1:引用資源為定時任務時,不展示禁用節點;
注 2:若資源中所使用的資料連結取代名稱,但任務配置中沒有聯動變更,則無引用關係。
開發環境:儲存時更新
生產環境:發佈時更新
刪除、還原任務時更新
2)其餘資源:保存、刪除還原時更新
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
反馈已提交
网络繁忙