最新历史版本 :配置StarRocks資料源 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1. 概述编辑

1.1 版本

FineDataLink 版本功能變動
4.0.24

定時任務輸入匯出支援 StarRocks

管道任務資料匯出支援 StarRocks

4.1.2資料服務支援 StarRocks
4.1.11.4實時任務支援 StarRocks
4.1.14.1資料連結支援配置套接字逾時(SocketTimeout 設定項中配置),控制資料庫查詢時間在一個合理範圍內,避免出現無限等待的問題

 FineDataLink 支援使用 StarRocks 資料源,進行定時任務讀寫、管道任務寫入、作為資料服務資料發布源、實時任務寫入

2. 使用限制编辑

資料源使用說明詳情參見:StarRocks資料源使用說明

3. 準備工作编辑

3.1 前提條件

詳情請參見:前提條件

3.2 版本和驅動

 支援的資料庫版本驅動包下載

 1.19及以上版本

注:若使用資料管道,需要 2.3以上版本。

已內建,無需下載

3.3 收集連結資訊

在連結資料庫之前,請收集以下資訊:

  • 資料庫所在伺服器的 IP 地址和埠號。

  • 資料庫的名稱。

  • 資料庫的帳號和密碼。

3.4 注意事項

1)建立資料連結前,需要確定 FDL 能存取 FE 節點、BE 節點。

2)StarRocks 作為數寫入端使用時,需要確定 FE 節點能夠存取 BE 節點。原因:

StarRocks 作為數據寫入端使用時,FineDataLink 使用 Stream load 匯入方式透過 HTTP 協定匯入本地正文檔案或者程式檔案,匯入命令到 FE,FE 會透過 HTTP 重定向指令將請求轉發給 BE。還可以將匯入命令直接提交到指定的 BE。匯入的最終結果由協調器 BE 傳回。該方式適用數量級在1G~10G的資料。

4. 具體連結步驟编辑

1)管理者登入 FDL 工程,點選「管理系統>資料連結>資料連結管理」,選中某個資料夾後,建立資料連結。如下圖所示:

2)設定資料連結名稱(可同時修改資料連結所在目錄)。如下圖所示:

3)可根據資料源分類、支援形式、適配模組、資料源名稱篩選資料庫。如下圖所示:

4)輸入 3.3 節的連結資訊。如下圖所示:

部分設定項說明如下表所示:

設定項說明
FE 節點地址

如果 StarRocks 作為資料寫入端時使用,則需要配置 FE 節點

值說明:

填寫IP地址或主機名以及埠號,多個地址以,隔開

含義:

作為 Stream Load 的連結目標:

  • 格式為 "ip:port"。其中 IP 是 FE 節點 IP,port 是 FE 節點的 http_port;可使用show frontends語句,查詢 fe 相關埠

  • 例如:192.168.101.71:8030,192.168.101.209:9030;可以填寫多個,填寫多個時資料將以輪詢的方式寫入;填寫多個時將選取第一個可用的 FE 節點進行連結

  • FE 節點的預設埠(若作為寫入端,必須配置)是 8030;JDBC 預設埠是 9030(根據實際需求選擇是否配置)

更多資料庫資訊詳情參見:StarRocks資料源

SocketTimeout

4.1.14.1 及之後版本新增

值說明:

配置當前資料連結的套接字逾時,單位為秒,預設值為 3600

輸入框要求為非負整數,配置為 0 時,視為不設定逾時

該設定項應用場景:

在網路發生抖動時,可能會出現管道&定時任務發出查詢後,無限等待傳回資料的問題,使用者維運時,看不到報錯,但實際任務已不再同步資料

配置該設定項後,將控制查詢在一個合理的範圍內,達到套接字逾時時間後,SQL 語句會自動中斷報錯,避免出現無限等待的問題

該設定項控制的功能範圍:

  • 定時任務:對應資料源讀寫、SQL腳本執行、參數指派、全局指派參數

  • 管道任務:對應資料源讀寫

  • 資料發布:對應資料源查詢

  • 庫表管理:SQL執行

5)點選「測試連結」,若連結成功則「儲存」該連結。


5. 使用資料源编辑

配置好資料源後即可在「定時任務」中使用資料源,詳情參見:定時任務概述

配置好資料源後即可在「資料管道」中將使用資料源,詳情參見:資料管道概述

配置好資料源後即可在「資料服務」中將使用資料源,詳情參見:資料服務概述

配置好資料源後即可在「實時任務」中將使用資料源,詳情參見:實時任務概述

下圖範例為「資料同步」中使用StarRocks 資料進行資料開發。