配置Kafka資料源

  • 文档创建者:Roxy
  • 历史版本:13
  • 最近更新:Nikozhan 于 2025-02-11
  • 1. 概述

    1.1 版本

    版本
    功能變動
    4.0.20.1支援0.10.2以上的Kafka版本
    4.1.11.4實時任務支援 Kafka 資料源
    4.1.13.2支援 Kerberos 認證

    1.2 應用場景

    為了便於使用者透過配置 Kafka 消費者的方式,實時從 Kafka 中取數。FineDataLink 支援配置 Kafka 資料連結。

    注:Kafka 認證目前暫不支援 SASL_SSL 認證。

    2. 準備工作

    2.1 前提條件

    詳情請參見:前提條件

    2.2 收集連結資訊

    在連結之前,請收集以下資訊:

    1)Kafka 服務的 IP 地址和埠號。

    2)若是帳號密碼認證,需要收集帳號和密碼;4.1.13.2 及之後版本,若為 Kerberos 認證,需要:

    • 下載環境上的配置檔案 krb5.conf、XXX.keytab、principal 。

    •  XXX.keytab 為金鑰表檔案,需要在提供 Kerberos 服務的應用伺服器上找到該檔案的對應位置。在不同伺服器上 keytab 的檔案名稱可能不一樣,這裏用 XXX 代替。

    2.3 配置 hosts 檔案

    注:本節步驟適用場景:4.1.13.2 及之後版本,認證方式為 Kerberos 認證;其他場景忽略本節內容。

    配置本地 hosts 檔案,例如路徑為C:\Windows\System32\drivers\etc\hosts,在此檔案增加遠端映射的配置,映射格式為「 IP  機器名」。如下圖所示:

    注:對於維運平台部署的工程,如果需要使用 kerberos 認證,需要修改容器與宿主機的 host ,新增資料庫和 kerberos 認證中心的域名。

    1729081061488545.png

    3. 具體連結步驟

    1)管理者登入 FDL 工程,點選「管理系統>資料連結>資料連結管理」,選中某個資料夾後,建立資料連結。如下圖所示:

    2)設定資料連結名稱(可同時修改資料連結所在目錄)。如下圖所示:

    3)可根據資料源分類、支援形式、適配模組、資料源名稱篩選資料庫。如下圖所示:

    4)輸入資料源相關資訊,如下圖所示:

    設定項說明如下表所示:

    配置項
    配置說明
    kafka服務地址

    配置 kafka 的存取地址

    範例格式:demo.fanruan.com:9093

    填寫 IP 地址或主機名以及埠號,多個地址以“,”隔開

    認證方式無認證、帳號密碼、Kerberos

    帳號密碼:輸入連結使用的 Kafka 使用者帳號和密碼

    Kerberos:

    1)Kerberos服務名稱:

    • 在 Kerberos 認證機制下,用戶端存取服務時所使用的服務名;Kerberos 需要使用該服務名來匹配服務的憑據,確定用戶端連結的是正確的服務

    • 預設填寫 Kafka

    注:「Kerberos服務名稱」需要在 Kafka 伺服器上獲取,路徑為kafka/config/server.properties

    2)keytab金鑰路徑:

    • 僅允許上傳類型為 KEYTAB 的檔案,即上傳 XXX.Keytab 檔案

    • XXX.Keyta 為金鑰檔案,需要在提 Kerbero 服務的應用伺服器上找到該檔案的對應位置。不同伺服器上 keytab 的檔案名稱可能不一樣,這裏用 XXX 代替

    3)用戶端principal:

    principal 為註冊過 KDC 的用戶端名稱,從 keytab 金鑰中解析生成後,自動填充

    principal 的格式通常為帳號/部門@公司,確認 principal 是否正確的方式是在資料庫服務端 shell 執行klist 或者 kinit -k -t /path/to/keytab name_of_principal

    或直接透過 beeline、impala-shell 等工具連結開啟認證的服務,並查看對應的 principal 資訊

    例如:Hive 服務對應 principal 為 hive /bigdata@XXX.COM,而 Impala 服務對應的 principal為impala/bigdata@XXX.COM

    4)krb5.com檔案:

    僅允許上傳類型為 CONF 的檔案,即上傳 krb5.conf 檔案

    編碼

    即encoding參數,當鍵類型KEY或者值類型MESSAGE配置為STRING時,決定讀取時的編碼。

    注:預設編碼是utf-8

    單次讀取最小位元組數(B)

    使用者可以手動填寫

    校驗項:

    • 僅支援填寫正整數,正整數校驗

    • 不能包含空格

    單次讀取時間(ms)

    使用者可以手動填寫

    校驗:

    • 僅支援填寫正整數,正整數校驗

    • 不能包含空格

    擴展參數項

    支援新增/刪除參數項和參數值

    可以參考:Apache Kafka 進行配置

    • 「新增參數項」和「參數值」限制長度<=50字元

    • 「新增參數項」只能是英文字母和".",「參數值」只能是英文字母和數字

    • 不能包含空格

    • 不能為空


    4)點選「測試連結」,若連結成功則「儲存」該連結。如下圖所示:

    4. 使用資料源

    支援「資料管道」和「實時任務」使用 Kafka,詳情參見:数据管道任务-Kafka


    附件列表


    主题: 配置資料源
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!