在公式編輯可選的參數中,looptimes類型從字串變成了數值
cyctime類型從字串變成了日期
新增和優化公式REGEXP_SUBSTR、CONCATENATE、FORMAT
優化計算邏輯問題,支持的欄位類型為 bool、long、double、string、timestamp
優化交互提示,寫函式時下方聯動出現函式介紹
「新增欄位」配置中:
支援修改欄位類型
新增「類型轉換配置」配置項
在不影響原有欄位的情況下,「新增計算列」算子可利用原有欄位透過引用或計算獲得一個新的欄位。
如下圖所示:
在對表資料進行處理程式中,使用者想新增一欄資料,記錄合同簽約時間與註冊時間之間的時間差。
範例資料:
合同事實表.xls
使用者有張「合同事實表」,表中已有欄位「註冊時間」和「簽約時間」。如下圖所示:
建立定時任務,拖入「資料轉換」節點。如下圖所示:
進入「資料轉換」節點,拖入「DB 表輸入」算子,取出存放在資料庫中的「合同事實表」資料。如下圖所示:
1)拖入「新增計算列」算子,新增一欄,欄位名為「時間差」,值為簽約時間與註冊時間之間的時間差。如下圖所示:
點選「確定」按鈕後,最後結果如下圖所示:
注1:該頁面支援欄位的新增、刪除,不支援欄位的排序。
注2:新增後的欄位將按列表順序,追加到原欄位末尾;如使用者希望調整欄位順序,可在匯出算子的「欄位映射」處調整。
各設定項說明如下表所示:
新增欄位的名稱;預設為空,必填
不允許為空
限制長度<=30字元
只能是字母 (a-z A-Z)、數字 (0-9)、底線(_)、或中文的組合
不能包含空格
不能與已有欄位名和新增的其他欄位名重複
展示欄位值;預設為空,必填
點選時直接彈出公式編輯框
在公式編輯框左側,可看到支援的函式
滑鼠懸浮到某個函式時,在公式釋義區域展示公式簡介、參數說明、範例;滑鼠點選左側公式時,在公式編輯框中自動插入對應公式
注1:公式編輯框中的欄位和參數,需要從左側點選或透過自動補全補出;若想手動輸入,需注意:手寫參數使用 ${} 包裹生效,欄位使用 #{} 包裹生效,參數和欄位不匹配時標紅(大小寫敏感)。
注2:若新增列值的計算公式中包含參數,且參數為小數,將直接截取整數部分參與計算。
1)根據欄位計算的結果類型展示欄位類型,不允許手動指定欄位類型;使用者如果想要做類型轉換,可利用相關轉換公式,或者接入欄位設定算子完成
2)當匯出結果類型無法自動識別,如手動輸入 NULL 時,允許使用者自行指定類型:
注:4.1.11.3之前的數值類型預設為 double類型
4.1.11.3 以及以上版本支援的欄位類型為 bool、long、double、string、timestamp。
2)點選「資料預覽」,如下圖所示:
繼續對「合同事實表」進行資料處理,或者使用「DB表匯出」算子將資料匯出到資料庫中。
還可透過以下內容瞭解「新增計算列」算子的使用:
正文函式概述
日期函式概述
邏輯函式概述
數值函式
其他函式:ISNULL-判斷是否為空
常見日期公式
缺失值處理
新增列_條件指派
新增列_分組指派
字串連接和截取
字串清洗
「新增計算列」算子中沒有 sum 和視窗函式,建議使用「Spark SQL」算子實現,詳情請參見:SparkSQL窗口函数
滑鼠選中內容,快速回饋問題
滑鼠選中存在疑惑的內容,即可快速回饋問題,我們將會跟進處理。
不再提示
10s後關閉
反馈已提交
网络繁忙