使用者在處理資料時,經常會使用到正則表式,用來描述某些字串匹配規則,以此來對正文進行過濾。
例如使用者需要將「URL」正文欄位進行判斷,若欄位全部為數字,則標記為「純數字」,否則標記為「其他」,如下圖所示:
使用 REGEXP 函式判斷是否為純數字;
然后使用 IF 函式進行標記。
範例資料:場景文檔.xlsx
上傳 範例資料至 FineBI 中。
建立自助資料集,選擇範例資料下的所有欄位,如下圖所示:
「新增欄」步驟,命名為「純數字」,輸入公式:IF(REGEXP(URL,"\\d*")=1,"純數字","其他"),如下圖所示:
注:公式框中的函式、欄位都需要點選左側的選擇區域選擇,不能手動輸入。
公式說明:
\d 表示匹配數字,若要使用 \ 字元,需要重新整理增一個反斜槓。所以當公式為regexp(字串,"\d")時會提示不合法,需寫成regexp(字串,"\\d")
* 表示匹配前面的子表式零次或多次。
也可使用該公式:IF(REGEXP(URL,"^[0-9]*$")=1,"純數字","其他"),如下圖所示:
^ 為匹配輸入字串的開始位置。
[0-9]*匹配多個數字, [0-9] 匹配單個數字,* 匹配前面的子表式零次或多次;
$ 為匹配輸入字串的結束位置。
正則表式如下圖說明:
詳情參見本文 1.1 節。