历史版本3 :字段清洗 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1.概述编辑

1.1 预期效果

用户有时需清洗掉数据中的一些不需要的字符。

例如,括号型(负数),特殊货币符号(¥),千分位(数值型自带千分位)等,如下图所示:

2022-05-26_10-03-00.png

1.2 实现思路

先用 left 函数截取第一位返回值,与「(」符号进行比较,判断数字的「正负」属性,然后再分割字符串提取「数字和小数点」内容。

2. 操作步骤编辑

2.1 新建自助数据集

新建自助数据集,将需要勾选的字段,勾选进来,如下图所示:

2022-05-26_10-14-32.png

2.2 新增列

点击,选择新增列,在系统弹跳出来的「新增列」设置框中,为新增列输入名字-“新利润”,字段类型切换成「数值」型,添加公式:if(left(利润,1)="(","-"+joinarray(split(利润,"[^0-9.]"),""),joinarray(split(利润,"[^0-9.]"),"")),如下图所示:

2022-05-26_10-08-06.png

该公式中使用了三个函数,详情可以参见:文本函数


公式说明

1)left

LEFT(text,num_chars):根据指定的字符数返回文本串中的第一个或前几个字符。

•  示例 LEFT("Finesoftware",8)等于"Finesoft"

2)joinarray

JOINARRAY(array,sepa):返回一个由sepa作为分隔符的字符串。

示例:JOINARRAY([1,2],";")=[1;2].

3) split


SPLIT(String1,String2):返回由String2分割String1组成的字符串数组。(不支持实时数据)

• 示例 SPLIT("hello,world,yes",",")=["hello","world","yes"]。

3. 效果查看编辑

点击确定后,可以看到新增列中 括号型(负数),特殊货币符号(¥) 不显示,数值型自带千分位。如下图所示:

2022-05-26_10-03-00.png