历史版本6 :数据分析方法概述 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

数据分析是什么编辑

在了解了数据可视化方法的基础上,想要通过可视化来呈现问题、给出解决问题的方向和思路,就需要掌握正确的数据分析方法。

数据是21世纪的石油,而分析则是内燃机。        ——Gartner研究院高级副总裁Peter Sondergaard

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用,是数据可视化的前提与基础。

也就是说,把隐藏在一大批看起来杂乱无章的数据中的信息集综合提炼出来,从而找出所研究对象的内在规律,帮助人们做出判断,以便采取适当行动的方式,就是数据分析。

为什么需要数据分析编辑

数据分析是有组织有目的地收集数据、分析数据,使之成为信息的过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各个过程都需要适当运用数据分析过程,以提升有效性。

举个最经典的例子,20世纪90年代,沃尔玛的超市管理人员分析销售数据时发现了一个现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现年轻的父亲身上。

这是因为,在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现同一个购物篮的现象。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,从而获得了很好的商品销售收入。

1662712146154618.jpeg

当然“啤酒与尿布”的故事必须具有技术方面的支持。1993年美国学者 Agrawal 提出通过分析购物篮中的商品集合,从而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客户的购买行为。艾格拉沃从数学及计算机算法角度提 出了商品关联关系的计算方法—— Aprior 算法。沃尔玛从上个世纪 90 年代尝试将 Aprior 算法引入到 POS 机数据分析中,并获得了成功,于是产生了“啤酒与尿布”的故事。这便是数据分析的功能与魅力。

数据分析步骤编辑

数据分析是数学与计算机科学相结合的产物,并不只是简单的数据堆砌,而是要从海量数据中发现问题、解决问题。因此典型的数据分析主要包含以下步骤:确定分析模型与分析方法搭建指标体系排查异常指标、从而支撑看板需求。以上步骤从问题出发,最终实现有效信息的获取与结论的形成。

默认标题__2022-09-09+15 14 01.jpeg

更多内容可参考接下来的文档。