数据分析的方法有:排列图、因果图、分层图、散布图、直方图、趋势图、关联图、系统图、矩阵图、亲和图等。
排列图,依据二八原则,即80%的问题可能都是由20%的关键的因素导致的。按照发生频率高低排序并绘制累计百分比曲线制图,可以找到消耗资源最多的少部分因素,优先解决。
数据分析是指用适当的统计、分析方法,对收集来的大量的数据进行分析,将它们加以汇总和理解并消化,以求最大化的发掘数据中有用的信息。
数据分析的目的是把隐藏在一大批看来杂乱无章的数据中的信息集中和提炼出来,从而找出所研究对象的内在规律,以便采取适当行动。可进行现状分析、原因分析、预测分析。
数据分析的三个类型:描述性的数据分析、探索性的数据分析、验证性的数据分析。
探索性数据分析,是在描述性数据分析的基础上,发现数据中的新的特征。如沃尔玛经典营销的案例中,数据分析师发现啤酒和尿布的销售数据之间有些关系,调查发现爸爸们买尿布的同时都会买一些啤酒,沃尔玛对商品布局进行优化,尿布货架旁边就布置啤酒货架,最终进一步增加了啤酒的销售。
验证性的分析,是指对已有假设的证实或证伪。在实验统计学里面,常用到卡方检验、 T检验、Z检验、F检验等对实验数据进行统计分析,来验证实验组和对照组之间的差异性假设,应用统计学则主要强调概率论。
因果图也就是鱼骨图,用来识别造成结果的主要因素和次要因素的一个方法,然后针对性的去解决。
分层图,把性质不同的数据即影响因素进行拆解分析,便于问题的具体化。比如机床设备问题,进一步分析可能是机器的问题,也可能是工具、夹具、刀具的问题。
散布图,要找到两个变量的相互关系,从而找出本质问题所在。例如测量的数据里面记录了压力和温度数据。通过数据分析,发现这两个数据这个关系存在着一定的线性关系,可能是同一个因素导致。
直方图,能够比较直观的反映数据状态,再机加工部件测量数据中能指出可能的原因。
趋势图,能够直观的显示某个事情发生的频率跟时间轴的关系。
关联图,能够根据逻辑关系理清较复杂的关系,系统的来看数据,找出关键因素。
系统图,复杂的问题简单化。比如发现工作效率低可能是比较复杂的原因导致的,那就把原因一个个细化,达到可执行的具体任务。
矩阵图,利用多维度思考的方法,也是逐步的明确问题的一个方法。
亲和图,把类似的数据归为一类,从小达到,便于认识事物,形成构思,从整体的去把握。
数据分析的一般步骤,数据分析的目的是解决问题、现状分析、原因分析、预防问题。首先识别需求,再根据识别的需求收集数据并进行数据分析,最后依据分析结论制定策略来进行改进。