数据分析的方法有哪些?
在数据分析中,数据分析思维是框架式的指引,实际分析问题时还是需要很多“技巧工具”的。就好比中学里你要解一元二次方式,可以用公式法、配方法、直接开平方法、因式分解法。
数据分析里也有技巧,在一些通用的分析场景下可以快速使用,而且对未来构建数据分析模型也有帮助。
接下来就分享常见的5种数据分析方法,分别是:公式法、对比法、象限法,二八法,漏斗法,常常多种结合一起使用。
注:主要偏思维层面的,基于业务问题对数据的探索性分析,不同于专业统计学中的数据处理方法。
一、公式法
所谓公式法就是针对某个指标,用公式层层分解该指标的影响因素,这个我在指标化思维中提到过。
举例:分析某产品的销售额较低的原因,用公式法分解
某产品销售额=销售量 X 产品单价
销售量=渠道A销售量 + 渠道B销售量 + 渠道C销售量 + …
渠道销售量=点击用户数 X 下单率
点击用户数=曝光量 X 点击率
第一层:找到产品销售额的影响因素。某产品销售额=销售量 X 产品单价。是销量过低还是价格设置不合理?
第二层:找到销售量的影响因素。分析各渠道销售量,对比以往,是哪些过低了。
第三层:分析影响渠道销售量的因素。渠道销售量=点击用户数X 下单率。是点击用户数低了,还是下单量过低。如果是下单量过低,需要看一下该渠道的广告内容针对的人群和产品实际受众符合度高不高。
第四层:分析影响点击的因素。点击用户数=曝光量X点击率。是曝光量不够还是点击率太低,点击率低需要优化广告创意,曝光量则和投放的渠道有关。
通过对销售额的逐层拆解,细化评估以及分析的粒度。
公式拆解法是针对问题的层级式解析,在拆解时,对因素层层分解,层层剥尽。
二、对比法
对比法就是用两组或两组以上的数据进行比较,是最通用的方法。
我们知道孤立的数据没有意义,有对比才有差异。一些直接描述事物的变量,如长度、数量、高度、宽度等。通过对比得到比率数据,增速、效率、效益等指标,这才是数据分析时常用的。
比如用于在时间维度上的同比和环比、增长率、定基比,与竞争对手的对比、类别之间的对比、特征和属性对比等。对比法可以发现数据变化规律,使用频繁,经常和其他方法搭配使用。
下图的AB公司销售额对比,虽然A公司销售额总体上涨且高于B公司,但是B公司的增速迅猛,高于A公司,即使后期增速下降了,最后的销售额还是赶超。
三、象限法
通过对两种及以上维度的划分,运用坐标的方式表达出想要的价值。由价值直接转变为策略,从而进行一些落地的推动。象限法是一种策略驱动的思维,常于产品分析、市场分析、客户管理、商品管理等。
比如,下图是一个广告点击的四象限分布,X轴从左到右表示从低到高,Y轴从下到上表示从低到高。
高点击率高转化的广告,说明人群相对精准,是一个高效率的广告。
高点击率低转化的广告,说明点击进来的人大多被广告吸引了,转化低说明广告内容针对的人群和产品实际受众有些不符。
高转化低点击的广告,说明广告内容针对的人群和产品实际受众符合程度较高,但需要优化广告内容,吸引更多人点击。
低点击率低转化的广告,可以放弃了。
还有经典的RFM模型,把客户按最近一次消费(Recency)、消费频率(Frequency)、消费金额 (Monetary)三个维度分成八个象限。
象限法的优势:
1.找到问题的共性原因
通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;
2.建立分组优化策略
针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。
四、二八法/帕累托分析
二八法也可以叫帕累托法则,源于经典的二八法则。比如在个人财富上可以说世界上20%的人掌握着80%的财富。而在数据分析中,则可以理解为20%的数据产生了80%的效果需要围绕这20%的数据进行挖掘。往往在使用二八法则的时候和排名有关系,排在前20%的才算是有效数据。二八法是抓重点分析,适用于任何行业。找到重点,发现其特征,然后可以思考如何让其余的80%向这20%转化,提高效果。
一般地,会用在产品分类上,去测量并构建ABC模型。比如某零售企业有500个SKU以及这些SKU对应的销售额,那么哪些SKU是重要的呢,这就是在业务运营中分清主次的问题。
常见的做法是将产品SKU作为维度,并将对应的销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算截止当前产品SKU的销售额累计合计占总销售额的百分比。
百分比在 70%(含)以内,划分为 A 类。
百分比在 70~90%(含)以内,划分为 B 类。
百分比在 90~100%(含)以内,划分为 C 类。
以上百分比也可以根据自己的实际情况调整。
ABC分析模型,不光可以用来划分产品和销售额,还可以划分客户及客户交易额等。比如给企业贡献80%利润的客户是哪些,占比多少。假设有20%,那么在资源有限的情况下,就知道要重点维护这20%类客户。
五、漏斗法
漏斗法即是漏斗图,有点像倒金字塔,是一个流程化的思考方式,常用于像新用户的开发、购物转化率这些有变化和一定流程的分析中。
上图是经典的营销漏斗,形象展示了从获取用户到最终转化成购买这整个流程中的一个个子环节。相邻环节的转化率则就是指用数据指标来量化每一个步骤的表现。所以整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。
整体漏斗模型的核心思想其实可以归为分解和量化。比如分析电商的转化,我们要做的就是监控每个层级上的用户转化,寻找每个层级的可优化点。对于没有按照流程操作的用户,专门绘制他们的转化模型,缩短路径提升用户体验。
还有经典的黑客增长模型,AARRR模型,指Acquisition、Activation、Retention、Revenue、Referral,即用户获取、用户激活、用户留存、用户收益以及用户传播。这是产品运营中比较常见的一个模型,结合产品本身的特点以及产品的生命周期位置,来关注不同的数据指标,最终制定不同的运营策略。
从下面这幅AARRR模型图中,能够比较明显的看出来整个用户的生命周期是呈现逐渐递减趋势的。通过拆解和量化整个用户生命周期各环节,可以进行数据的横向和纵向对比,从而发现对应的问题,最终进行不断的优化迭代。
不过,单一的漏斗分析是没有用的,不能得出什么结果,要与其它相结合,如与历史数据的对比等。
延伸阅读
数据统计分析方法,如何做好数据统计?
数据分析是把隐没在一大批看来杂乱无章的数据中的信息,集中、萃取和提炼出来,以找出所研究对象的内在规律,并提供决策支持的一系列分析过程。数据统计分析方法已经应用到各行各业,在互联网电商的运用也非常广泛。在做网络推广时,一定要用数据分析作为基础。没有数据做支撑的推广是没有意义的。在这里介绍一些方法和工具。
1.比较分析法
是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较,如不同部门、不同地区、不同国家的比较,也叫横向比较;动态比较是同一总体条件不同时期指标数值的比较,也叫纵向比较。这两种方法既可单独使用,也可结合使用。
2.分组分析法
统计分析不仅要对总体数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求,把所研究的总体按照一个或者几个标志划分为若干个部分,加以整理,进行观察、分析,以揭示其内在的联系和规律性。统计分组法的关键问题在于正确选择分组标值和划分各组界限。
3.回归分析法
回归分析法是依据事物发展变化的因果关系来预测事物未来的发展走势,它是研究变量间相互关系的一种定量预测方法,回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。
4.因素分析法
因素分析法的最大功用,就是运用数学方法对可观测的事物在发展中所表现出的外部特征和联系进行由表及里、由此及彼、去粗取精、去伪存真的处理,从而得出客观事物普遍本质的概括。其次,使用因素分析法可以使复杂的研究课题大为简化,并保持其基本的信息量。
数据分析方法怎么写?
一、描述性统计
描述性统计是一类统计方法的汇总,揭示了数据分布特性。它主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布以及一些基本的统计图形。
1、缺失值填充:常用方法有剔除法、均值法、决策树法。
2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以在做数据分析之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。
二、回归分析
回归分析是应用极其广泛的数据分析方法之一。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律。
1. 一元线性分析
只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量Y或其残差必须服从正态分布。
2. 多元线性回归分析
使用条件:分析多个自变量X与因变量Y的关系,X与Y都必须是连续型变量,因变量Y或其残差必须服从正态分布。
3.Logistic回归分析
线性回归模型要求因变量是连续的正态分布变量,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况。
4. 其他回归方法:非线性回归、有序回归、Probit回归、加权回归等。
三、方差分析
使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。
1. 单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系。
2. 多因素有交互方差分析:一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系
3. 多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系
4. 协方差分祈:传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,降低了分析结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法。
四、假设检验
1. 参数检验
参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验 。
2. 非参数检验
非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。
适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。
1)虽然是连续数据,但总体分布形态未知或者非正态;
2)总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;
主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。
在数据分析中:我们经常使用哪些方法来描述数据?
1.解析法: 枚举法:将所有数据描述一遍,中间用逗号分隔开; 方程形式:通过列方程或者方程组描述所得结果2..列表法: 建一个矩形并做出划分,对数据类型,数据信息及具体情况做统计3.图形法:(形象直观地描述参数的具体情况) 折线图 扇形图 柱形图 函数图
产品数据分析方法八种?
八种常见的数据分析方法
1数字和趋势
采用数字和趋势图进行数据信息的展示最为直观,从具体的数字和趋势走向中可以更好地得到数据信息,有助于提高决策的准确性和实时性。
2维度分解
当单一的数字或趋势过于宏观时,我们可以通过不同维度对数据进行分解,以获取更加精细的数据洞察。在进行维度选择时,需要考虑此维度对于分析结果的影响。
3用户分群
用户分群即指针对符合某种特定行为或具有共同背景信息的用户,进行归类处理。也可通过提炼某一类用户的特定信息,为该群体创建用户画像。用户分群的意义在于我们可以针对具有特定行为或特定背景的用户,进行针对性的用户运营和产品优化,比如对具有“放弃支付或支付失败”的用户进行对应优惠券的发放,以此来实现精准营销,大幅提高用户的支付意愿和成交量。
4转化漏斗绝大部分商业变现的流程,都可归纳为漏斗。漏斗分析是常见的一种数据分析手段,比如常见的用户注册转化漏斗,电商下单漏斗。整个漏斗分析的过程就是用户从前到后转化的路径,通过漏斗分析可以得到转化效率。这其中包含三个要点:其一,整体的转化效率。其二,每一步(转化节点)的转化效率。其三,在哪一步流失最多,原因是什么,这些流失的用户具有什么特征。
5行为轨迹
数据指标本身只是真实情况的一种抽象,通过关注用户的行为轨迹,才能更真实地了解用户的行为。例如只看到常见的uv和pv指标,是无法理解用户是如何使用你的产品的。通过大数据手段来还原用户的行为轨迹,可以更好地关注用户的实际体验,从而发现具体问题。如果维度分解依旧难以确定某个问题所在,可通过分析用户行为轨迹,发现一些产品及运营中的问题。
6留存分析人口红利逐渐消退,拉新变得并不容易,此时留住一个老用户的成本往往要远低于获取一个新用户的成本,因此用户留存成为了每个公司都需要关注的问题。可以通过分析数据来了解留存的情况,也可以通过分析用户行为找到提升留存的方法。常见的留存分析场景还包括不同渠道的用户的留存、新老用户的留存以及一些新的运营活动及产品功能的上线对于用户回访的影响等。
7A/B测试A/B测试通常用于测试产品新功能的上线、运营活动的上线、广告效果及算法等。
进行A/B测试需要两个必备因素:第一,足够的测试时间;第二,较高的数据量和数据密度。当产品的流量不够大时,进行A/B测试很难得到统计结果。
8数学建模涉及到用户画像、用户行为的研究时,通常会选择使用数学建模、数据挖掘等方法。比如通过用户的行为数据、相关信息、用户画像等来建立所需模型解决对应问题。
如何做数据分析?
做数据分析方法如下
1.明确目的和思路
首先明白本次的目的,梳理分析思路,并搭建整体分析框架,把分析目的分解,化为若干的点,清晰明了,即分析的目的,用户什么样的,如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标(各类分析指标需合理搭配使用)。同时,确保分析框架的体系化和逻辑性。
2.数据收集
根据目的和需求,对数据分析的整体流程梳理,找到自己的数据源,进行数据分析,一般数据来源于四种方式:数据库、第三方数据统计工具、专业的调研机构的统计年鉴或报告(如艾瑞资讯)、市场调查。
对于数据的收集需要预先做埋点,在发布前一定要经过谨慎的校验和测试,因为一旦版本发布出去而数据采集出了问题,就获取不到所需要的数据,影响分析。
3.数据处理
数据收集就会有各种各样的数据,有些是有效的有些是无用的,这时候我们就要根据目的,对数据进行处理,处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法,将各种原始数据加工成为产品经理需要的直观的可看数据。
4.数据分析
数据处理好之后,就要进行数据分析,数据分析是用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
常用的数据分析工具,掌握Excel的数据透视表,就能解决大多数的问题。需要的话,可以再有针对性的学习SPSS、SAS等。
数据挖掘是一种高级的数据分析方法,你需要掌握数据挖掘基础理论,数据库操作Phython,R语言, Java 等编程语言的使用以及高级的数据可视化技术。要侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
5.数据展现
一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
数据分析的六种基本分析方法?
有以下六种方法:
1、构成分析法;
2、同类比较分析法;
3、漏斗法;
4、相关分析法;
5、聚类分析法;
6、分组分析法。
构成分析在统计分组的基础上计算结构指标,来反映被研究总体构成情况的方法。应用构成分析法,可从不同角度研究投资构成及其变动趋势,观察投资构成与产业结构、社会需要构成的适应关系,可以揭示事物由量变到质变的具体过程。