Skip to content

第5章 归因分析

5.1 归因分析的基本概念

归因分析(Attribution Analysis)在市场营销、数据分析和产品管理等领域中是非常重要的,它能帮助企业和组织更好地理解营销活动、广告投放和其他业务决策的效果。

衡量营销效果:
归因分析可以帮助企业了解哪些营销渠道或活动带来了最大的转化率(如点击、购买等),从而更有效地分配营销预算。

优化广告支出:
通过识别哪些广告或营销活动产生了最好的回报(ROI),企业可以优化其广告支出,减少浪费,并增加投资效率。

客户旅程洞察:
归因分析可以揭示客户在转化之前经历了哪些接触点(touch points),帮助企业理解客户旅程的关键环节,并据此调整营销策略。

数据驱动决策:
归因分析提供了基于数据的见解,使决策过程更加客观和科学,减少了主观猜测和直觉判断。

5.2 归因分析常用方法

5.2.1 贡献度归因

贡献度归因运用的是Delta法,它是一种用于计算增量贡献率的方法,其核心原理在于通过对比两个不同时间区间的数据变化来量化各个维度对总体变化的贡献程度。具体来说,它关注于每个因素或维度在特定时间段内或特定条件下发生的变动,并量化这些变动对整体结果的影响。

最终,Delta法通过比较各因素或变量的变化量对总体指标变化量的贡献,来评估它们的相对重要性。这种方法广泛应用于数据分析和商业智能中,特别是在需要理解不同因素对整体业务绩效变化影响的情况下。这种评估有助于我们识别出对总体指标变化影响最大的因素或变量,从而为决策制定提供有力支持。

(1).单个维度项的贡献率计算:

(2).同一维度下所有值的贡献率之和等于100%:

该公式表明,在同一维度下,所有子项的贡献率相加应该等于100%。这意味着,如果你有一个维度(比如产品类别),并且在这个维度中有多个子项(比如A类商品、B类商品等),那么这些子项各自的贡献率相加的结果应该是100%。

这个公式适用于分析某个指标(如销售额、用户数等)在不同维度上的分布情况,帮助我们了解哪些维度对整体变化产生了更大的影响。例如,你可以使用这个公式来分析不同地区、不同产品的销售贡献率,以便更好地理解业务的增长来源。

5.2.2 夏普利归因分析

不是所有类型的指标都适合使用Delta法进行贡献度归因。特别是当指标涉及复杂的相互作用或非线性关系时,就需要考虑其他方法,例如夏普利归因分析(Shapley value method)。

夏普利归因分析是合作博弈论中常用的一种信用分配方法。它是基于评估游戏中每个玩家的边际贡献,分配给每个个体参与者的信用值,即夏普利值Shapley value,是该边际贡献在所有可能的参与者排列上的期望值。

在市场营销中,夏普利值可以用来评估不同营销渠道在整个客户旅程中的贡献。传统的归因模型可能会将全部信用归给最后一个点击(Last Click Attribution)或者第一个接触点(First Click Attribution)。然而,这样的模型忽略了中间触点的重要性。夏普利值算法通过考虑所有触点的不同排列组合来提供一个更加公平的归因方法。

设集合p={1,2,...,p},若对于P的任一子集S都对应一个效益v(S),φ_j表示在集合P下第j成员所得的分配,则所得利益分配的夏普利值为:

其中,S是集合P中包含成员x_j的所有子集,|S|是子集S的元素个数,v(S)是子集S的效益,M(j,S)是边际效益,v(S ∪ {x_j})是子集S加上成员x_j后取得的效益。

这里最终计算的值是特征j的重要程度。前面一部分分式表示的是权重,后面一部分括号内表示的是新增特征j前后的变化值。

5.1 贡献度归因分析

在DataFocus中,用户可以通过三种方式来触发贡献度归因,以便深入洞察数据背后的影响机制。接下来详细介绍这三种触发方式,帮助用户更好地利用这一功能来优化决策过程。

5.1.1 自动归因分析

自动归因指的是,如果查询结果包含符合有效日期区间数据则会触发贡献度归因。包括:年月(2024年7月)、年(2024年)、具体日期区间(2024-07-01至2024-08-01、2024年7月1日至2024年8月1日)。

举例如下,数据源选择《电商数据》,搜索“2024年7月1日至2024年7月15日销售金额”,符合自动归因条件,因此下拉滚动条在画图区域下面自动呈现了关于2024年7月1日至2024年7月15日销售金额的贡献度归因分析结果,如图5-1。

图5-1 自动归因分析

点击修改日期或者归因维度的编辑按钮,可查看当前的归因配置,如图5-2。自动贡献度归因日期为查询条件的日期区间,归因指标为查询结果的某一个数值列,而归因维度默认选取数据源前5个数据类型为字符串的列。

图5-2 自动归因默认配置

5.1.2 右键快速归因

除了自动触发,贡献度归因还可以通过手动触发。第一种方式是在返回的结果图表中直接右键快速归因。例如输入“销售数量 产品子类别 订单日期 2024年7月”,此时鼠标右键点击堆积柱状图上特惠炒货的某一点,然后点击“归因分析”按钮,如图5-3。

图5-3 右键快速归因

若系统能识别归因的日期范围无需手动配置归因参数即可完成贡献度归因,识别条件与自动贡献度归因分析相同。区别于自动归因,右键快速归因可以通过右键选中列中值直接将其作为筛选条件到贡献度归因分析中,如图5-4。

贡献度归因分析整体结论显示内容包括:筛选条件,此时为产品子类别=“特惠炒货”;选定日期范围内的指标数据;去年同期的指标数据;同比增长率;上一期指标数据;环比增长率。贡献度排名部分内容包括归因维度和影响前三的维度信息。

图5-4 快速归因结果

若无法自动识别日期范围,此时系统会弹出归因分析参数配置弹窗,需要手动配置,如图5-5。

图5-5 手动配置提示

5.1.3 手动配置归因分析

第二种方式是点击图表左下角的“归因分析”按钮,即通过纯手动配置归因分析参数触发归因分析,如图5-6。

图5-6 手动归因分析

分别介绍一下归因参数的配置:
归因指标:可选择查询结果中的度量列。
归因维度:可选择数据源中的数据类型为字符串的列。最多可选5个。
归因日期:日期区间选择。若归因日期选择了无环比日期和同比日期将无法完成分析。
对齐日期:非选择项,根据归因日期自动计算。
除此之外,这里有几个关键点需要注意:
(1)归因分析的来源数据会受筛选条件影响;
(2)归因指标及归因维度不包含公式列;
(3)维度中只有归因日期有数据而对齐日期缺失,和只有对齐日期有数据而归因日期缺失,会当作无效值处理;
(4)日期区间内无有效的对比差值数据,将报错“指标指定归因日期区间没有归因分析结果”。
例如我们配置贡献度归因的指标为“销售数量”,维度选择“产品子类别”和“快递公司”,归因日期为“2024-09-01至2024-09-30”,如图5-7。

图5-7 贡献度归因配置示例

此时可得到归因结果,如图5-8,2024-09-01至2024-09-30的销售数量4529,2024-08-01至2024-08-31的销售数量为4880,以及同环比情况。

影响最大的维度是快递公司。顺丰环比下降了-29.67%(下降了:-674),对整体环比造成了-192.02%的影响;影响第二大的维度是快递公司。韵达环比下降了-65.30%(下降了:-271),对整体环比造成了-77.21%的影响;影响第三大的维度是产品子类别。果果仁仁环比下降了-13.69%(下降了:-196),对整体环比造成了-55.84%的影响。

图5-8 贡献度归因分析

若想修改参数配置,同样是点击修改日期按钮或者点击归因维度的编辑按钮,如图5-9。

图5-9 修改归因配置

5.2 夏普利归因分析

夏普利归因不像贡献度归因,在DataFocus系统中,夏普利归因只有一种触发方式,就是手动触发。同样简单介绍夏普利归因的触发方式和配置,帮助用户更好地学会利用这一功能。

点击图表左下角的归因分析后,再选择夏普利渠道归因。在参数配置页面,将左侧的属性列和度量列拖拽进对应的触发者列、转化渠道和转化结果中,如图5-10。这里可以看到,允许配置为参数的列需要先添加至搜索框,才可参与渠道归因。

触发者列:查询结果中的属性列
转化渠道:查询结果中的属性列
转化结果:查询结果中的度量列

图5-10 渠道归因参数配置

同样的,有几个关键点需要注意:
(1)渠道归因分析的来源数据会受筛选条件影响;
(2)触发者列、转化渠道和转化结果都可以选择公式列;
(3)转化渠道选择的属性列的列中值不能超过15个。

5.3 归因分析应用案例:电商企业营销归因分析

假设你是一家知名美妆品牌的产品经理,负责双十一期间的营销活动。为了最大化销售业绩,公司布局了多元化的线上销售渠道(如天猫、京东、抖音等)进行了大规模的促销活动,以提升销售额。然而,管理层希望了解这些渠道中哪一个对销售额增长的贡献最大,以便未来能够更精准地分配营销资源。

尽管整体销售额有所增长,但不清楚哪些渠道的表现最佳,哪些渠道需要改进。最主要的是,各渠道的销售表现如何,哪些渠道真正推动了GMV的增长?

接下来就使用数据表《归因分析——全渠道GMV》作为数据源进行营销归因分析,帮助公司更加精准地分配有限的营销资源、优化渠道布局。

图5-11 每月GMV

首先通过“11月 渠道 退后GMV”得到11月份各渠道的GMV汇总数据饼图,如图5-12。从11月各渠道的GMV汇总情况看,GMV排名前1的渠道(天猫旗舰店)占据了总体的80.93%(302.60亿),其余的渠道贡献了剩余19.07%(71.31亿)的GMV。排名前三的分别为:天猫旗舰店、抖音自营、京东专卖。

图5-12 11月各渠道GMV饼图

点击归因分析按钮,如图图5-13配置贡献度归因参数。

图5-13 配置归因参数

根据分析结果,如图5-14,贡献度前三的排名是:天猫旗舰店、京东专卖、抖音自营。

天猫旗舰店是销售额增长的主要驱动力,它不仅占据了整体销售额的大部分份额(80.93%),而且其环比增长率(322.22%)远高于其他渠道,对整体销售增长的影响达到了99.68%,这意味着几乎所有的销售增长都可以归功于天猫旗舰店的表现。

京东专卖店虽然增长率较高(31.45%),但对整体增长的影响较小(2.36%),这表明它的基数可能相对较低。

抖音自营虽然也有增长(13.45%),但它对整体增长的影响最小(1.89%),同样可能是由于基数较低。

图5-14 归因分析结论

鉴于天猫旗舰店的突出表现,公司应该继续加强对该渠道的投资和支持,包括但不限于增加广告预算、优化用户体验、提供更多促销活动等。

对于京东专卖店和抖音自营,虽然它们的贡献相对较小,但仍然有一定的增长潜力。可以考虑分析这两个渠道的具体运营情况,找出限制其发展的因素,比如是否因为产品种类不够丰富、价格竞争力不足或是推广力度不够等,并据此调整策略。

由于天猫旗舰店占据主导地位,公司也需要警惕过度依赖单一渠道的风险,可以考虑多元化渠道布局,提高抗风险能力。

本章小结

本章主要围绕DataFocus中常用的两种归因贡献度归因和夏普利归因的内容展开。归因分析是市场营销和数据分析中的核心工具,用于量化各营销渠道或活动对业务结果的贡献,帮助企业精准优化资源配置。通过对比不同时间点的数据变化,贡献度归因可计算各因素的增量贡献率,揭示关键驱动要素;夏普利归因则基于博弈论,评估各触点在客户旅程中的综合贡献,尤其适合多环节协同作用的复杂场景。企业可据此识别高效渠道、调整营销策略并预测增长来源,推动数据驱动的决策优化。

课后习题

1.根据示例,完成归因分析案例,制作出《电商企业营销归因》;