第2章 图表
2.1 表格
DataFocus的表格大致可以分为两类。一类是数值表,任何图形都可以被切换成数值表的格式,用户可以在表格基础上修改、聚合、筛选、排序,如图2-1。

图2-1 表格
另一种就是数据透视表,数据透视表使用所需的数据结构必须满足两个属性列和一个及以上的数据列。区别于数值表,在数据透视表上可以对数据的小计行和总计行进行计算,因此更适合将数据进行分类汇总处理,如图2-2。

图2-2 数据透视表
2.2 基础图形
DataFocus系统中支持的基本图表类型有柱状图、堆积柱状图、折线图、面积图、饼图、环图、散点图、气泡图、新气泡图、条形图、堆积条形图、漏斗图、帕累托图、KPI指标图、数字翻牌器、仪表图、完成度、水位图、火柴图、雷达图、组合图、位置图以及树形图等,这些都是日常分析中最常出现的图表类型。系统会根据用户当前输入的字段类型和字段个数,自动推荐比较合适的图表类型。用户也可以利用“图表转换”按钮选择更加美观合适的图表类型,满足用户的可视化需求。
2.2.1. 柱状图
柱状图几乎是图表中的万能存在,遇到不能确定用什么图表的情况,用它准没错。柱状图的特点是利用柱体的高度反映数据的差异,效果非常直观。建议将数据排序后使用,效果更佳,适用于分类或时间类型的数据,如图2-3。

图2-3 柱状图
2.2.2. 堆积柱状图
堆积柱状图就是包含多属性列的柱状图,除了可以利用图形高度反映总体数据的差异,也可以计算各个组成部分的占比情况,尤其是当需要查看总体以及对比各系列值的不同比重时,最适合使用堆积柱状图,如图2-4。

图2-4 堆积柱状图
2.2.3. 折线图
我们平时生活中最常见的折线图就是股票的涨跌数据,总能观察到红线条和绿线条,数据的涨跌非常显眼,因此折线图比较适合用在基于时间的数据类型上,最好是连续的数据,可以非常明显看到数据的波动走势,如图2-5。

图2-5 折线图
2.2.4. 面积图
面积图与折线图较为相似,区别就是折线图是点的上下波动,面积图则是利用有颜色的部分数据面积的大小来表示变量数据的大小,也适用于时序数据或分类数据,如图2-6。

图2-6 面积图
2.2.5. 饼图
饼图大多是用来展示数据中不同类别数据的占比情况,显示各类别数据的比例,无须利用公式,饼图即可计算图形中各元素占总体的百分比,如图2-7。

图2-7 饼图
2.2.6. 环图
环图其实就是空心的饼图,使用方法以及效果和饼图也是一致的,如图2-8。

图2-8 环图
2.2.7. 散点图
散点图,也称“相关图”,是由两个数值变量在x、y轴上的交叉点绘制而成的图表,多用来观察各个数据点之间的关系以及分析变量之间的联系,还可以直观地看出数据的分布情况以及特殊的离群值,如图2-9。

图2-9 散点图
2.2.8. 气泡图
气泡图是一种多变量的图表,是散点图的一种变体。气泡图在原有的以横纵坐标为变量的基础上,引入第三个变量,用气泡的大小来表示,从而可以展示三个变量之间的关系。通过气泡的大小,气泡图可以强调不同数据点之间的数据差异,使重要的信息更加突出。例如,我们可以使用气泡图来比较不同产品的销售情况。其中,X轴表示产品的销售量,Y轴表示产品的销售金额,而气泡的大小则表示产品的销售成本,如图2-10。通过观察气泡的大小和位置,我们可以一目了然地看出哪些产品的销售金额高但成本也高,哪些产品的销售金额和成本都较低等。这样的分析有助于我们更好地理解产品的销售情况,并做出相应的决策。

图2-10 气泡图
2.2.9. 新气泡图
新气泡图与气泡图的不同之处在于,气泡图的X轴和Y轴可以是属性列和度量列,也可以均为度量列。而新气泡图则对坐标轴的使用做出了限制,其X轴和Y轴只能为属性列。这意味着在新气泡图中,每个气泡的位置由两个特定的属性决定,因此新气泡图适用于比较两个属性的相关性。我们可以使用新气泡图来比较不同快递公司(X轴)在不同目标省份(Y轴)的运输成本(气泡大小)。通过观察气泡的大小和位置,我们可以直观地了解哪些快递公司在哪些省份的运输成本较低,从而做出更加明智的决策,图2-11。

图2-11 新气泡图
2.2.10. 条形图
条形图近似于将柱状图按顺时针旋转90度,利用条形长度来反映数据的差异,如图2-12。当变量数目较多时,相较于柱状图,更加适合使用条形图,但条形图的类目一般也不超过30条,否则会造成视觉负担,影响对比结果。

图2-12 条形图
2.2.11. 堆积条形图
堆积条形图就是将堆积柱状图顺时针旋转90度,用于对比每一横条的长度总和以及其中各系列的长度情况,如图2-13。

图2-13 堆积条形图
2.2.12. 漏斗图
漏斗图适用于一个连续流程的完成情况分析,显示各个阶段的数据变化,尤其是在网站分析用户转化率的场景下,能够直观、完整地展示用户从进入到完成购买的步骤流程和每个流程的转化情况,帮助读者找出问题所在,如图2-14。

图2-14 漏斗图
2.2.13. 帕累托图
帕累托图是一种结合柱状图和折线图的组合图形,主要用于识别问题的主要原因或关键影响因素。其中柱状图显示某个属性列的统计数值,折线图则显示数值的累计百分比,观察该累积百分比线是否快速上升(符合80/20法则),以便快速定位主要问题。如图2-15。

图2-15 帕累托图
2.2.14. KPI指标图
KPI指标图可以配置恰当的数据单位,适用于高亮关注指标值。选用KPI指标图来显示,结果直观且没有多余信息,一般用于展示企业核心数据,直接显示,如图2-16。

图2-16 KPI指标图
2.2.15. 仪表图
仪表图使用方法和KPI指标图类似,区别在于KPI指标图是以数值形式直接将所需结果进行展示,因此无法与其他数据进行直观比较。仪表图则是确定一个范围后,指针选中数值,可以对比多个数值项,如图2-17。

图2-17 仪表图
2.2.16. 完成度
完成度图特别适用于对两个数据进行直观比较,清晰地展现它们之间的差异。这种图表不仅能够帮助我们了解事情的进展程度,还能够直观地揭示出各项任务、项目或指标的完成情况。在完成度图中,数据通常以条形或线段的形式呈现,其中一个数据代表当前的实际完成情况(如销售金额),而另一个数据则代表预期或目标完成情况(如目标金额)。通过对比这两个数据的长度,我们可以迅速判断任务的完成进度,以及是否达到了预定的目标,如图2-18。

图2-18 完成度
2.2.17. 水位图
水位图是一种独特且富有创意的数据可视化图表,它巧妙地利用波浪的形态来展示水位情况,进而直观地反映出数据的占比关系。通过水位图,我们可以轻松地查看某一数值相对于另一数值的百分比情况,从而对数据的大小、比例和分布有更为清晰的认识。与完成度图相比,水位图更生动和具象。然而,水位图更侧重于展示数据的占比和百分比差异,而不是像完成度图那样对比两个动态变化的数值,如图2-19。

图2-19 水位图
2.2.18. 火柴图
一个二维的火柴图把数据显示为沿 x轴的基线延伸的线条,圆点表示为每个杆的结束,y轴则显示数据值。在数据可视化时,针对离散序列,一般会使用火柴图来进行展示,它能够清晰地显示数据点之间的间隔和跳跃,从而帮助观察者快速识别数据中的变化趋势和异常值。这种可视化方式尤其适用于那些数据点之间差异较大或数据点数量较少的情况,如图2-20。

图2-20 火柴图
2.2.19. 雷达图
雷达图,又称蜘蛛网图或星形图,是一种广泛应用于多维数据可视化的图表类型。它通过从中心点出发的多条辐射状轴线,将不同维度的数据以直观、清晰的方式展示出来,使得数据之间的关联性和差异性一目了然。雷达图的核心结构由中心点和从中心点辐射出的多条轴线组成。这些轴线通常代表不同的变量或指标,如市场份额、产品性能、客户满意度等。在雷达图上,每个变量或指标都会有一个对应的数据点,该数据点的位置由其在该变量或指标上的数值决定。数据点越远离中心点,表示该变量或指标的数值越高;反之,则越低,如图2-21。

图2-21 雷达图
2.2.20. 组合图
在进行数据分析时,如果遇到两列数据的差距很大或者维度不同的情况,就非常适合使用组合图。如数据表中有两列数据,一个销售金额,一个增长率,将他们放到一个Y轴中,由于数值相差太大,增长率的变化趋势无法看清,此时就需要利用组合图区分不同的Y轴来分别显示这两列数据。利用组合图,可以将数据按照不同的表现形式进行展示,帮助多组数据进行协同分析,如图2-22。

图2-22 组合图
2.2.21. 嵌套树图
嵌套树图,以其独特的层次结构和直观性,在展示数据的“一对多”关系时发挥着重要作用。在嵌套树图中,每个数据元素都被表示为一个节点,这些节点通过线条或空间关系相互连接,形成一个树状的层次结构。嵌套树图并不强调节点的形状或大小(如矩形大小),而是更注重节点之间的嵌套关系和层级结构。在嵌套树图中,父节点位于画布左侧,其下属节点从左到右依次排列,这种设计使得数据的层级关系一目了然。例如数据表的结构中含有部门层级关系这种“一对多”的数据结构,就可以选择嵌套树图进行可视化,将“部门ID”和“上级部门ID”作为节点,展示各部门的考勤评分,如图2-23。

图2-23 嵌套树图
2.3 高级图形
除了上面介绍到的经常会用到的基础图形,DataFocus系统还支持一些稍微复杂但非常美观的高级图表,包括矩形树图、分解树图、关系网络图、词云图、瀑布图、旭日图、打包图、弦图、桑基图、箱型图、平行图、时序柱状图、时序条形图、时序散点图、时序气泡图、极坐标柱状图、子弹图、日历热图、位置经纬图、经纬图、经纬气泡图、经纬热力图、经纬统计图、轨迹图和直方图等,其中时序柱状图、时序条形图、时序散点图、时序气泡图都属于动态图表,会根据数据中的时间日期进行变动。
2.3.1. 矩形树图
矩形树图采用矩形的面积和颜色表实不同类型的区分,以及同类型数据的占比。 通常包含至少1个属性列和一个数值列,如果有两个有包含关系的属性列时,用该图形展示可以获得很好的效果。比如当数据为省份,城市,销售金额时,矩形画布会根据不同省份的销售金额大小划分出不同颜色的矩形分块展示,而同一个省份下的城市则用相同颜色表示,这样用户对于各省份销售额的大小比例会有直观的感知,同时还可以进一步关注相同颜色块下的城市的销售金额占比情况,层次丰富,结果直观。如图2-24。

图2-24 矩形树图
2.3.2. 分解树形图
分解树形图可以方便的查看多个维度中的各个成员对整体的贡献,你可以将度量值分解至一个或多个组,查看其各个类别的数据表现,图表会自动根据选定的度量(如销售金额)对它们进行分解和排序。分解树的使用场景很多,比如渠道分析、贡献分析。通过分解核心指标,来找到影响指标的关键渠道或关键成员,如图2-25。

图2-25 分解树形图
2.3.3. 关系网络图
关系网络图是一种强大的可视化工具,用于展示数据集中不同实体之间的联系及其相互作用。在关系网络图中,节点(nodes)代表个体或实体,可以分为起点实体和终点实体,它们通常在图表中被表示为一系列的小圆;边(edges)则表示这些节点之间的关系或连接,也就是图表中连接各个节点的线段,如果是有向图,边则会显示为有方向的箭头。为了让图表更加易于理解,节点的外观,比如大小、颜色和上面写的文字(标签),都可以根据数据的某些特点来调整,例如可以设定节点颜色模式为按排名区分,如图2-26。

图2-26 关系网络图
2.3.4. 词云图
词云图一般用于显示词汇出现的频率,字体较大的就是出现频率较高的,字体较小的就是出现频率较低的,这样一目了然,可以使用户直接看到词频最高的几个类目,比较适用于分类变量数据,用户还可以通过配置让词云按照特定的图形或字形进行展示。如图2-27。

图2-27 词云图
2.3.5. 瀑布图
瀑布图是一种有效的视觉工具,用于展示数据从初始值到最终值之间,经过一系列上升和下降变化的过程。它特别适用于表达基于时间的数据演变情况,比如追踪每月运输成本的环比增量变化。通过瀑布图,可以清晰地看到成本在不同月份是如何增减的,从而帮助理解整体趋势和各个阶段的变动情况,如图2-28。

图2-28 瀑布图
2.3.6. 旭日图
旭日图和树形图有些类似,也是利用父子层次结构来清晰地表达层级和归属关系。旭日图是一种圆形嵌套图表,通过多个环形的层次结构来展示数据的层级关系。每个环形代表一个层级,从中心向外扩展,每一层都进一步细分数据。旭日图可以直观地展示每个层级的数据是如何细分的,每个扇形区域代表一个子类别或子数据集,其面积大小(或角度大小)反映了该类别在总体中的占比,如图2-29。

图2-29 旭日图
2.3.7. 打包图
打包图其实就是将同一大类下的数据进行打包,数值较大的占的面积就较大,也就是圆圈面积较大,比较适合表达静态数据的分类构成,如图2-30。

图2-30 打包图
2.3.8. 弦图
弦图,亦称圆形桑葚图,由沿圆周排列的节点分段和连接它们的弧形边构成。节点代表不同类别,边则展示这些类别间的关系,弧线的宽度和颜色可反映关系的强度和类型。弦图可以在“多类别+复杂关系”的情况下,有效降低视觉复杂度。就场景而言,弦图最常被用来表现复杂的关系、以及数据的流动情况等,如图2-31。

图2-31 弦图
2.3.9. 桑基图
桑基图是一种高度专业化的图表类型,其独特的设计使其特别适用于展示数据的逐步流动或转移过程。这种图表通过精细的分支结构,将数据的流动路径以直观且易于理解的方式呈现出来。在桑基图中,每一条分支的宽度都精心设计,直接代表了数据流量的大小,这种设计使得观察者能够迅速捕捉到数据在不同阶段或节点之间的流动情况。桑基图中的每一分支的宽度就代表了数据流量的大小,如图2-32。

图2-32 桑基图
2.3.10. 扩展桑基图
相比于传统的桑基图,拓展后的桑基图在功能上有了显著的增强。它支持使用三个属性列进行画图,这一特性使得数据展示更加丰富和立体。通过引入额外的属性维度,拓展桑基图能够更全面地反映数据的流动情况,为观察者提供更加深入的分析视角。例如使用日期、订单ID和行为三列数据制作扩展桑基图,可以直观地看到不同日期之间数据流量的变化趋势,以及订单在不同行为阶段的数据流动情况。如图2-33。

图2-33 扩展桑基图
2.3.11. 箱型图
箱型图是一种用作显示一组数据分散情况的统计图,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。这种图表设计简洁而富有信息量,通过几个关键统计量,就能有效地概括数据集的总体情况。具体来说,箱型图能够清晰地展示一组数据的最大值、最小值、中位数以及两个四分位数(即第一四分位数Q1和第三四分位数Q3)。四分位数(Q1、Q2即中位数、Q3)将数据分为四个数值上相等的部分,其中Q2(中位数)作为分界点,将数据分为两个数值上相等的子集。这四个部分以及它们之间的统计关系,共同构成了箱型图的核心框架。箱体的长度反映了中间50%的数据分布情况,即Q1到Q3的范围,这有助于观察数据的集中趋势和离散程度。此外,箱型图还能够有效识别并标记出异常值(或称极端值),这些值通常位于箱体的上边缘之外,用单独的符号圆圈等表示。异常值的检测对于数据分析至关重要,因为它们可能代表数据中的错误、噪声或特殊事件,对数据分析结果产生显著影响,如图2-34。

图2-34 箱型图
2.3.12. 平行坐标图
平行坐标图是一种用于可视化多维数据的图表类型。它通过一系列的垂直轴(平行坐标轴)来表示数据集中的每个维度,每个数据点在图中的位置由它在各个维度上的值决定,通过折线将这些值连接起来,从而揭示数据之间的关系和模式,如图2-35。

图2-35 平行图
2.3.13. 时序柱状图、时序条形图、时序散点图、时序气泡图
作为时间序列类的动图,时序柱状图、时序条形图、时序散点图、时序气泡图的使用方法和柱状图、条形图、散点图、气泡图是一致的,需要至少一个属性列和一个数据列的二维数据结构,但不同的是时序图需要在搜索界面输入一个时间关键词,每年或每月。最后再对时序图的轮播时间进行一个设置即可,如图2-36至图2-39。

图2-36 时序柱状图

图2-37 时序条形图

图2-38 时序散点图

图2-39 时序气泡图
2.3.14. 极坐标柱状图
极坐标柱状图将柱状数据沿圆周排列,以角度区分类别,半径长度表示数值大小,适合展示周期性或对比数据,尤其是时间序列较长采用普通柱状图无法一次性展示时,可以用极坐标柱状图显示,还可以较好的展示数据的周期性规律,需要注意的是数据类别过多时易造成视觉拥挤,一般不宜超过24个类别,如图2-40。

图2-40 极坐标图
2.3.15. 子弹图
子弹图,正如其名,其设计灵感来源于子弹射出后的轨迹形态,通过巧妙地结合条形图和参考线,为我们提供了一种直观且高效的数据可视化方式。这种图表不仅能够清晰地展示数据的完成情况,还能揭示数据的进展趋势,以及实际表现与目标之间的差距。在子弹图中,通常会有一个或多个条形来代表不同的数据点,这些条形可能具有不同的长度、颜色和标记,以区分不同的数据类别或时间段。同时,图表中还会设置一条或多条参考线,如目标线、合格线等,以便与实际数据进行对比,如图2-41。

图2-41 子弹图
2.3.16. 日历热图
日历热图就是将时间与热图进行了结合,这是一种双变量图,由时间变量和另一种变量组成,其具体形式是由小色块群有序且紧凑地以日历格式组成的图表,每个小色块代表一天,而小色块颜色深浅则呈现另一种变量。通过日历热图,我们可以查看具体年月日的详细情况,可以非常直观的具体到某一天,如图2-42。

图2-42 日历热图
2.3.17. 相关热力图
相关热力图使用颜色深浅来表示变量之间的相关性强弱。在热力图上,每个单元格代表两个变量之间的相关性,颜色越深表示相关性越强,颜色越浅表示相关性越弱,如图2-43。这种图表在数据分析、统计学、社会科学研究、生物学、市场营销等多个领域都有广泛应用。

图2-43 相关热力图
2.3.18. 直方图
直方图,即次数分配表,沿横轴以各组组界为分界,组距为底边,以各组数量为高度,每一组距上画一矩形,所绘成的图形,如图2-44。可应用于对一个数据集中的值在另一个数据集类中的频数分布进行研究,如用来监控产品质量状况,能比较直观地看出产品质量特性的分布状态,便于判断其总体质量分布情况。

图2-44 直方图
2.3.19. 提琴图
提琴图是一种结合了箱型图和核密度估计图特点的数据可视化工具,它能够全面地展示数据的分布特征,其形状类似小提琴的轮廓。与传统的箱型图相比,提琴图提供了更多的信息,因为它不仅显示了数据的中位数、四分位数和异常值,还通过图形的宽度变化来表示数据的密度。图形的中心线通常代表中位数,而图形的宽度则根据数据点的密度变化,数据点越多的区域,“提琴”的“身体”就越宽,这直观地反映了该区间内数据的集中程度,如图2-45。

图2-45 提琴图
2.3.20. 时间事件图
时间事件图是一种按时间顺序排列和显示一系列事件或任务的起止时间和持续时间的图表。时间事件图的核心在于其直观性。它通过将事件或任务按照时间顺序排列在一条水平的时间轴上,使得观察者可以一目了然地看到这些事件或任务的发生时间、持续时间和相互关系。每个事件或任务通常用一个符号、形状或颜色块来表示,这些视觉元素不仅区分了不同的事件或任务,还通过它们在时间轴上的位置和长度,传达了关于时间的关键信息,如图2-46。

图2-46 时间事件图
2.4 图表个性化设置
DataFocus中,除了支持自由更换图形之外,还支持各种图形的个性化设置,不同图形可设置的功能点有些许区别,用户可以点开设置项,探索其中的差异。每个人的审美和视觉喜好都不一样,DataFocus在可控制的范围内,尽可能地满足每个人的喜好,包括主题颜色、字体设置、数据标签格式等等,都可由用户自行设置。
以折线图为例,在搜索出结果后,点击右上角的“图表属性”,可配置图表属性,其中包括有通用属性配置、线条配置、颜色/线条、X轴、Y轴、图例、网格线配置、数据标签、悬浮文本设置、标度、分析器配置、拓展搜索结果、定时刷新等。
2.4.1 通用配置
通用属性配置,主要是用来设置主题颜色、字体大小、是否隐藏聚合方式、是否禁止动画、图例数量限制等功能,如图2-47。为了提升可视化效果,将字体大小设置为加粗和倾斜,此时画图区域文字都会加粗和倾斜。如果只想在X轴和Y轴显示列名,则可以勾选隐藏聚合方式,那么此时的X轴“发货日期每月“将会修改为“发货日期”,Y轴“销售金额的总和”将会修改为“销售金额”。图例数量限制可以作为图例列的列中值数量限制,默认情况下,列中值去重后的数量<=50的属性列才可以作为图例,在这个配置下若某一属性列去重后的列中值大于50,则不允许配置为图例。

图2-47 通用配置
2.4.2 线条配置
线条配置、颜色/线条则是折线图特有的图表属性配置,可配置折线的线条样式、宽度、颜色以及节点样式等,如图2-48。在线条配置中线条样式选择自然曲线、线宽输入2、虚实选择虚线,此时折线图中的折线变为线宽为2,样式为自然曲线的虚线。勾选显示节点,可以对节点的半径、节点样式、节点是否描边进行配置,例如配置节点为菱形且有黑色描边以凸显节点。勾选阴影线,折线下方则填充对于图例颜色阴影。

图2-48 线条配置
2.4.3 X轴Y轴配置
针对有X轴和Y轴的图表的可配置项,例如饼图就没有这两项配置。X轴、Y轴可配置是否显示图轴、图轴字体样式、刻度、轴标题、对齐方式等。以X轴配置为例,轴标签和轴标题可分别配置,其中字体样式会继承通用配置中的字体样式当然可单独修改,例如将X轴的轴标题字体颜色设置为蓝色,同时设置轴标题内容为“日期”,如图2-49。

图2-49 X轴配置
2.4.4 图例配置
支持配置图例的字体样式、位置、边距、间隔等。例如为了实现图例显示在画图区域上方,可在图例配置的位置选择顶部,并且调整间距为70以获得更好的可视化效果,如图2-50。

图2-50 图例配置
2.4.5 网格线配置
主要用来配置是否隐藏网格线、零线,以及配置样式。例如为了画图区域更简洁,我们可以勾选只显示零线,并且配置零线颜色为蓝色,此时除零线外其余网格线将被隐藏,只显示一条蓝色的零线,如图2-51。

图2-51 网格线配置
2.4.6 数据标签格式配置
勾选显示数据标签后可配置数据标签格式,包括字体样式、显示文本、位置、旋转、显示范围,是否允许重叠。例如为了更好地观察各区域销售金额的最大值和最小值,在文本配置中通过不同的宏替换成想要显示的内容,使用宏“ [区域(第2列)] [销售金额(第3列)]”,即可将默认的数值内容更改为区域和销售金额,同时显示范围选择“最大/最小”,图表的数据标签将只显示各区域销售金额的最大及最小值,如图2-52。

图2-52 数据标签配置
2.4.7 悬浮文本配置
和数据标签类似,悬浮文本配置也可通过替换宏的方式配置。例如配置悬浮文本为“[发货日期(第1列)] [区域(第2列)] [销售金额(第3列)]”,此时数据悬停于任一节点,将按显示该节点的发货日期、区域及销售金额数据,如图2-53。

图2-53 悬浮文本配置
2.4.8 标度配置
允许用户自定义多个Y轴标度[参考线],Y轴文本,显示颜色及显示样式,只有在标度值与颜色被设置过,才会在图形中显示直线模式下,默认标度值为第一个数值列的平均值。标度类型可选择直线或者范围,例如配置标度为标准差和平均值的区域范围,那么将标度上限设置为“平均值”,下限设置为“标准差”即可,如图2-54。

图2-54 标度配置
2.4.9 分析器配置
选择当前搜索结果可以配置的分析器,默认为无分析器。可按需选择分析器。相关性分析:使用最小二乘法绘制出拟合线两个度量列数据的拟合线。离群分析:检测数据中存在的个别数值与其他数值相比差异较大的数据。时序预测:使用Holt-Winters指数平滑分析方法预测未来数据,如图2-55。

图2-55 分析器配置
2.4.10 扩展搜索结果
搜索结果数量的配置,默认为1000,最多返回100000。多用于返回结果较多时,通过该配置提升返回数据行数,例如搜索“订单日期 订单单号 运输成本”,数据超过了1000行,为了查询所有数据,将搜索行数配置为5000,此时返回了所有符合条件的数据,行数为4147,如图2-56。

图2-56 扩展搜索结果配置
2.4.11 定时刷新
定时刷新配置是启动并配置在数据看板内的定时刷新间隔,配置后,当前历史问答在数据看板中会定时刷新数据,变化后反应在图形中。定时刷新只作用在使用了直连表的问答上;导入表数据更新后,问答数据会自动更新。配置间隔时间(s)后,当前问题将会按照配置的时间间隔定时刷新。间隔时长至少>20s。例如为了获取最近6个月的销售金额,制作了一个KPI历史问答用于数据看板,并且希望伴随每日直连的销售数据源更新,该结果也及时在数据看板被更新,则可以勾选“启动在数据看板内的自动刷新”,如图2-57。

图2-57 定时刷新配置
2.4.12 告警提示
日常业务中,我们需要监控很多指标信息,例如财务的各种专项能力分析,其实际就是各个不同的指标比率,如资产负债率、销售利润率、存货周转率等等。对于这种指标类型的数据,如何实时地监控,更好地掌握其变化情况,及时地将有效信息传递出去,是数据可视化的一个难点。
在DataFocus中,告警功能的出现,就是为了解决上述这些难点。可以对每月销售金额设置告警值,若低于该告警值,则图表中符合条件的数据将会红色闪烁以示警,同时还会发送一份告警消息通知有关人员该指标出现异常,需要重点关注,及时解决,如图2-58。

图2-58 告警配置
2.4.13 切片放大
在数据可视化展示中经常会遇到数据量非常多的情况,横坐标轴经常会只显示部分标签,这时候用户看不到所有的横坐标轴标签值,有可能会错过某些重要信息。在DataFocus中,可以将某块局部区域放大到能够看清所有信息为止,那么如何放大呢?其实很简单,在需要放大的区域按住鼠标左键,然后往左或者往右拖,鼠标松开的那一刻,即可看到这块区域被放大,数据显示得更加清晰,如图2-59和图2-60。

图2-59 数据压缩显示

图2-60 放大显示
2.5 图表固化
在企业实际业务中,我们经常需要制作图表,例如销售月报表、销售季报、财务月报、财务年报等,而这些其实都是毫无意义的重复性工作,不仅浪费大量人力,也会消耗员工的热情,谁也不想整天做重复的工作,如果有这样一款工具,可以帮助员工从这些工作旋涡中解脱出来,相信企业和员工都会很高兴。
这时候就是DataFocus大显身手的时候了。可以将这类重复性的图表保存固化,并且设置数据自动更新,那么后续无须重复制作,随时可查看制作好的图表。这大大减轻了员工的工作量,并且可为企业节省更多的人力成本,让员工将更多的精力放在更有意义的事情上。
固化图表非常简单,只需在搜索结束后,点击右上角“保存”按钮,为该图表命名,保存成功即固化成功,如图2-61。

图2-61 保存为历史问答
后续想查看该图表时,只需在“项目”或者“历史问答”页面,通过命名的问答名称找到该问答,点击“编辑”按钮,重新回到搜索页面,对图表进行查看或更改,如图2-62。

图2-62 重新编辑历史问答
2.6 复制图表
有时候,我们需要在已制作完成的图表上做进一步的分析展示,这时候,我们是否需要重新制作一份相同的图表呢?其实不需要。DataFocus是支持图表复制的,就是说,用户可以复制已经固化的图表,形成一份新的图表,对这份新图表进一步操作,这样既不会影响原有图表,也不用浪费时间重新制作。查看问答时,点击右上角的“…”按钮下的“复制”按钮,即可复制该问答的图表,如图2-63。

图2-63 复制问答
2.7 单个图表导出
数据分析完成后,点击右上角的“…”按钮下的“导出数据”或“导出图片”即可进行单个图表的导出,如图2-64。

图2-64 单个图表导出
2.8 图表应用案例:客户黏性分析
近些年来,移动互联网飞速普及,各式各样的APP如雨后春笋般出现,有的如昙花一现,有的却能持久受到人们的喜爱。其实归根结底,是一个用户留存和黏性的问题。因此,很多人会有这样的一个疑问:如何提高用户黏性呢?我们以某款APP为例介绍黏性分析法。
以某款APP为例,我们可以通过黏性分析法来深入探讨用户黏性的提升策略。首先,我们需要了解用户在一周内的使用天数,这可以通过分析《教材_上周天数分布情况》数据表来实现。由于我们需要统计人数,因此添加公式“人数情况”,利用“count”函数对登陆的用户ID进行计数,如图2-65。

图2-65 人数情况
此时可以在搜索框输入“天数分布 人数情况”,切换为打包图,并在图表属性配置显示数据标签,如图2-66。大部分用户只登录了一天,而登录次数超过五天的用户则寥寥无几。这反映出该APP在用户留存方面存在较大的提升空间。

图2-66 上周用户登录天数分布
为了更深入地了解用户黏性,验证会员体系对黏性的影响,我们切换数据表为《教材_近一个月用户黏性》。此时由于两个数据表都含有“登陆会员ID”列,因此可以继承公式“人数情况”。在搜索框直接输入“是否为会员 天数分布 人数情况”,对比充值会员和非会员在近一个月内的登录天数分布情况,将返回结果切换为条形图,如图2-67。该数据表的时间范围为近1个月,即数据收集点以前的一个月。无论是会员还是非会员,登录天数最多的都是一天,这进一步验证了该APP在用户留存方面的挑战。

图2-67 不同用户群黏性对比
然而,用户黏性的提升并非无计可施。我们可以通过推出特别企划活动来刺激用户的活跃度,并观察这些活动对用户黏性的影响。在发现存在用户留存问题后,该公司在APP发布了一周特别企划活动来提升用户黏性。为了评估活动效果,我们选取了《教材_企划活动后用户黏性天数分布情况》数据表进行分析,该份数据包含了企划活动周前后6周用户签到的天数分布情况,因此我们可以分析会员和非会员在企划活动发布前后每周签到行为在两天及两天以上的人数变化趋势来判断企划活动对用户黏性提示是否有帮助。在搜索框输入“每周 人数情况 是否为会员 天数分布不为“1””,切换为新气泡图,并勾选显示数据标签,如图2-68。

图2-68 不同用户群黏性趋势变化
为了会员和非会员的黏性变化趋势的对比更明显,可以在搜索框增加“是否为会员”,在图轴配置,将新增的这一列配置为图例,此时会员和非会员将显示为不同的颜色,如图2-69。由图可见,活动启动当周(2024年第43周,10月26日-11月1日),在企划活动发布前6周登录天数在两天及以上的会员及非会员的用户都还比较少。但在企划活动周,登录天数在两天及以上的会员及非会员的用户都有了一个比较大的提升,并且在接下来的五周里,会员用户黏性相较于前6周明显有所增加并保持了相对稳定。这充分说明,通过策划和执行有针对性的活动,我们可以有效提升用户的黏性和活跃度。

图2-69 增加图例
但同时可以发现,本次企划活动对于非会员的激励效果相较于会员表现较差。为了探究企划活动对会员和非会员黏性变化的激励作用差异。首先为了了解企划活动后,用户签到天数分布的大致情况,在搜索框输入“日期大于等于"2024-10-26" 是否为会员 活跃度分级 人数情况”,筛选出企划活动开始后的数据。将返回数据结果用饼图呈现,并在数据标签使用宏“[天数分布(第1列)] [类别百分比]”显示各天数分布的占比情况,如图2-70所示。企划活动后用户的签到天数分布在1-6天不等,其中1天最多,6天最少,但值得注意的是4天的占比排名第二,进一步验证了企划活动对用户黏性的激励作用。

图2-70 企划活动后天数分布情况
为建立用户分层运营模型,我们创建'活跃度分级'字段:通过条件函数将将签到天数1天的用户划分为低活跃度用户,2-3天的划分为中活跃度用户,大于3天的为高活跃度用户。因此增加公式“活跃度分级”,输入“if天数分布="1"then"低活跃用户群体"elseif天数分布="2"or天数分布="3"then"中活跃用户"else"高活跃用户"”,如图2-71所示。

图2-71 活跃度分级
为了获得会员和非会员的活跃度对比,在搜索框输入“日期大于等于“2024-10-26” 是否为会员 活跃度分级 人数情况”,获取会员和非会员的活跃分级数据,并且切换为旭日图。旭日图可以通过多个环形的层次结构来展示数据的层级关系,每个环形代表一个层级,从中心向外扩展,每一层都进一步细分数据。为了展现各分层数据,在数据标签中使用宏“%_CATEGORY_NAME %_BR %_PERCENT_OF_CATEGORY”,如图2-72所示。中心的环形划分会员和非会员,非会员占比为54.3%,会员占比为45.7%。下一层的环形则进一步划分了会员和非会员不同活跃度占比,会员和非会员用户中低活跃度用户的占比都是最高的,但是会员的高活跃度用户高于中活跃度用户,而非会员的中活跃度用户高于高活跃度用户。

图2-72 不同活跃度用户占比
结合之前的分析结果,揭示了两大关键问题:会员体系对提升用户活跃度具有显著作用;非会员用户存在短期体验后流失的风险。因此针对该情况,可以使用以下优化策略:针对高活跃会员推出专属权益(如签到积分加倍、限量功能解锁),增强核心用户忠诚度;对低活跃非会员设计转化激励(如连续签到3天赠送3日会员体验),引导其向中高活跃群体迁移。
总而言之,提高用户黏性需要我们从多个角度进行深入分析和实践。通过了解用户在不同时间段内的使用情况、对比不同用户群之间的黏性差异、观察特别企划活动对用户黏性的影响,或者进一步描绘关注用户的留存曲线,我们可以逐步优化APP的用户体验和服务质量,从而赢得用户的长期信任和支持。
本章小结
在本章节中,我们深入探讨了DataFocus平台所支持的一系列数据可视化类型。重要的是要理解,每种图表类型都与其特定的数据格式相匹配。当用户将鼠标悬停在图表图例上时,系统会贴心地提供关于该图例所要求的数据格式信息,这极大地方便了数据的准备与匹配过程。
此外,DataFocus还赋予用户高度的个性化定制能力,通过图表属性设置,用户可以对图表的外观和表现进行精细调整。特别提醒的是,位于图形展示区域右侧的“图表属性”功能板块,这里隐藏着众多样式配置的选项,是打造专属视觉效果的关键所在,切勿忽视其强大作用。
课后习题
1.导入示例数据表《教材_电商销售数据》,尝试本章所述的各种可视化图形。
2.搜索并保存一个饼图,并通过图表属性将这个普通的饼图转变为独特的玫瑰模式。