游戏数据分析实践

来自DataFocus资料库
跳到导航 跳到搜索

目录

第一章 何为数据分析?

在如今这个大数据时代,大数据的应用越来越彰显它的优势,且占领的领域也越来越大。那么,如何对数据进行分析,以使其得到更好的应用呢?今天,我们借助DataFocus系统开启了解数据分析的里程。

1.1.什么是数据分析

数据分析,对数据有目的地进行分析以获取信息并使其更易于理解。对于从事数据分析工作的人员,除了借助数据发现事实存在的“经验和常识”,还应通过适当的统计、分析方法,发现数据潜在的价值,预知未来可能发生的某种情景,在为公司规避风险的同时抓住机遇,实现数据分析工作的价值。

1.2.数据分析步骤

数据分析一般包括六个阶段:明确需求、数据收集、数据处理、数据分析、数据展现、报告撰写。

1.2.1.数据需求与收集

明确需求是确保数据分析过程有效性的首要条件,为收集和分析数据提供清晰的目标;收集的数据涉及企业内部或企业外部两个数据来源,如产品中用户行为数据、问卷调查数据、新闻、贴吧、QQ群、爬取的数据等等。

1.2.2.数据处理与分析

收集好数据后,需要根据分析的需求对数据进行处理;进而采用适当的分析方法来分析数据。

数据的来源多样且存储格式各异,一般会占用较多的时间对数据进行处理。可以提前和研发、BI等相关部门做好沟通,也可以借助一些商业智能BI处理数据并对处理后的数据进行分析。

例如BI分析系统DataFocus,作为专业的数据分析工具,支持将不同来源的数据进行整合、分析。可以将数据导入到系统自带的数据仓库并设置定时导入,包括本地文件和不同业务数据库中的数据。当然,DataFocus也可以直接连接业务数据库。

《游戏数据分析实践》图表 1. 1 DataFocus_数据导入


《游戏数据分析实践》 图表 1. 2 DataFocus_导入本地文件


在DataFocus系统中,可以直接进行数据清洗、 数据转换,数据抽取、数据分组、数据计算等操作。并采用搜索分析的方式对数据进行结构分析、对比分析、平均分析、交叉分析等等。

《游戏数据分析实践》 图表 1. 3 DataFocus搜索分析与公式计算


1.2.3.结果展现与应用

分析结果主要通过图表的形式来展现,可用于制作可视化大屏、撰写分析报告。

《游戏数据分析实践》图表 1. 4 DataFocus系统图表


在制图时,需要先确定想要表达的信息,再根据数据关系选择合适的图表,并确保数据展现的真实性和表达的准确性。

在DataFocus系统中制作好的图表可直接用于可视化大屏的制作。

报告的撰写可采用总分结构,分为标题、导语、结论和详细分析四个内容。

1.3.数据分析的价值

数据的价值,往往在于通过数据驱动业务,以期给公司获得更多利润、增强用户体验、为行业发展提供更多可能等等。

例如游戏行业,通过对企业运营情况、畅销游戏类型、IP和题材等数据进行多层次、多角度分析,来了解行业动态、把握市场发展趋势;分析游戏测试数据,对产品的质量进行评估,并帮助产品进行定位;对用户进行画像,以有针对性地制定营销策略等等。

初步了解数据分析及其流程、价值后,接下来文章,我们将对数据分析进行更加细致的了解。

第二章 不会代码,能否自助进行数据分析?

数据分析师一般需要有扎实的SQL基础、有统计学基础、能熟练使用Excel且至少掌握一门数据挖掘语言等素质。那么,对于不懂代码、没有SQL语言基础的业务人员,能否进行数据分析呢?在当今科技发展的时代,商业智能BI应运而生,使业务人员从自身需求出发自助进行数据分析成为现实。

今天,我们借助DataFocus系统来了解下BI产品如何完成数据分析。

2.1.数据的查询与提取

将数据库中数据导入DataFocus系统后,可以在搜索模块通过搜索方式用关键词、公式、列名等进行数据的查看和提取。

支持连接的数据库包括mysql、postgresql、oracle、IBM DB2、sqlserver、Sybase、GaussDB 100、Pivotal Greenplum等。

《游戏数据分析实践》图表 2.1数据源


我们来看几个常见的数据查询和提取,在DataFocus中是通过哪些关键词和公式来实现:

(1) 查询表中列值,在搜索框中直接输入列名即可。

(2) 对数据聚合,使用聚合公式如count()求行数、max()求最大值、sum()求和、sum_if()按条件求和等。

《游戏数据分析实践》图表2.2 公式


(3) 分析公式:累积求值,如cumulative_sum()、cumulative_count()、cumulative_max()等等;

分组求值,如group_sum()、group_average()、group_min()等等 移动求值,如 moving_count()、moving_variance()、moving_sum()等等 (4) 对日期进行计算,使用日期公式如add_days()增加天数、diff_days()求相差天数、is_weekend()判断日期是否为周末等等

(5) 查询并将某个字段按正序和逆序排列时,在系统中使用功能键或在搜索时使用排序关键词,如“按销售额升序”

(6) 根据特定条件进行查询提取,如使用公式if..then..else() 实现逻辑判断

(7) 查询数据中前几项、后几项或中间项,可以使用筛选关键词,例如“排名第3到5的销售金额的总和”。

(8) 将表中数据行合并起来,可以使用文本操作函数concat()

2.2.数据的处理、分析

在DataFocus系统中,数据的处理与分析是通过建立表间关联关系、创建中间表、数据转换等系统功能,以及系统支持的公式和关键词来实现。

(1) 在数据表管理模块,给表之间建立关联关系。使这些数据表可以在搜索模块一起进行数据分析。

《游戏数据分析实践》图表2.3 创建关联关系


(2) 在系统的搜索模块,通过公式、关键词、中间表等功能,处理重复或缺失数据。

《游戏数据分析实践》图表2.4 补全缺失值


(3) 使用搜索模块的数据转换功能,进行行列转换

《游戏数据分析实践》图表2.5 行列转换


(4) 使用公式进行运算与分析

《游戏数据分析实践》图表2.6 公式运算分析


2.3.数据可视化

在BI系统中,数据分析结果可以直接以图表形式展现,并进行可视化大屏的制作。

例如DataFocus系统会根据搜索分析结果自动选择图表展现,并支持图表更换、编辑与美化。

《游戏数据分析实践》图表2.7 图形转换


将图表保存到系统中后,可以通过创建编辑看板,直接用该图表制作可视化大屏。

《游戏数据分析实践》图表2.8 编辑可视化大屏


商业智能BI是数据仓库、联机分析处理和数据挖掘等技术的综合应用,能有效帮助业务人员甚至企业降低数据分析的成本。

第三章 数据分析常用方法概览

对数据进行分析的方法很多,常用的有对比分析法、分组分析法、结构分析法、交叉分析法、漏斗图分析法、矩阵分析法、综合评价分析法、5W1H分析法、相关分析法、回归分析法、 聚类分析法、判别分析法、主成分分析法、因子分析法、时间序列、方差分析等等。

本章,我们先简单了解下部分数据分析方法。

3.1. 对比分析法

即比较分析法,对数据进行比较以分析数据间的差异,包括静态比较和动态比较。静态比较又称横向对比,在同一时间下对不同指标进行的对比;动态比较也称纵向对比,是在同一总体条件下对不同时期指标数值进行的比较。目的是揭示数据代表的事物的发展变化和规律性。

《游戏数据分析实践》图表3.1 DataFocus对比不同年度销售金额


3.2. 分组分析法

结合对比法,把总体中不同性质的对象分开,并进行对比以便了解内在的数据关系。

3.3. 结构分析法

亦称比重分析,分析总体内各组成部分占总体的比例以及构成的变化,从中掌握事物的特点和变化趋势。

3.4. 平均分析法

应用平均数进行比较分析的方法。用来反映总体在一定时间、地点、条件下某一数量特征的一般水平。

3.5. 交叉分析法

即立体分析法,常用于分析变量之间的相关关系。将不同维度数据交叉展现,进行多角度结合分析的方法。

《游戏数据分析实践》图表3.2 DataFocus_交叉分析


3.6. 漏斗分析法

结合对比、分组分析法,可以比较同一环节优化前后效果、不同用户群转化率,同行类似产品的转化率。反映用户行为状态以及从起点到终点各阶段用户转化情况,常用转化率和流失率两个指标。

3.7. 矩阵分析法

即矩阵关联分析法,以事物的两个重要属性为分析的依据,进行分类关联分析,为解决问题和资源分配提供参考依据。

3.8. 综合评价分析法

将多个指标转化为一个能够反映综合情况的指标来进行评价,如企业经济效益评价。包括主成分分析法、数据包络分析法、模糊评价法等。

3.9.5W1H分析法

也叫六何分析法,由美国政治学家拉斯维尔提出的一种思考方法,普遍应用在企业管理、工作生活和学习中。5W1H是指:原因(何因Why)、对象(何事What)、地点(何地 Where)、时间(何时When)、人员(何人Who)、方法(何法How)等六个方面。

3.10. 相关分析法

研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。按相关的程度分为完全相关、不完全相关和不相关。

3.11. 回归分析法

确定两种或两种以上变量间相互依赖的定量关系,研究的是因变量(目标)和自变量(预测器)之间的关系。

相关分析与回归分析之间的区别在于,回归分析侧重于研究随机变量间的依赖关系,以便用一个变量去预测另一个变量,而相关分析侧重于发现随机变量间的种种相关特性。

3.12. 聚类分析法

根据研究指标的特征进行分类。区别于分类分析,聚类分析原则是同类个体间相似性较大,不同类个体间差别比较大。 异常值和特殊的变量对聚类有较大影响。

方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。

3.13. 判别分析法

又称“分辨法”,根据研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。不同于聚类分析,它需要已知各个体的分类。

3.14. 主成分分析法

也称主分量分析,一种降维的统计方法,通过正交变换把多指标转化为少数几个综合指标的方法。 减弱因变量过多而引起的问题复杂性。

3.15. 因子分析法

从变量群中提取共性因子的统计技术,有 探索性因子分析法 和 验证性因子分析 两类。用来描述测量到的变量中的隐性变量 。

3.16. 时间序列分析

时间序列是按时间顺序的一组数字序列,基于随机过程理论和数理统计学方法,处理动态数据,研究随机数据序列所遵从的统计规律。

3.17. 方差分析

又称变异数分析或“F检验”,用于两个及以上样本均数差别的显著性检验。

数据分析常用的十六种方法就简单介绍到这里 ,更多数据分析的小知识,大家可以进入DataFocus官方渠道阅览哦~

《游戏数据分析实践》 全栈式BI ——DataFocus系统


第四章 留存分析——以游戏行业为例

通过了解产品对用户的黏性可以反映产品品质。留存率的高低则是判断一个产品是否有价值的一个重要标准。留存,即有多少用户留了下来。在某段时间内开始使用应用,且一段时间后仍然使用该应用的用户,被认为是留存用户。这些用户占当时新增用户的比例即是留存率。

今天我们先来了解下常用的留存分析方式,再以游戏行业的分析指标为例,借助Datafocus系统了解 日留存率、周留存率、月留存率 和 加权留存率。

4.1. 留存分析方式

4.1.1.第N日留存(N-day 留存)

计算第N天完成回访行为的用户。观察单位也可以是周、月 。这一计算方式也是普遍使用的用户留存计算。

4.1.2. N天内留存(Unbounded 留存)

累计计算N天内所有完成过回访行为的用户。观察单位也可以是周、月。

4.1.3.自定义观察期留存(Bracket留存)

区别于前两种按照固定观察单位计算的留存模型,Bracket留存可以自定义划分几个观察期,不受限于固定时间度量。

例如,第一个观察期为 次日 ;第二个观察期为 第3日到第7日 ;第三个观察期为第8日到第14日;第四个观察期为第15日到第30日。

4.1.4.自定义留存=

上面的三种留存方式,都是进行时间的限定,对留存的定义都是用户登录了APP或网站。而有时需要知道基于业务场景下用户的留存情况。比如阅读类产品会将看过至少一篇文章的用户才定义为真正的留存用户。因此,对留存的行为有了自定义,涉及初始行为和回访行为的定义。

了解了留存分析方式,我们通过数据指标了解下游戏行业的留存分析。

4.2. 游戏行业数据指标

4.2.1. 日留存率

常用“次日留存率”、“7日留存率”和“30日留存率”。

以“7日留存率”为例,指的是新用户在首次登录后的第7天再次登录游戏的比例,公式为:(当天新增的用户中,新增日之后的第7天还登录的用户数)/第一天新增总用户数。

在DataFocus系统中,对收集了“第一次登录时间”、“当天新登录用户总数”以及“n天后该批用户登录数”的数据表,可直接使用公式计算留存率。

《游戏数据分析实践》 图表4.1 7日留存率公式


《游戏数据分析实践》 图表4.27日留存率统计


4.2.2. 周留存率

和日留存率相似,周留存率为新用户在第1周登录后的第2 周再次登录游戏的比例,计算公式为: 周留存率=(第1周新增用户在第2周登录过的人数)/(第1周新增用户数) 。

4.2.3. 月留存率

同样,月留存率为新用户在第1月登录后的次月再次登录游戏的比例,其计算公式为: 月留存率=(第1月新增用户在次月登录过的人数)/(第1月新增用户数) 。

4.2.4.加权留存率

指某一段时间内(时间段a)的新增用户在若干天后的另一段时间(时间段b)的留存数量除以之前那个时间段(时间段a)的新增用户总量。

之所以使用加权留存率,是因为当游戏开服时间较长后,人数变化大,会出现因为数据基数减少,导致留存率虚高的情况。数据会产生偏差,加权之后数据更稳定。

以上四类是对游戏产品进行留存分析时常用的指标,周留存率、月留存率 和 加权留存率的计算,在DataFocus系统中,同样可以使用公式实现~如果收集的时间数据以“日”为单位,则可以借助“中间表”来分析哦~

第五章 产品发行预热期的“预订用户分析”

例如国内的游戏行业,从产品立项到封测期间,一般都会有三四个月的推广宣传,以时间节点为轴线制定市场预热宣传方案。在预热期阶段,为了找到核心用户并预估数量、协助管理人员进行战略定位和帮助营销人员完善预热宣传方案并进行有针对性的投放,往往需要分析预订用户、预估预订用户转化率以及分析竞品等等。

今天,我们通过一份模拟的游戏数据并借助DataFocus系统先来了解下在游戏发行预热阶段的“预订用户分析”。

5.1.数据的获取

游戏产品的预订、预售、预约活动,主要是为了了解核心用户的数量和市场关注度。能从预订数据中获得的信息,主要是手机号码和操作系统数据,信息较少,不足以了解目标用 户的特征,因此需要对预订用户进行调研。主要调研渠道是用户在游戏官网提交预订(预约、预售)的手机号码后,填写的问卷调查信息。而根据预订用户的手机号码,可以关联到该用户在公司内其他游戏中的登录和付费数据。

因此,预订用户分析的数据,可来源于用户预订的数据、用户预订后参与调查问卷的数据、预订用户在公司其他游戏的登录和付费数据 三部分。

5.2.数据处理与分析

收集到调查结果数据后,需要去除问卷中无意义的数据、逻辑互斥的数据,再根据前期设计思路进行数据分析。

5.2.1. 预订用户情况

5.2.1.1. 预订用户量

在用户预订数据中可以获取到“预订日期”以及预订的“手机号”,统计每日的手机号数量,可以查看到每日游戏预订情况,了解游戏的热度。

《游戏数据分析实践》 图表5.1 每日预订量


5.2.1.2.各渠道预订量情况

用户的预订数据中可以获取到游戏用户的预订渠道,了解各渠道预订量占比。

如下图,在DataFoucs系统的搜索框中,直接输入数据的列名,并使用关键词“数量”统计出用户数。

《游戏数据分析实践》图表5.2 各渠道预订量占比


可以看到,数据中预订用户的主要来源是PC官网和移动官网,分别占39.66%和26.72% 。

5.2.1.3.预订用户操作系统

由预定用户的操作系统信息,了解玩家的系统分布情况。如下图,由此预测游戏正式上线后,Android和IOS的用户比例接近6:4。

《游戏数据分析实践》图表5.3 操作系统比例


5.3. 预定用户来源分布

5.3.1.老用户来源

将预订用户的手机号码和公司内各游戏的登录账号进行关联,可以了解到预订用户中也是公司其他游戏的用户的情况。

以DataFocus系统为例进行分析:

 先将预订用户数据和公司内各游戏的登录账号进行关联

《游戏数据分析实践》图表5.4 关联


 在搜索模块,使用公式对预订用户进行分类。

《游戏数据分析实践》图表5.5 用户分类


 再搜索分析出预订用户中新老用户占比。

《游戏数据分析实践》图表5.6 新老用户占比


 搜索分析出老用户的来源。(因为对两个数据表进行了左关联,所以使用“不为空”排除新用户数据。)

《游戏数据分析实践》图表5.7 老用户来源


由此可知,在新游戏的预订用户中,约64%的用户同时是公司其他游戏的用户。老用户来源主要是卡牌类,排名第一的游戏占24.55%,说明这类游戏的用户和新游戏的用户有一定重合度。

5.3.2.新用户来源

预订用户中的新用户平时主要玩的游戏信息,则需通过调查玩家来获取。由此可以推断出该游戏外部用户的主要来源。

《游戏数据分析实践》图表5.8 新用户来源


由图中可知,数据中新用户主要来自《乖离性百万亚瑟王》、《炉石传说》和《LOL》,分别占13.28%、10.33%、9.23%。

除此之外,还会分析来自公司其他游戏的预订用户付费情况;分析预订用户喜好、预订用户人口属性、预订用户地域分布;在游戏测试后,分析不同类型用户质量等等。更多精彩分析,等待大家去实现哦~

第六章 预订用户转化率的预估

前面我们了解到,在产品的发行预热期阶段,往往会分析预订用户、预估预订用户转化率和分析竞品,并简单了解了“预订用户分析”。那么,为什么需要分析并预估预订用户转化率呢?如何进行分析呢?

今天,我们继续以游戏产品为例,借助BI系统DataFoucs来简单了解下产品发行预热期阶段的“预估预订用户转化率”。

6.1. 分析原因

在预热阶段预订游戏的用户,在游戏公测后会继续登录游戏吗?会有多少用户进入游戏,用户转化率是多少?公测时需要准备最低承载日活跃多少人的服务器呢?因此,我们需要对预订用户的转化率做一个预估。

6.2. 分析方法

新产品的转化率,主要通过历史其它产品的预订用户转化率与新产品的预订用户量来预估。对于游戏产品的预估,尽量选择与其预订量接近且游戏类型相似的游戏;若两款游戏差异较大,可以采用相关的分析方法,找到预订量和转化率之间的规律,再以此作为参考。

6.3. 分析内容及流程

我们接下来借助DataFoucs系统,对一款预订量接近新产品且游戏类型与新产品相似的历史游戏进行分析,数据可从用户预订的数据和公司内其他游戏的登录和付费数据中获得。

6.3.1.用户预定时间分布

查看历史游戏预热期每月的用户预订量。

我们使用DataFoucs的关键词“每月”进行搜索分析,设置成柱状图并给预订量较大的柱设置一下特殊颜色。

《游戏数据分析实践》图表6.1 用户预订时间分布


可以看到,这款产品从2018年2月开始预订,预热周期历时13个月。在开测前的2018年10月至2018年12月期间总预订量较大,主要是受市场预热活动影响 。

6.3.2.预定且登录用户的预定时间分布

将预订用户的账号与产品公测后的登录日志关联,获得预订且登录人数,并计算预订且登录人数占预订量的比例情况。

《游戏数据分析实践》图表 6.2 时间分布


从中可以看到,前期登录比例相对平稳;在2018年10—2018年12月,随着投放市场费和封测节点,虽然预订量急剧上升但转化率并不高,说明通过市场投放带来的预订用户没有自然预订用户的质量高。

6.3.3.预订用户首次登陆时间分布

同样,将预订用户的账号与产品公测后截至2020年4月的登录日志关联,获取预订用户首次登录的时间与登录人数。

在DataFocus中使用关键词和列名搜索分析出每月的预订用户登录人数,绘制成如下柱状图,并设置数据标签,即可直接显示出预订用户登录占比情况。

《游戏数据分析实践》图表6.1预订用户登录情况


《游戏数据分析实践》图表 6.2 预订用户首次登录时间分布


从图中可以看到,这款游戏在公测首月登录了71.34%预订用户,登录比例最高,在第2月登录了11.2%,约18%的用户在其余12个月登录。

6.3.4. 预订用户登录游戏比例

最后,通过公测期登录游戏的用户数和用户预订总量,计算该游戏产品预订用户登录游戏比例。

《游戏数据分析实践》图表 6.3 预订且登录用户占比


从上述分析可知:

用户预订数量受市场预热活动影响较大,在没有市场预热的前提下,用户登录比例会相对平稳,预订量大时登录比例下降;预订且登录用户占比9.17%,登录的预订用户中约70%会在公测首月登录。

6.3.5. 推测

在游戏类型和预订量相近的前提下,根据这款历史游戏的预订且登录用户占比,推测新产品的预订用户转化率约为9%,结合新游戏的用户累计预订量,即可预估约有多少用户会在游戏公测后登录游戏。

一项简单的“预估游戏产品预订用户转化率”就介绍到这里,后面,我们将继续借助DataFoucs系统来介绍产品发行预热期的“竞品分析”。

第七章 如何使用BI工具对竞品进行分析?

互联网产品在上线前,往往需要对竞品进行分析,以达到知己知彼的同时产品发行的市场和运营活动提供参考。分析包括数据方面、运营活动、几款畅销产品的对比、产品亮点功能等方面。

今天,我们以游戏产品为例,借助DataFoucs系统来简单了解下在分析竞品时如何使用BI系统进行相关的数据分析。

7.1. 收入、下载量、排名

了解当前最热门竞品各个时期的收入、下载量以及畅销榜和免费榜的排名。再结合当时的运营活动,分析市场宣传、活动预热效果。

7.1.1. 系统操作

数据导入到系统后,在DataFocus的搜索模块,对收集到的日期、收入、下载量和排名数据进行分析时,直接双击或搜索框中输入列名,配置合适的图表,例如组合图,并将两个不同量级的数值列分别配置成左右y轴,即完成简单的图标制作。

《游戏数据分析实践》图表7.1 y轴配置


《游戏数据分析实践》图表7.2 “游戏A”平台收入、排名


《游戏数据分析实践》图表7.3 “游戏A”平台下载量、排名


从图中可以发现,热门游戏产品“游戏A”的下载量、收入和畅销榜排名均维持在较高水平。部分时期的运营活动有一定效果。

7.2. 各产品对比

对比在游戏畅销榜排名靠前的同类型产品的总收入和下载量,例如畅销榜中排名前50的同类型竞品,了解各产品市场占比等情况。

7.2.1.系统操作

同上,在DataFocus系统进行搜索分析。可以为图表配置标签,以直接查看到各产品比例情况。

《游戏数据分析实践》图表7.4 总下载量对比


《游戏数据分析实践》图表7.5 总收入对比


从图中可以看到,游戏产品“游戏A”累计下载量占58.76%,累计收入占76.48%。市场占比较大,收入也远超其它同类型产品,公司产品上线后超越“游戏A”的难度较大。 除此之外,还可以对畅销榜排名靠前的同类型产品的收入进行对比、下载量对比、了解各产品更新时间等等。BI系统操作简单、分析速度快,更多精彩分析,等待大家在DataFocus中一一实现哦~

第八章 产品封测期的用户调查分析

例如游戏产品,在预热期和封测期都会进行用户调查,那么这两次调研的区别是什么呢?

预热期间:调查的重点是了解用户特征,帮助给出市场宣传方向。

封测期间:重点是了解用户体验的感受,帮助发现游戏问题,为游戏的改进和完善提供依据。

前面的文章,我们了解了产品预热期的用户调查分析,今天,我们继续借助DataFocus系统来了解下 游戏封测期的用户调查分析。

8.1. 用户整体情况

我们先根据调研结果,使用公式对玩家进行分类。

如下图,将用户分为“重度用户”、“中-轻度用户”和“潜在用户”,并保存为公式列:“用户分类”。

《游戏数据分析实践》图表8.1 用户分类


再用该公式列直接搜索分析各类用户占比情况。

如下图,在搜索框中输入列名并使用关键词统计各类用户数量,配置图表和数据标签后,可直接查看到各类别用户百分比情况。

《游戏数据分析实践》图表8.2 各类用户占比


8.2. 用户人口属性

用户属性包括年龄、性别、职业等等。同上,通过搜索和标签的设置,可直接查看各组别占比情况。

《游戏数据分析实践》图表8.3 各年龄段占比


8.3. 功能满意度

我们还需要针对产品各个功能,分析每类用户对其满意程度。

如图,分析C功能的满意度时,搜索列名并使用count计算人数(即行数),再添加数据标签可直接显示各项人员比例。

《游戏数据分析实践》图表8.4 c功能满意程度


当然,也可以借助DataFocus的中间表和数据转换功能,将各游戏功能中每类用户的满意程度进行汇总,如图所示。

《游戏数据分析实践》图表8.5 数据转换


第九章 如何用DataFocus进行渠道用户质量分析?

为获得更多有效用户,让产品的收益最大化,我们往往需要根据产品特点来选择重点发行渠道。此时,便需要对各渠道的用户质量进行分析。

今天,我们借助DataFocus来了解一种在游戏产品封测期的、渠道用户质量分析的方法。

9.1整体分析

我们先整体了解一下游戏产品在各平台和渠道类型的导入量和收入构成。

9.1.1. 分析详情

以一款手游为例,产品渠道按平台可分为iOS和Android,按合作方式可分为联运和 CPS。

本文选择了一些常用的渠道,并将其分为四类:iOS、Android(联运,非硬核)、Android官方和Android(联运,硬核)。

9.1.2. 系统操作

数据导入DataFocus系统后,对数据进行搜索分析,选择图表后设置标签,可直接在图中显示各类渠道名及其占比。

《游戏数据分析实践》图表9.1各渠道导入量占比


使用公式,对渠道再次分类,以了解iOS和Android两个平台的用户占比情况。

《游戏数据分析实践》图表9.2 使用公式分类



《游戏数据分析实践》图表9.3 iOS和Android平台的用户导入量占比


由此,在了解到用户占比以及收入占比后,可以分析出用户的付费能力和用户质量。

9.2. 渠道排名采用综合评价分析法

接下来,采用“综合评价分析法”,根据指标对各渠道进行排名,从而了解各个渠道的用户质量。

9.2.1. 分析详情

这里统计了各个渠道的导入量、收入、付费率、 ARPPU、ARPU和第7日加权留存率数据。

为消除这六个变量间的量纲关系,我们先对数据进行标准化处理,再使用客观赋权法的标准差系数权重法,计算各指标的权重,最后对各指标进行排名。

9.2.2.系统操作

A、数据标准化处理

因为需要对六个指标进行标准化处理,所以我们先在DataFocus中自定义一个标准化公式,以节省编辑同类型公式的时间。

如下图,此次的标准化处理采用“Z-score标准化”方法,将数据减去平均数后再除以标准差。当标准化后的数值比较接近时,为了便于比较,我们可以调整下数据的范围,如这里统一:“×100+100”

《游戏数据分析实践》图表9.4 自定义公式“Z-score标准化”B、确定各指标权重


标准差系数权重法,首先需要计算各指标的离散系数,即用标准差除以平均数。同样,我们创建一个“离散系数”的自定义公式。

《游戏数据分析实践》图表 9.5 自定义公式“ 离散系数”


在搜索模块,使用这两个公式计算各指标离散系数和标准化值。为了方便查看,我们将数据保存为中间表“标准化各渠道数据”。

《游戏数据分析实践》图表9.6 制作公式列


在搜索模块,选择这张中间表进行分析,对各离散系数求和后,再计算各指标权数,即将各指标的离散系数除以所有指标的离散系数之和。

《游戏数据分析实践》图表9.7 计算离散系数和


C、计算各指标综合评价值

将各指标的权重乘以标准化后的值,即求得各个渠道的综合评价值。

例如图中,公式“导入量离散系数/离散系数和 ”计算导入量的权重后,乘以标准化的导入值,即获得“导入量”的综合评价值。

《游戏数据分析实践》图表9.8 计算综合评价值


直接对各指标的综合评价值求和,获得综合评分。

《游戏数据分析实践》图表9.9 统计综合评分


D、搜索与汇总综合排名

对所需数据进行搜索分析。选择数值表后,分别点击表中对应的列名,即可直接对数据进行降序排序,得到各个渠道各项指标及综合排名。

为使排名更直观,可以给表设置“行索引”或再次进行公式的使用。

《游戏数据分析实践》图表 9.1 查看排名


由此可以了解到各渠道的用户质量。

至此,一种在手游封测期的渠道用户质量分析的方法,就使用DataFocus介绍到这里。其实,同样的分析,系统的操作方式不只一种,大家可以去尝试哦~

《游戏数据分析实践》图表9.11 满意程度汇总


除此之外,游戏玩家的调查分析中还会涉及用户初体验评价、游戏上手难度、推荐意愿等内容。更多结构性数据,都可以使用搜索分析来完成。

第十章 产品封测期的“用户流失原因分析”

对于互联网产品,为了找出用户流失的卡点,以协助研发人员进行有针对性的修改,从而优化产品、提升用户体验,往往需要进行用户流失原因分析。

今天,我们借助DataFocus来了解在游戏产品封测期的“用户流失原因分析”。

10.1. 流失用户的卡点

以游戏行业为例,用户流失的卡点可以从用户流失的等级,流失前的主线任务、所在地图、参与的活动和副本入手。

10.2. 数据详情

数据的来源主要是游戏中用户的行为日志,因此需要对用户行为日志进行数据埋点。

这里,我们预设封测时间为8天,取玩家最后一次下线当天的最后一个游戏行为进行分析。

流失用户为4天流失用户,即封测前4天登录,而在后4天未登录的用户。同时剔除角色等级为1的和登录天数为1的用户(这些用户中泛用户居多,其游戏行为不能反映用户情况)

10.3. 数据分析

将数据导入DataFocus系统后,即可在搜索模块进行搜索分析。

10.3.1. 流失用户等级分布

我们首先看下流失用户的等级分布,分析用户流失的主要等级。即搜索 “角色等级”和“流失人数”数据。

《游戏数据分析实践》图表10.1 角色等级流失人数


如图,柱状图设置标签后,明显看到流失人数最大的角色等级是29级,且30、31、34、26、25等级的流失人数较高。

10.3.2. 流失用户下线前的最后行为

A. 我们先从整体上了解下用户流失之前是在做什么,即最后一个游戏行为。

如图,从地图、任务、活动、副本等行为类型的维度,分析流失用户最后一次行为的人数占比情况,了解各行为类型的流失用户比例。

《游戏数据分析实践》图表10.2 流失前最后行为


从图中可以看出,用户流失比例,在做任务行为之后最高。

那么,这些用户在完成这些行为后到退出游戏,总共停留了多长时间呢?

B. 我们可以基于四种行为类型和时长,汇总流失用户在完成最后一个行为到退出游戏,各行为类型花费的平均时长和比例。从整体上了解这个过程中总共花了多长时间。(制图方式同上)

C. 再基于“活动类型”、“时长”和“用户等级”数据,进一步分析各等级的用户从最后一个行为到退出游戏所花费的平均时长以及人数。

《游戏数据分析实践》图表 10.3 流失前最后行为时长


图中,28级用户进入地图活动到退出游戏的时长最高为69分钟;35级用户在做活动到退出游戏的时长最高,为38分钟。

再根据基础数据,即可了解到这些用户主要是在参加哪个具体活动中停留时间较长,并分析造成这个结果的可能性原因。

10.3.3. 具体行为分析

接下来,我们从这四个类别,分别对流失用户下线前最后一个游戏行为进行详细分析。

以“地图”类别为例:

用关键词获取活动为“地图”的数据,分析人数和各项游戏中的时长。

《游戏数据分析实践》图表 10.4 流失用户下线地图分布


从图中可以发现,扬州地图流失的人数最多,达总流失人数的42.04%。用户在游戏“境界府邸”所待平均时间较长。

那么这些用户主要集中在哪些等级呢?

我们可以针对 扬州地图 进一步分析各等级流失人数。

《游戏数据分析实践》图表10.5 扬州地图下线用户等级分布


给图形设置标签后,可以明显看到22、30、31、32等级用户流失量较大。

除此之外,我们可以获取地图中更详细的各元素数据 ,了解扬州地图中的哪一块区域用户流失比例最大。

对用户流失原因分析,主要先从整体上了解流失用户最后一个行为,再定位到具体活动以及从最后一个行为到离开游戏的时长,查找出用户流失点,并分析用户流失原因,来为研发人员的优化提供参考依据。

多种有趣的数据分析,等待你在DataFocus中实现哦!

第十一章 5W1H分析用户流失原因

流失用户分析的方法很多,今天我们以游戏产品为例,借助DataFocus来了解下通过5W1H分析方法,如何对用户流失原因进行分析。

11.1. 用户流失期限的确定

在分析之前,我们先来了解下如何确定流失用户,即流失期限是多久呢?

我们可以通过流失用户回归率和拐点理论来确定用户流失期限。

首先,选取几个时间点的登录用户,分别计算它们连续1天至30天不登录的流失回归率。

流失用户回归率=回归用户数/流失用户数×100%,在DataFocus中可以使用公式直接进行计算。

《游戏数据分析实践》图表 11.1 不同天数的流失用户回归率


从上图中可以看到,随着天数的增加,流失用户回归率递减。约第21天为曲线的凹凸分界点,即拐点,在此,我们可以预估用户流失期限为21天。

再结合对其它时间点登录用户的流失回归率与拐点分析,即可以较合理地制订用户流失期限。

11.2. 5W1H分析流失用户

11.2.1. 了解5W1H

5W1H是指What何事、 Where何地、Who何人、When何时、Why何因、How何法。

对游戏流失玩家的分析,我们可以从这几点进行了解

What——用户流失了,流失了多少用户

Where——在哪里流失的,游戏中哪个区域流失的

Who——什么人流失的,新玩家还是老玩家,从事什么职业的玩家 ;游戏中哪个角色。

When——什么阶段流失的,是新手阶段、中级阶段还是高级阶段

Why—— 为什么会流失,是因为游戏中的任务较难,游戏有卡点还是没有一起玩的朋友等等。

How——如何挽回用户,可以制订哪些策略。

11.2.2. 分析内容

我们可以选择七日流失用户来反映流失用户特征,再根据每日数据变化情况分析流失规律。

数据来源主要包括用户游戏行为日志和对玩家的回访调查数据

11.2.2.1. 七日流失用户分析

游戏产品的7日流失用户分析,可以从游戏玩家等级、职业、在线时长、任务等游戏环节和场景、好友、群体、账号余额等情况入手。

例如:查看流失用户整体情况、用户等级分布(包括人数和流失率)、各角色职业流失情况、登录和在线时长变化情况、任务持有情况、加入公会、好友、参与副本情况、参与活动副本A情况、用户余额 等等。

11.2.2.2. 每日流失用户的分析

每日数据变化情况,可以从每日流失和新用户导入关系、每日流失用户群体、每日流失各等级人数情况、每日流失账号绑定余额变化情况等方面分析。

11.2.3. 搜索分析

在DataFocus系统中,主要是在搜索模块进行数据分析。我们以七日流失用户分析中的“查看流失用户情况”,来了解下DataFocus的搜索分析。

对流失用户情况的整体查看,包括分析各渠道的活跃用户占比、登录与流失用户比例,7日流失率、7日回归率、老用户比例、新用户比例、回归用户比例等情况。

因此,我们需要先统计某一周登录游戏的用户,再判断他们在此后的第二周、第三周是否登录游戏。进而对这些用户进行分类和分析。

11.2.3.1. 直接查看用户比例

各渠道活跃用户比例=某渠道登录用户/总登录用户。因此我们需要先对用户进行分类。

如下图,在DataFocus搜索模块的“增加公式”,使用if...then...else 公式,对用户进行分类并保存为公式列。

用户类别分为“活跃用户”和“流失用户”。流失用户指统计的一周登录用户中,在接下来的第二周未登录的用户。

《游戏数据分析实践》图表11.2 用户分类


双击或在搜索框中输入该公式列名,并使用关键词“数量”计算用户数,设置标签后即可直接查看到流失用户、活跃用户的用户数和比例情况。

《游戏数据分析实践》图表11.3 用户数及比例情况


也可以使用“=”或“包含”关键词,进行更精确的查看,如下图:

《游戏数据分析实践》图表11.4 关键词精确查看


11.2.3.2. 比率的计算

对于比率的查看,也可以直接使用公式计算。我们以7日流失率和7日回归率为例,如下图所示。

7日流失率=流失用户数/第一周登录用户数。即第一周登录的用户在第二周未登录游戏的数量,除以第一周登录的人数。

《游戏数据分析实践》图表11.5 七日流失用户率


7日回归率=回归用户数/流失用户数

回归用户:流失用户中在第三周登录游戏的用户。即统计的第一周的登录用户,在第二周未登录但第三周登录的用户。

所以我们可以直接使用之前的“用户分类”公式进行公式的嵌套。

《游戏数据分析实践》图表11.6 七日用户回归率


搜索分析,了解分析所需维度,即可以使用类自然语言直接分析哦~

DataFocus最新SaaS版,大家都可以试用,抢先体验云时代的“云端数据分析”~

第十二章 定价策略分析

对于有付费项目的产品,引导活跃用户转化为付费用户并且留住他们 ,是产品运营的一项重要内容,那么,用户会因为什么付费呢?为什么有些人不会付费呢?因此,我们需要对用户付费习惯进行分析。

今天,我们以一款游戏产品为例,借助DataFocus系统了解一种在分析用户付费时的定价策略分析。

12.1. 分析概述

12.1.1. PSM模型

本次,我们采用PSM价格敏感度分析方法,它是价格测试中较简单、实用的一中方法。其测试过程完全基于被访者的自然反应,没有任何竞争对手以及自身产品的信息。

12.1.2. 问题调研

该方法需要进行用户调研。

首先对需要定价的项目设计可以给出的价格档位,再根据该价格梯度表对用户进行调研,主要涉及四个问题:

A、什么样的价格认为太便宜,以至于您怀疑它的品质而不去购买?

B、什么样的价格比较便宜,并且是最能吸引您购买的促销价?

C、什么样的价格是您认为贵,但仍可接受的价格?

D、什么样的价格太高,以至于您不能接受?

12.1.3. 注意事项

A、实际购买力:为避免只考虑用户接受力而忽视购买力,在调研时,需要强调用户自己是否会购买;

B、价格说谎:为了解用户对价格评价的真实性,需要增大样本量以减小误差;

C、系统缺陷:为避免价格变化导致销量变化,在对调研内容进行分析后,可以根据结果设计不同的价格方案,进行组间实验。

12.2. 分析详情

12.2.1. 价格梯度表设计

我们假定对一款游戏装备,设计价格梯度表为:100金币,200金币,300金币,400金币,500金币,600金币,700金币,800金币,900金币,1000金币。

12.2.2. 调研结果

在对玩家进行调研后,可以从四个问题中得到4个价格,例如玩家A认为200金币太便宜不会买,400金币比较便宜会去买,600金币贵但可接受,800金币价格太高不会买。

12.2.3. 结果处理

对调研结果进行统计分析时,

最低价格和较低价格的百分比进行向下累计统计,即玩家认为200金币太便宜,也会认为100金币太便宜 ;认为400金币比较便宜,也会认为300金币、200金币、100金币比较便宜;

最高价格、较高价格的百分比进行向上累计统计,即玩家认为600金币贵的话,同样会认为700金币、800金币、900金币、1000金币贵;认为800金币价格太高的话,同样会认为900金币、1000金币价格太高。

12.2.4. 数据分析

在DataFocus搜索框中,对处理好的数据进行搜索 ,设置折线图,可以获得如下四条曲线。

《游戏数据分析实践》图表12.1 四条曲线


A、“便宜”与“贵”曲线交点,即无差异价格点。在该点上,“认为便宜而购买”产品的人数与“认为贵但购买”的人数相等。人们对这个价格的感觉较为平淡。

B、“太便宜”与“太贵”曲线交点,即理想价格点。在该点上,因太贵而不购买的人数与因太便宜而不购买的人数相等。是追求市场最大化的理想价格点,但不是利润最大化的价格点,即销售规模最大。

C、“太便宜”和“贵”曲线交点,该点为合理定价区间的最低点,在该点上认为贵和太便宜的人数相等。

D、“便宜”和“太贵”曲线交点,该点为合理定价区间最高点,在该点上认为便宜和认为贵的人数相等。

12.2.5. 价格确定

通过“太便宜”和“太贵”的交点确定出最优价格,因为在这种情况下,既不觉得“太贵”也不觉得“太便宜”的人数是最多的,对于企业而言,在该价格上,有最多的消费者可能去购买他的产品。同时,由“太便宜”和“贵”,“便宜 和“太贵”确定出可接受的价格区间。

因此这份数据中,定价区间在500金币到600金币。如果定价550金币,我们可以获得最大的销售量。

SAAS版DataFocus Cloud可以免费试用!一起来体验云时代的“搜索式数据分析”吧~

第十三章 对收入指标完成情况的分析

公司一般会制定收入指标,监控收入完成情况的同时,及时了解运营情况,为运营方案的制定提供数据支持。

今天,我们以游戏产品为例,借助DataFocus了解对收入指标完成情况的4个方面分析。

13.1. 数据来源

对于游戏产品,数据主要来自游戏收入数据,即流水。端游流水指消耗金额,手游流水指充值金额。

13.2. 分析详情

对于游戏产品的收入指标情况分析,可以从指标完成情况、当前时间进度完成率、本季度和上季度对比、本周收入和上周对比四个方面进行分析。

13.2.1. 指标完成情况

我们先来查看本季度的指标完成情况。在DataFocus搜索模块,使用公式计算“指标完成量”以及“指标剩余量”,指标剩余量=指标-指标完成量。

《游戏数据分析实践》图表13.1指标完成量


《游戏数据分析实践》图表13.2 指标剩余量


搜索分析指标情况时,双击或搜索框中输入列名,并使用关键词“本季度”进行数据的筛选。

切换到堆积柱状图后,可以通过标签设置,直接查看指标完成率。

《游戏数据分析实践》图表13.3 设置标签


除了在数值表中查看各项值,也可以通过设置标签或直接鼠标滑动到图柱上,进行值的查看。

《游戏数据分析实践》图表13.4 指标完成情况


13.2.2. 当前时间进度完成率

通过分析指标完成情况,我们了解到各产品的季内指标完成率。因为指标是以季度为周期,当前没有完成季指标的产品,可能已达到日均收入指标,因此,我们需要结合时间维度进一步分析。

使用公式计算当前完成量、时间进度、当前应达到季指标以及时间进度完成率。

《游戏数据分析实践》图表13.5 当前完成量


时间进度=季度已过天数/季度总天数

《游戏数据分析实践》图表13.6 时间进度


当前应达到季度指标量=季度总指标*时间进度

《游戏数据分析实践》图表13.7 当前应达到的季指标量


时间进度完成率=完成量/(日均收入指标×已完成天数)=完成量/(季总指标*时间进度)=完成量/当前需达到的季度指标

《游戏数据分析实践》图表13.8 时间进度完成率


最后,双击或搜索框中输入所需的公式列名,并使用关键词“本季度”进行信息筛选。

设置组合图,并将完成率配置到右轴,即了解到各产品时间进度完成率。

《游戏数据分析实践》图表13.9 当前时间进度完成情况


13.2.3. “季度同期对比”与“周对比”

对于收入指标分析,还需进行“本季度和上季度同期对比”以及“本周收入和上周对比”。

在DataFocus中进行常规的环比同比的计算,可以直接使用“增长关键词”来实现。

但对季度数据的对比,当前需要的是本季截至目前与上季同期对比,因而需要先对季数据进行筛选,再开始增长率或增长量的计算。

这一部分,可以参考DataFocus官网上的学习交流社区里,对于“对比本年截止到今天的销售额和去年截止到去年今天的销售额”问题的回复。有多种实现方法哦~

还没有试用DataFocus的朋友, 可以到官网试用最新的DataFocus “商业分析师版”,功能更多,“云端上的数据分析”,使用更方便哦~