入门必读课 | 我们如何用数据来回答问题——游戏的定量和定性研究-网易游学-为热爱赋能

入门必读课 | 我们如何用数据来回答问题——游戏的定量和定性研究

二师兄

2022-12-263859次浏览

2评论

52收藏

11点赞

一、用什么数据

首先我们来看第一个小点：用什么数据。

这个点最核心的思维，就是需要把问题进行拆解，来寻找对应的数据来描述问题。有些问题我们能够很清晰的知道，我们该用什么数据来回答。比如说，这个玩家留存情况、满意度是怎么样的。

但当我们要回答一些比较复杂的问题，比如说这个球员踢球好不好，能力怎么样。我们大致可以用该球员的身价、薪资的水平来衡量该球员的水平位置。但球员能力的各个维度，我们没有办法用精确的数据来回答。

如果我们想更进一步去分析球员属性，就需要进行问题拆解。比如《实况足球》把球员能力分成几个维度，他的传球能力，射门能力、进攻能力、防守能力、身体素质、速度力量等，用雷达图进行球员能力的拆解。

拆解问题的核心思想：拆解问题直至可构造数据进行分析的粒度。当拿到一个问题是，需要去分析三点：

1. 要回答什么问题；

2. 怎样把这个问题拆解为可分析的具体点；

3. 每个具体点的分析可以用什么数据来分析。

第二点：怎样获取数据

数据收集有很多方法，从研究手段来看，我们可以选择定性或定量的研究手段；

从数据来源来看，有不同维度，如玩家的行为或玩家的态度；

以使用情景来区分，有自然使用情境、剧本任务情境、非使用情境、或者混合以上各类情境。

组合这些手段，我们可以得到这样的坐标图：

接下来，我们就每个手段。来详细介绍一下。

1. 研究手段：定性VS定量

根据我们上期提到的定性、定量数据的分析特征，可以很好理解。深度访谈和体验日志，是定性的收集，而问卷调查和后台数据分析，属于定量的手段。

2. 数据来源：态度VS行为

从态度到行为维度，有许多手段。当我们做深度访谈或问卷调查时，更多的是去调查玩家的态度、喜恶。而眼动测试和可用性测试则是分析玩家的行为，以玩家在测试中的注视点或心率脑电等分析玩家行为的情况。

3.使用场景：非使用场景VS自然使用场景

当我们用问卷调查玩家对某一款游戏的使用感受时，玩家正处于非使用游戏场景。而自然使用情景的分析，例如后台数据分析，则是完全在玩家玩游戏时产生的数据。可用性测试则介于两者之间，我们会布置明确的任务，让玩家去完成。

收集数据时我们还需考虑数据类型与使用方法。首先，数据可分为定量和定性两大类数据。

定性数据：

定性数据实际上包含了定类和定序两类，定类变量用以区分类别，但并不能得出比较结果，如说性别职业、游戏偏好等。

定序变量，相对来说可以进行一些简单的排列，例如学历、年龄段、二次元属性等。

定量数据：

定量数据包含定距变量和定比变量，定距变量可以做一些简单的加减运算，如满意度智商等，定距变量都是在某一个参考系下做出的数据。

定比变量可以做一个乘除运算，且与定距变量不同，定比变量是有绝对零点的，比如说收入为0，那就是表示完全没有收入。

其次定性与定量数据的使用又有不同。定性数据，不能进行数字运算，一般只看占比，定量数据则可以进行数学运算，也可以看均值占比。比如说满意度，我们可以将其相加求平均值，进行均值分析。

4、数据甄别

以上讨论的是数据收集的方法，接下来我们来谈谈如何保障数据的质量。

首先在介绍定量数据时我们有两个关键词，就是信度与效度。我们以靶心来理解：

最主要的目标，是射中红心，也就是说我们所收集的数据，在理想情况下，都能够解答目标问题，那就是信度和效度最高的情况。

如果我们射的箭都没能射中红心，但都聚集在一个区域上，这时候说明我们效度不好（所谓效度是指有没有效），而信度还是OK的。

另外有种情况，虽然不集中，但都在红心附近，这说明效度高，但信度低。

用一种更生活化的例子来说明-量体重，各类情况如图：

以上例子说明，我们在收集数据时，要考虑清楚使用工具是不是合理的，收集到的数据是否存在偏差，如有偏差我们要想办法去弥补。

如何保证数据的信度和效度呢？我们通常会用以下方法。

1. 从源头上保证数据质量：选择合适的工具和迭代。

例如我们想要了解玩家对新手教程的情绪体验，如果让玩家自行表达自己的主观感受，最后的数据可能会存在偏差。若我们采用这样一个情绪体验图，这个表会将消极和积极情绪划分为4个维度，让玩家在体验过程中进行勾选，这时候就能够得到一个相对较直观的数据。从工具的角度使我们的数据更有效。

除此之外，我们还可以加入一些测谎题，帮助我们清洗数据。

例如在进行功能测试时，提出一些产品没有的功能，询问玩家对该功能的体验。或者增加态度测谎题，如在开始或结尾问一些互相冲突或矛盾的问题。

2.通过甄别保证数据有效

当我们得到数据后会进行数据清洗，这是保证数据的有效性的手段。

关于数据获取的核心思想，其实就是：事先规划。

我们需求要提前规划用什么样的方法，获取什么类型的数据，怎样去使用，在源头上保证数据。

三、怎样分析数据

当我们获得数据后，我们怎样去分析。

首先，数据要经过对比才有意义。

1. 与系统基线/常模做对比。

举个例子：今天天气好热，气温是104℉（华氏度），地表温度能达到140℉，综上所述，今天的天气对于人来说太热了。

这种情况对于接触摄氏度表达方式的人而言，虽然采用了定量数据分析，但并不能产生直观的意义。

因此，我们在做数据分析时，需要和系统基线和常模进行对比。比如说我们对华氏度没有概念，换成摄氏度就可以直观感受。如果不采用摄氏度，也可以加上人体的舒适温度大概在什么区间（华氏度）。无论是哪种方式，都是有效的，会比没有对比的数据好得多。

2.尽量进行单因素对比，避免干扰。

单因素对比能使得我们的结论更明确，不受到其他因素干扰。

但实际上我们进行数据分析时通常是多因素综合考虑。比如说一款卡牌类的游戏，我们需要考虑到地区（国内、日本）、等级（高中低）、付费能力、培养内容（卡牌、装备）等各方面，我们最常做的做法是控制变量，再去对比我们关心的数据。

当然有时候混淆因素不一定产生在我们要分析的维度上。

例如之前我们做了一个视觉疲劳度的分析，想看玩家在玩不同游戏内容时，视觉疲劳度会不会有差异。由于受屏幕设备这一干扰因素的影响，分析结果和预测不太一样，于是我们补充进行了一次阅读测试，采用不同的屏幕设备，让测试者阅读文本，再根据测试结果选择差异度小的设备进行游戏测试，同时控制大家体验不同游戏的时长，比如说都只体验前15分钟。这样得到的数据，则更严谨一些。