2022-12-261753次浏览
2评论
52收藏
11点赞
分享
一、用什么数据
首先我们来看第一个小点:用什么数据。
这个点最核心的思维,就是需要把问题进行拆解,来寻找对应的数据来描述问题。有些问题我们能够很清晰的知道,我们该用什么数据来回答。比如说,这个玩家留存情况、满意度是怎么样的。
但当我们要回答一些比较复杂的问题,比如说这个球员踢球好不好,能力怎么样。我们大致可以用该球员的身价、薪资的水平来衡量该球员的水平位置。但球员能力的各个维度,我们没有办法用精确的数据来回答。
如果我们想更进一步去分析球员属性,就需要进行问题拆解。比如《实况足球》把球员能力分成几个维度,他的传球能力,射门能力、进攻能力、防守能力、身体素质、速度力量等,用雷达图进行球员能力的拆解。
拆解问题的核心思想:拆解问题直至可构造数据进行分析的粒度。当拿到一个问题是,需要去分析三点:
1. 要回答什么问题;
2. 怎样把这个问题拆解为可分析的具体点;
3. 每个具体点的分析可以用什么数据来分析。
第二点:怎样获取数据
数据收集有很多方法,从研究手段来看,我们可以选择定性或定量的研究手段;
从数据来源来看,有不同维度,如玩家的行为或玩家的态度;
以使用情景来区分,有自然使用情境、剧本任务情境、非使用情境、或者混合以上各类情境。
组合这些手段,我们可以得到这样的坐标图:
接下来,我们就每个手段。来详细介绍一下。
1. 研究手段:定性VS定量
根据我们上期提到的定性、定量数据的分析特征,可以很好理解。深度访谈和体验日志,是定性的收集,而问卷调查和后台数据分析,属于定量的手段。
2. 数据来源:态度VS行为
从态度到行为维度,有许多手段。当我们做深度访谈或问卷调查时,更多的是去调查玩家的态度、喜恶。而眼动测试和可用性测试则是分析玩家的行为,以玩家在测试中的注视点或心率脑电等分析玩家行为的情况。
3.使用场景:非使用场景VS自然使用场景
当我们用问卷调查玩家对某一款游戏的使用感受时,玩家正处于非使用游戏场景。而自然使用情景的分析,例如后台数据分析,则是完全在玩家玩游戏时产生的数据。可用性测试则介于两者之间,我们会布置明确的任务,让玩家去完成。
收集数据时我们还需考虑数据类型与使用方法。首先,数据可分为定量和定性两大类数据。
定性数据:
定性数据实际上包含了定类和定序两类,定类变量用以区分类别,但并不能得出比较结果,如说性别职业、游戏偏好等。
定序变量,相对来说可以进行一些简单的排列,例如学历、年龄段、二次元属性等。
定量数据:
定量数据包含定距变量和定比变量,定距变量可以做一些简单的加减运算,如满意度智商等,定距变量都是在某一个参考系下做出的数据。
定比变量可以做一个乘除运算,且与定距变量不同,定比变量是有绝对零点的,比如说收入为0,那就是表示完全没有收入。
其次定性与定量数据的使用又有不同。定性数据,不能进行数字运算,一般只看占比,定量数据则可以进行数学运算,也可以看均值占比。比如说满意度,我们可以将其相加求平均值,进行均值分析。
4、数据甄别
以上讨论的是数据收集的方法,接下来我们来谈谈如何保障数据的质量。
首先在介绍定量数据时我们有两个关键词,就是信度与效度。我们以靶心来理解:
最主要的目标,是射中红心,也就是说我们所收集的数据,在理想情况下,都能够解答目标问题,那就是信度和效度最高的情况。
如果我们射的箭都没能射中红心,但都聚集在一个区域上,这时候说明我们效度不好(所谓效度是指有没有效),而信度还是OK的。
另外有种情况,虽然不集中,但都在红心附近,这说明效度高,但信度低。
用一种更生活化的例子来说明-量体重,各类情况如图:
以上例子说明,我们在收集数据时,要考虑清楚使用工具是不是合理的,收集到的数据是否存在偏差,如有偏差我们要想办法去弥补。
如何保证数据的信度和效度呢?我们通常会用以下方法。
1. 从源头上保证数据质量:选择合适的工具和迭代。
例如我们想要了解玩家对新手教程的情绪体验,如果让玩家自行表达自己的主观感受,最后的数据可能会存在偏差。若我们采用这样一个情绪体验图,这个表会将消极和积极情绪划分为4个维度,让玩家在体验过程中进行勾选,这时候就能够得到一个相对较直观的数据。从工具的角度使我们的数据更有效。
除此之外,我们还可以加入一些测谎题,帮助我们清洗数据。
例如在进行功能测试时,提出一些产品没有的功能,询问玩家对该功能的体验。或者增加态度测谎题,如在开始或结尾问一些互相冲突或矛盾的问题。
2.通过甄别保证数据有效
当我们得到数据后会进行数据清洗,这是保证数据的有效性的手段。
关于数据获取的核心思想,其实就是:事先规划。
我们需求要提前规划用什么样的方法,获取什么类型的数据,怎样去使用,在源头上保证数据。
三、怎样分析数据
当我们获得数据后,我们怎样去分析。
首先,数据要经过对比才有意义。
1. 与系统基线/常模做对比。
举个例子:今天天气好热,气温是104℉(华氏度),地表温度能达到140℉,综上所述,今天的天气对于人来说太热了。
这种情况对于接触摄氏度表达方式的人而言,虽然采用了定量数据分析,但并不能产生直观的意义。
因此,我们在做数据分析时,需要和系统基线和常模进行对比。比如说我们对华氏度没有概念,换成摄氏度就可以直观感受。如果不采用摄氏度,也可以加上人体的舒适温度大概在什么区间(华氏度)。无论是哪种方式,都是有效的,会比没有对比的数据好得多。
2.尽量进行单因素对比,避免干扰。
单因素对比能使得我们的结论更明确,不受到其他因素干扰。
但实际上我们进行数据分析时通常是多因素综合考虑。比如说一款卡牌类的游戏,我们需要考虑到地区(国内、日本)、等级(高中低)、付费能力、培养内容(卡牌、装备)等各方面,我们最常做的做法是控制变量,再去对比我们关心的数据。
当然有时候混淆因素不一定产生在我们要分析的维度上。
例如之前我们做了一个视觉疲劳度的分析,想看玩家在玩不同游戏内容时,视觉疲劳度会不会有差异。由于受屏幕设备这一干扰因素的影响,分析结果和预测不太一样,于是我们补充进行了一次阅读测试,采用不同的屏幕设备,让测试者阅读文本,再根据测试结果选择差异度小的设备进行游戏测试,同时控制大家体验不同游戏的时长,比如说都只体验前15分钟。这样得到的数据,则更严谨一些。
3.汇聚证据能使结果更可靠。
在以往测试发现,女性玩家在玩吃鸡类游戏的上手的障碍比较大。我们想要去论证这样的结果的话,需要多方面的数据来说明。我们常常会做以下测试,通过汇聚多方面的数据,也能使结果更加严谨。
总结而言,分析数据的核心思想,主要是两点:一个是对比,一个是分析数据。通过这两点使得结论更严谨。
1. 没有对比就没有结论。
2. 如果一个数据说不清楚,那就多来几个。
3. 保证结论严谨是UE的基本素养:一个结论可以是不完善的,但绝不能虚构。
评论 (2)