基于PUBG数据预测用户排名以及用户行为分析

(整期优先)网络出版时间:2019-10-20
/ 1

基于PUBG数据预测用户排名以及用户行为分析

尚楠

(北京理工大学计算机学院,北京市100081)

摘要:PUBG是一款风靡世界的战术竞技类射击沙盒游戏,玩家在一局游戏中需要在不断缩小的游戏圈中,拾取随机出现的武器、道具,击败其他所有玩家存活到最后。我们利用收集的数据集对该游戏整体情况、玩家情况、影响玩家获胜因素等进行分析,总结出获胜的关键点,并根据我们得出的结论为玩家进行作战特点分析,同时对每个玩家进行用户画像。

关键词:PUBG;数据预测;排名;特点

1.引言

随着科学技术的发展,手机已经成为人们日常生活中必不可少的一部分[1]。目前手机技术日新月异,除了可以用来打电话、发短信,各类竞技游戏也在不断更新。魔兽世界、王者荣耀和绝地求生等尤为受到不同年龄段人群的欢迎[2]。手机游戏的风靡也引发了一些学者对游戏用户的行为分析。比如在Kaggle平台上面,有许多一起参与比赛的人发表了Kernels和Discussion,其中主要是对数据预处理的讨论和他们预测排名时所用的方法,以及游戏整体情况的分析[3]。

2.研究过程

2.1实验数据

我们从kaggle上面下载了PUBGFinishPlacementPrediction(KernelsOnly)比赛的数据集,包括测试样本集test_V2.csv及训练样本集train_V2.csv。其中测试集中不包含winPlacePerc字段,其余与训练集相同。

2.2实验流程

本次研究实验流程如下图1:

图1流程图

3.结果分析

3.1评价指标

平均绝对误差(MeanAbsoluteDeviation):是所有单个观测值与算术平均值的偏差的绝对值的平均。平均绝对误差可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小,计算公式如下:

其中m(x)为预测值,xi为实际值,n为样本个数。

3.2结果展示

3.2.1游戏基本情况概述

1)游戏模式分析

由下图2可看出:相比较单人模式,玩家更倾向于双人或多人模式。且在游戏过程中更喜欢第一人称视角而非第三人称视角进行游戏。

图2游戏模式分析图

2)影响玩家获胜因素的简单宏观分析

简单分析相关系数矩阵可看出使用治疗或能量道具、伤害敌方玩家、跑动距离是影响游戏成败的关键因素。

3.2.2游戏玩家基本情况概述

1)击杀数统计

由下图3可见,大多数玩家并没有杀死敌方玩家,就被击杀了。

由于一场比赛中最多有100各玩家,我们认为一次击杀敌方玩家在30人以上时是游戏外挂,在数据预处理中去掉了击杀数大于30的数据记录。

图3击杀数统计图

2)爆头数统计

由下图4可见大多数玩家爆头率并不高。

我们认为爆头率100%的数据是游戏外挂造成的,故数据预处理中去掉了这部分数据。

图4爆头数统计图

3.2.3游戏玩家排名预测及用户画像绘制

1)用户画像绘制

我们取训练集的部分样本,画出如下几个雷达图作为例子,其中吃鸡率是我们预测的吃鸡排名

图5雷达图

2)排名影响因素

前三大影响排名胜负的因素是headshot_rate(爆击率)、damageDealt(伤害量)、distance_over_weapons(移动距离与武器)。

参考文献

[1]袁世雄,崔康元,高宇航.手机游戏市场分析[J].黑龙江科学.2014(04):18-23.

[2]田丰,吴驷,刘宏森,陆新和.游戏和青少年成长——以《王者荣耀》为样本的讨论[J].青年学报.2017(04):5-7.

[3]张莹莹.传播游戏理论视域下的手机网络游戏爆红现象研究——以《王者荣耀》为例[J].新闻传播.2017(18):36-38.