游戏玩家流失预测
Last updated
Last updated
随着游戏市场的逐渐饱和,竞争也愈加激烈。许多研究声称吸引一个新玩家的成本远大于保留一个老玩家的成本。因此,使老玩家留存以提升游戏营收是游戏公司非常关心的问题。流失预测作为常用的提升用户留存率的手段,在电信、金融、在线游戏、电子商务等领域受到广泛研究。如图1所示,游戏用户生命周期是一个从探索成长到成熟稳定,并随着时间逐渐衰亡的过程。
在游戏领域中,大部分研究把流失预测建模为二分类问题,将未来一段时间未上线视为流失,反之视为留存,基于领域知识和数据分析,提取出有用的特征建模为用户的画像并进行分类预测。另一部分把流失预测建模为预测玩家流失的时间,即多久之后会流失,通常采用传统的回归方法和能处理删失数据的生存分析进行建模。
如何精确地对将流失的玩家进行预测,并执行有效的干预手段,提升玩家的留存,进而提升游戏的营收,对游戏的成功运营有着重要意义。
定义一:将流失预测建模为二分类问题,未来一段时间未登陆标记为流失(如7天、14天),反之则为留存,基于领域知识和数据分析构建用户特征,进而建立流失模型,进行二分类流失预测。
定义二:将流失预测建模为预测玩家的流失时间,找到玩家最后一次登陆与当前登陆时间的距离天数作为标记,建模成回归问题。
游戏场景中的流失预测问题中的挑战主要包括以下几点:
如何更有效地定义流失,并与有效的干预手段结合,产生实际商业价值;
如何提升预测精度,尤其是对未来长时间流失的预测问题;
存在不可忽略且难以观测到的外部因素导致的流失,如何降低其影响。
游戏场景中的流失预测主要通过两个指标进行评估:
二分类流失预测准确率: Accuracy、Precision、Recall、F1、AUC;
流失距离天数预测准确率:RMSE。
游戏数据集主要分为三个部分:
用户画像数据
role_id
string
玩家id
level
int
玩家等级
role_class
int
职业
online_time
int
在线时长
total_exp
int
总经验
total_gold
int
游戏代币数量
……
用户历史动作序列
role_id
string
玩家id
action_id
int
动作id
objective_ids
string
动作对象id,多个对象id以逗号隔开
time_stamp
int
动作发生的时间戳
用户关系网络(以游戏组队和师徒为例)
role_id
string
玩家id
team_id
int
游戏队伍id
teacher_id
int
师傅id
student_id
int
徒弟id
……
有任何问题,请联系 xiongyu1@corp.netease.com, zhaoshiwei@corp.netease.com