SPG1

数据集说明

数据收集自网易某体育竞技类(SPG)游戏,主要包含玩家画像数据、玩家行为序列数据、玩家关系图谱和场内行为序列四个部分。

玩家画像

玩家画像数据是根据玩家在游戏中的历史行为经过统计分析形成的标签化数据,包含了玩家自身属性、角色属性、消费行为、社交关系、行为习惯等方面的状态特征,以每日更新的形式增量存储, 如下图所示:

行为序列

行为序列数据是描述游戏玩家在游戏中历史行为的序列型数据,一般以When-Who-What-How_much/How_many的格式结构化存储,即“谁在何时做了什么以及行为的对象和行为的动作程度”,类似于下图的结构:

行为序列数据主要以结构化的数据格式记录玩家的历史动作和动作对象,如下表所示:

字段类型描述

role_id

string

玩家ID

action_id

string

动作ID

objective_ids

string

动作对象ID,多个对象用逗号分隔

ts

bigint

时间戳

ds

string

日期,一般数据量大时做分区使用

关系图谱

关系图谱是描述玩家之间关系建立和变化的图谱型数据,主要包含好友、聊天、帮会以及组队等几种关系,如下图所示:

关系图谱数据主要以结构化数据格式记录玩家之间的相互行为,按照行为发生的时间以每日更新的方式增量存储,如下表所示:

字段类型描述

ts

bigint

时间戳

role_id_src

string

玩家ID(发起方)

role_id_dst

string

玩家ID(接受方)

type

string

类型

ds

string

日期

场内行为序列

场内行为是SPG类游戏一种比较独特的行为数据,它记录的是玩家在每场比赛中的行为、行为的目标、行为产生的结果、比赛的最终结果等。如下图所示:

此数据集中出现过的不重复的行为名称和对应的描述如下:

字段描述

Shoot

投篮

Block

盖帽

ShootCancel

投篮取消

Rebound

拦板

Steal

抢断

Pass

传球

场内行为序列数据主要以结构化的数据格式记录玩家的历史动作和动作对象,按照行为发生的时间和比赛场次每日定时更新的方式增量存储,如下表所示:

字段类型描述

role_id

string

玩家ID

game_id

string

比赛场次ID

game_result

string

最终比赛结果

role_id_dst

string

指向玩家ID

action_type

string

行为类别

use_skills

string

使用技能,多个技能用逗号分隔

action_result

string

行为结果

ts

bigint

时间戳

ds

string

日期

Last updated