伏羲实验室用户画像组开放课题
Search…
概述
开放研究课题
游戏玩家进入的下一个游戏场景预测
MMORPG游戏服务器的合并模拟预测
基于游戏虚拟社交空间的玩家时空序列预测
基于多源数据融合的游戏玩家状态预测
MMORPG中的虚拟游戏道具价格预测
结合因果推断的时序预测
游戏玩家流失预测
游戏玩家流失原因分析
基于玩家角色轨迹的游戏外挂检测
基于玩家社交图谱的游戏外挂检测
基于玩家行为序列的游戏外挂检测
基于游戏客户端截图的FPS透视挂检测
在线游戏中的半监督异常交易群体检测
在线游戏中的交易网络子图匹配
可解释的外挂检测
个性化礼包生成与个性化礼包推荐
基于玩家实时交互的游戏道具推荐
游戏玩家时装商品搭配推荐
基于游戏社交关系的玩家-帮会关系预测
基于游戏战场中行为序列的玩家竞技风格挖掘
基于游戏战场中行为序列的动作价值评估
面向全局优化的游戏玩家组队匹配
游戏数据场景下的稳定学习框架
数据众包质量控制方法研究
开放工程课题
模型可解释性应用Demo制作
用户行为序列可视化系统Demo制作
因果分析仿真环境Demo制作
基于区块链技术的数据加密和流转框架Demo制作
游戏联邦学习框架Demo制作
画像标签体系可视化Demo制作
回报分解仿真环境Demo制作
用户关系图谱可视化系统Demo制作
游戏AutoML框架Demo制作
游戏背景知识
游戏基础
游戏玩法知识
游戏玩家分类
MMORPG元素
CCG元素
SPG元素
游戏数据集描述
伏羲游戏数据集
MMORPG1
ACT1
CCG1
SPG1
TAB1
高校合作申请流程
高校合作申请流程
Powered By
GitBook
游戏数据场景下的稳定学习框架
课题背景
如图1所示,游戏数据场景下的预测或者分类任务如
游戏场景预测
、
行为序列反外挂
、
时空序列预测
等,通常都利用动态流式数据(包括用户行为日志、用户关系图谱、用户画像标签和游戏版本设定等)作为输入,并且需要根据最新数据来输出结果。
图1:动态流式数据学习任务
这类基于动态流式数据的任务往往面临两大挑战:
模型性能瓶颈
由于数据的快速动态变化,有监督学习任务面临
概念漂移
和
模型退化
的问题,线下训练数据往往与生产环境数据分布不一致,同时也跟不上生产环境数据的快速变化。
模型效率瓶颈
为了取得较高的离线模型性能,往往导致
较大参数规模
的模型,这与生产环境下推理任务的实时需求产生矛盾;同时海量数据的训练极为耗时,
长时间训练迭代
往往跟不上数据的动态变化。
如何从训练数据中获取有效样本,同时从数据特征中发现因果特征成为维护模型稳定性的关键。
问题定义
稳定学习的定义主要有两个方面,一个是针对数据集,考虑所有可能的测试数据上的平均效果和方差,在保证平均效果最优的情况下,方差越小越稳定;另一个是针对样本点,希望模型在每个样本点上的误差都是一样的。
形式化定义:给定目标
y
y
y
和输入变量
x
=
[
x
1
,
x
2
,
⋯
,
x
p
]
∈
R
p
x=[x_1,x_2,\cdots,x_p] \in \mathbb{R}^p
x
=
[
x
1
,
x
2
,
⋯
,
x
p
]
∈
R
p
,稳定学习任务就是学习一个能够在任一数据点上实现均匀误差的预测性模型。
问题挑战
该问题主要面临以下挑战:
如何建立模型无关的稳定学习框架
如何进行评价稳定学习算法的性能
评价指标
主要评估算法预测的稳定性:
在不同分布数据上平均误差
在不同分布数据上误差的波动情况(如方差)
数据集描述
用户画像数据
字段
类型
描述
role_id
string
玩家id
level
int
玩家等级
role_class
int
职业
online_time
int
在线时长
total_exp
int
总经验
total_gold
int
游戏代币数量
……
用户历史动作序列
字段
类型
描述
role_id
string
玩家id
action_id
int
动作id
objective_ids
string
动作对象id,多个对象id以逗号隔开
time_stamp
int
动作发生的时间戳
用户关系网络(以游戏组队和师徒为例)
字段
类型
描述
role_id
string
玩家id
team_id
int
游戏队伍id
teacher_id
int
师傅id
student_id
int
徒弟id
……
联系我们
有任何问题,请联系
[email protected]
开放研究课题 - Previous
面向全局优化的游戏玩家组队匹配
Next - 开放研究课题
数据众包质量控制方法研究
Last modified
4mo ago
Copy link
Outline
课题背景
问题定义
问题挑战
评价指标
数据集描述
联系我们