AI2000讲座观看笔记(十分简略地记一些内容和观点)

视频指路b站: 【孙爱欣教授: 推荐系统研究现状的理解|AI 2000学者专场】

  • 推荐系统重的时间维度可能会被遗失
  • 推荐系统领域中提出新模型的文章很多,但缺乏统一的评测标准
  • 数据集老旧,对推荐模型是否在不断进步产生疑问
  • 介绍了一篇文章,它从数据集、模型、评测三个层面解释了为什么item-KNN是一个很强的baseline(使用了20种模型分别在多个数据集上评测并且有对他们进行调参,最后根据综合平均的效果来得出结论)
  • 介绍了常见的评测方法:时间线、随机、leave-one-out
  • 还介绍了推荐系统中决策过程的动态特性(见下图)
  • 在推荐系统中,数据泄露问题普遍存在,通过实验我们发现时间点对于推荐模型的影响很大,甚至未来的数据也会影响推荐结果(见下图)
  • 推荐模型和任务针对有很大的关系,而且动态性强
  • 用户的决策会受到很多因素的影响,例如长期常规的静态喜好信息、和短期的动态的热点因子,哪个的影响力更大?不同因素之间的相关重要性又有多少?这些基本在不同的任务中考虑的方式都不一样。

  • 很多模型在离线时效果不错但上线就很差,是因为只捕捉到了静态的特征