一种同伴知识互增强下的序列推荐方法
序列推荐(Sequential recommendation,SR)旨在建模用户序列中的动态兴趣,预测下一个行为.现有基于知识蒸馏(Knowledge distillation,KD)的多模型集成方法通常将教师模型预测的概率分布作为学生模型样本学习的软标签,不利于关注低置信度序列样本中的动态兴趣.为此,提出一种同伴知识互增强下的序列推荐方法(Sequential recommenda-tion enhanced by peer knowledge,PeerRec),使多个具有差异的同伴网络按照人类由易到难的认知过程进行两阶段的互相学习.在第 1 阶段知识蒸馏的基础上,第 2 阶段的刻意训练通过...
Saved in:
| Published in | 自动化学报 Vol. 49; no. 7; pp. 1456 - 1470 |
|---|---|
| Main Authors | , , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
安康学院电子与信息工程学院 安康 725000
01.07.2023
武汉理工大学计算机与人工智能学院 武汉 430070%武汉理工大学计算机与人工智能学院 武汉 430070 |
| Subjects | |
| Online Access | Get full text |
| ISSN | 0254-4156 |
| DOI | 10.16383/j.aas.c220347 |
Cover
| Summary: | 序列推荐(Sequential recommendation,SR)旨在建模用户序列中的动态兴趣,预测下一个行为.现有基于知识蒸馏(Knowledge distillation,KD)的多模型集成方法通常将教师模型预测的概率分布作为学生模型样本学习的软标签,不利于关注低置信度序列样本中的动态兴趣.为此,提出一种同伴知识互增强下的序列推荐方法(Sequential recommenda-tion enhanced by peer knowledge,PeerRec),使多个具有差异的同伴网络按照人类由易到难的认知过程进行两阶段的互相学习.在第 1 阶段知识蒸馏的基础上,第 2 阶段的刻意训练通过动态最小组策略协调多个同伴从低置信度样本中挖掘出可被加强训练的潜在样本.然后,受训的网络利用同伴对潜在样本预测的概率分布调节自身对该样本学习的权重,从解空间中探索更优的兴趣表示.3 个公开数据集上的实验结果表明,提出的PeerRec方法相比于最新的基线方法在基于Top-k的指标上不仅获得了更佳的推荐精度,且具有良好的在线推荐效率. |
|---|---|
| ISSN: | 0254-4156 |
| DOI: | 10.16383/j.aas.c220347 |