面向非随机缺失数据的协同过滤评分方法

TP31; 大多数评分预测研究都是基于缺失值是随机的假设.然而,实际的线上推荐系统的评分矩阵的缺失数据都是非随机的.对缺失数据的错误假设会导致有偏差的参数估计和预测.为了提高非随机缺失评分矩阵填补的准确度,文中深入分析了用户和物品的评分矩阵的内在原理,提出了通过行或列变换将用户和物品的评分矩阵转变为等价的双边块对角矩阵,再在不同的分区块中分别应用矩阵分解方法进行分解和评分预测的方法,使得局部数据更新和分解成为现实.在公测数据集上的实验结果显示,文中方法可以提高评分填补效果,有效地解决非随机评分缺失问题,从而提高推荐系统的预测准确率.变换后的分块矩阵在分布式处理实验中也获得了较好的加速比,说明文...

Full description

Saved in:
Bibliographic Details
Published in华南理工大学学报(自然科学版) Vol. 49; no. 1; pp. 47 - 57
Main Authors 古万荣, 谢贤芬, 张子烨, 毛宜军, 梁早清, 何亦琛
Format Journal Article
LanguageChinese
Published 华南农业大学 数学与信息学院, 广东 广州510642%暨南大学 经济学院, 广东 广州510632%华南理工大学 数学学院, 广东 广州510640 2021
Subjects
Online AccessGet full text
ISSN1000-565X
DOI10.12141/j.issn.1000-565X.200210

Cover

More Information
Summary:TP31; 大多数评分预测研究都是基于缺失值是随机的假设.然而,实际的线上推荐系统的评分矩阵的缺失数据都是非随机的.对缺失数据的错误假设会导致有偏差的参数估计和预测.为了提高非随机缺失评分矩阵填补的准确度,文中深入分析了用户和物品的评分矩阵的内在原理,提出了通过行或列变换将用户和物品的评分矩阵转变为等价的双边块对角矩阵,再在不同的分区块中分别应用矩阵分解方法进行分解和评分预测的方法,使得局部数据更新和分解成为现实.在公测数据集上的实验结果显示,文中方法可以提高评分填补效果,有效地解决非随机评分缺失问题,从而提高推荐系统的预测准确率.变换后的分块矩阵在分布式处理实验中也获得了较好的加速比,说明文中方法具有较好的应用可扩展性.
ISSN:1000-565X
DOI:10.12141/j.issn.1000-565X.200210