多维应用特征融合的用户偏好预测
TP311; 近年来,随着智能手机的飞速发展,移动应用的数目也快速增长.因此,移动应用开发者会提前预测用户对于自己开发的应用的偏好情况.选取Android应用的被卸载次数与其被下载次数的比值作为用户偏好的隐式反映,用户对应用的评价(喜爱率)作为用户偏好的显式反映.基于国内某知名手机应用市场提供的2014年5月至9月的大规模真实用户使用数据,选取9795个活跃用户数不少于50的Android手机应用作为研究对象,进行分析.从7个维度定义了可能影响用户对应用偏好的30种特征,并对每个应用进行特征提取.基于定义的特征,使用随机森林算法训练分类器,按照卸载/下载比率或喜爱率的高低对应用进行划分,并找出...
Saved in:
| Published in | 计算机科学与探索 Vol. 11; no. 9; pp. 1405 - 1417 |
|---|---|
| Main Authors | , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
北京大学 高可信软件技术教育部重点实验室,北京 100871
2017
北京大学(天津滨海)新一代信息技术研究院,天津 300450 |
| Subjects | |
| Online Access | Get full text |
| ISSN | 1673-9418 |
| DOI | 10.3778/j.issn.1673-9418.1609029 |
Cover
| Summary: | TP311; 近年来,随着智能手机的飞速发展,移动应用的数目也快速增长.因此,移动应用开发者会提前预测用户对于自己开发的应用的偏好情况.选取Android应用的被卸载次数与其被下载次数的比值作为用户偏好的隐式反映,用户对应用的评价(喜爱率)作为用户偏好的显式反映.基于国内某知名手机应用市场提供的2014年5月至9月的大规模真实用户使用数据,选取9795个活跃用户数不少于50的Android手机应用作为研究对象,进行分析.从7个维度定义了可能影响用户对应用偏好的30种特征,并对每个应用进行特征提取.基于定义的特征,使用随机森林算法训练分类器,按照卸载/下载比率或喜爱率的高低对应用进行划分,并找出显著影响卸载/下载比率、喜爱率的特征. |
|---|---|
| ISSN: | 1673-9418 |
| DOI: | 10.3778/j.issn.1673-9418.1609029 |