基于查询—文档异构信息网络的半监督学习

TP391; 基于图的半监督学习近年来得到了广泛的研究,然而,现有的半监督学习算法大都只能应用于同构网络.根据查询及文档自身的内容特征和点击关系构建查询—文档异构信息网络,并引入样本的判别信息强化网络结构.提出了查询—文档异构信息网络上半监督聚类的正则化框架和迭代算法,在正则化框架中,基于流形假设构造了异构信息网络上的代价函数,并得到该函数的封闭解,以此预测未标记查询和文档的类别标记.在大规模商业搜索引擎查询日志上的实验表明本方法优于传统的半监督学习方法....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 35; no. 8; pp. 40 - 47
Main Authors 刘钰峰, 李仁发
Format Journal Article
LanguageChinese
Published 湖南大学嵌入式系统与网络实验室,湖南长沙410082 2014
湖南大学信息科学与工程学院,湖南长沙,410082%湖南大学信息科学与工程学院,湖南长沙410082
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.3969/j.issn.1000-436x.2014.08.006

Cover

More Information
Summary:TP391; 基于图的半监督学习近年来得到了广泛的研究,然而,现有的半监督学习算法大都只能应用于同构网络.根据查询及文档自身的内容特征和点击关系构建查询—文档异构信息网络,并引入样本的判别信息强化网络结构.提出了查询—文档异构信息网络上半监督聚类的正则化框架和迭代算法,在正则化框架中,基于流形假设构造了异构信息网络上的代价函数,并得到该函数的封闭解,以此预测未标记查询和文档的类别标记.在大规模商业搜索引擎查询日志上的实验表明本方法优于传统的半监督学习方法.
ISSN:1000-436X
DOI:10.3969/j.issn.1000-436x.2014.08.006