面向互联网的大规模重复图像检索技术研究

TP391.4; 针对互联网上典型的社交媒体应用,提出了一个基于随机投影和分块DCT系数的大规模分布式重复图像检索方法.该方法在Hadoop集群的基础上,首先利用随机投影映射生成图像签名,再由图像签名高效的检索HBase表以获得具有高召回率的候选图像集,最后依赖分块DCT系数对候选图像进行进一步过滤来提高检索精度.实验结果表明,对于1 200万张微博图像,当H=2且T=150时,该方法的召回率为98%,精确率为93.2%,平均检索时间为6.7s....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 35; no. 12; pp. 196 - 202
Main Authors 王树鹏, 陈明, 吴广君
Format Journal Article
LanguageChinese
Published 中国科学院信息工程研究所,北京,100093%郑州轻工业学院软件学院,河南郑州,450000 2014
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.3969/j.issn.1000-436x.2014.12.023

Cover

More Information
Summary:TP391.4; 针对互联网上典型的社交媒体应用,提出了一个基于随机投影和分块DCT系数的大规模分布式重复图像检索方法.该方法在Hadoop集群的基础上,首先利用随机投影映射生成图像签名,再由图像签名高效的检索HBase表以获得具有高召回率的候选图像集,最后依赖分块DCT系数对候选图像进行进一步过滤来提高检索精度.实验结果表明,对于1 200万张微博图像,当H=2且T=150时,该方法的召回率为98%,精确率为93.2%,平均检索时间为6.7s.
ISSN:1000-436X
DOI:10.3969/j.issn.1000-436x.2014.12.023