面向互联网的大规模重复图像检索技术研究
TP391.4; 针对互联网上典型的社交媒体应用,提出了一个基于随机投影和分块DCT系数的大规模分布式重复图像检索方法.该方法在Hadoop集群的基础上,首先利用随机投影映射生成图像签名,再由图像签名高效的检索HBase表以获得具有高召回率的候选图像集,最后依赖分块DCT系数对候选图像进行进一步过滤来提高检索精度.实验结果表明,对于1 200万张微博图像,当H=2且T=150时,该方法的召回率为98%,精确率为93.2%,平均检索时间为6.7s....
Saved in:
| Published in | 通信学报 Vol. 35; no. 12; pp. 196 - 202 |
|---|---|
| Main Authors | , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
中国科学院信息工程研究所,北京,100093%郑州轻工业学院软件学院,河南郑州,450000
2014
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 1000-436X |
| DOI | 10.3969/j.issn.1000-436x.2014.12.023 |
Cover
| Summary: | TP391.4; 针对互联网上典型的社交媒体应用,提出了一个基于随机投影和分块DCT系数的大规模分布式重复图像检索方法.该方法在Hadoop集群的基础上,首先利用随机投影映射生成图像签名,再由图像签名高效的检索HBase表以获得具有高召回率的候选图像集,最后依赖分块DCT系数对候选图像进行进一步过滤来提高检索精度.实验结果表明,对于1 200万张微博图像,当H=2且T=150时,该方法的召回率为98%,精确率为93.2%,平均检索时间为6.7s. |
|---|---|
| ISSN: | 1000-436X |
| DOI: | 10.3969/j.issn.1000-436x.2014.12.023 |