金字塔局部聚合描述符的视觉位置识别研究

TP911.73; 视觉位置识别是计算机视觉和机器人领域中重要的研究内容.自然场景中由于视点改变所带来的图像内容变化会对位置识别造成一定的难度.为了解决这一问题,提出一种基于位置聚类的特征重组方法.首先,提出一种通用的金字塔扩展方法PyramidVLAD用于直方图特征提取.此外,为了进一步提升效率,将距离在一定阈值内的图像聚类至同一位置,然后再进行相似性计算.通过多组实验验证所提方法的有效性,使用PyramidVLAD与先进方法APANet进行比较,在Recall@1方面,所提方法在两个数据集中分别取得了1.02和2.54百分点的提升,实验结果表明所提方法能够在两个位置识别的基准数据集中获得比...

Full description

Saved in:
Bibliographic Details
Published in测试技术学报 Vol. 39; no. 1; pp. 54 - 62
Main Authors 张婉怡, 王佳, 宋明星
Format Journal Article
LanguageChinese
Published 吉林师范大学 信息技术学院,吉林 四平 136000 2025
吉林师范大学 吉林省光电子材料与器件工程研究中心,吉林 四平 136000
Subjects
Online AccessGet full text
ISSN1671-7449
DOI10.62756/csjs.1671-7449.2025009

Cover

More Information
Summary:TP911.73; 视觉位置识别是计算机视觉和机器人领域中重要的研究内容.自然场景中由于视点改变所带来的图像内容变化会对位置识别造成一定的难度.为了解决这一问题,提出一种基于位置聚类的特征重组方法.首先,提出一种通用的金字塔扩展方法PyramidVLAD用于直方图特征提取.此外,为了进一步提升效率,将距离在一定阈值内的图像聚类至同一位置,然后再进行相似性计算.通过多组实验验证所提方法的有效性,使用PyramidVLAD与先进方法APANet进行比较,在Recall@1方面,所提方法在两个数据集中分别取得了1.02和2.54百分点的提升,实验结果表明所提方法能够在两个位置识别的基准数据集中获得比现有方法更好的效果.
ISSN:1671-7449
DOI:10.62756/csjs.1671-7449.2025009