Arxiv‘25 | 基于尺度双向对齐网络的遥感图像指代分割
发布日期:2025-06-08 03:46:51 浏览次数:4 分类:精选文章

本文共 630 字,大约阅读时间需要 2 分钟。

论文信息

Scale-wise Bidirectional Alignment Network for Referring Remote Sensing Image Segmentation
基于尺度双向对齐网络的遥感图像指代分割
作者: Kun Li, George Vosselman, Michael Ying Yang
源码链接:

论文摘要

本文提出了一种新型的基于尺度双向对齐网络的遥感图像指代分割方法。该方法通过构建先进的双向对齐模块(Bidirectional Alignment Module, BAM),实现了视觉与语言信息的高效融合。创新点包括: 1. 引入可学习的查询令牌机制,能够选择性地表示视觉与语言特征,突出与关键令牌相关的区域信息 2. 采用动态特征选择块(Dynamic Feature Selection Block),通过金字塔视觉表示结构,有效捕获图像的全局上下文信息,并在不同尺度层面上精准定位指代对象

论文创新点

本文主要创新如下: 1. **双向对齐模块(Bidirectional Alignment Module, BAM)**:通过可学习的查询令牌机制,能够选择性地表示视觉与语言特征,强调与关键令牌相关的区域。 2. **动态特征选择块(Dynamic Feature Selection Block)**:采用金字塔视觉表示结构,能够有效捕获图像的全局上下文,并在每个尺度上选择与指代对象最相关的图像区域。
上一篇:Arxiv‘25 | 基于稀疏标注的多光谱行人检测
下一篇:AI,正在疯狂污染中文互联网

发表评论

最新留言

第一次来,支持一个
[***.219.124.196]2026年06月15日 23时37分48秒