CVPR 2024 | 用于零样本学习的渐进式语义引导视觉Transformer
发布日期:2025-06-08 05:03:42 浏览次数:4 分类:精选文章

本文共 396 字,大约阅读时间需要 1 分钟。

用于零样本学习的渐进式语义引导视觉Transformer

论文信息

题目:Progressive Semantic-Guided Vision Transformer for Zero-Shot Learning

中文标题:用于零样本学习的渐进式语义引导视觉Transformer

作者:Shiming Chen, Wenjin Hou, Salman Khan, Fahad Shahbaz Khan

论文创新点

本文提出了一种全新的零样本学习框架,称为ZSLViT(Zero-Shot Learning Vision Transformer),旨在通过渐进式学习与语义相关的视觉特征,显著提升视觉语义交互的效果。我们引入了一种名为语义嵌入token学习(SET)机制,该机制通过语义增强和语义引导的方式,进一步优化了视觉特征的表达和语义信息的捕捉能力。

上一篇:CVPR 2024 | 结构的重要性:解决图像修复中扩散模型的语义差异问题
下一篇:CVPR 2024 | 用于基于事件目标检测的场景自适应稀疏Transformer

发表评论

最新留言

哈哈,博客排版真的漂亮呢~
[***.90.31.176]2026年05月31日 22时01分30秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章