论文信息

题目：Progressive Semantic-Guided Vision Transformer for Zero-Shot Learning

中文标题：用于零样本学习的渐进式语义引导视觉Transformer

作者：Shiming Chen, Wenjin Hou, Salman Khan, Fahad Shahbaz Khan


      
     论文创新点
  
     本文提出了一种全新的零样本学习框架，称为ZSLViT（Zero-Shot Learning Vision Transformer），旨在通过渐进式学习与语义相关的视觉特征，显著提升视觉语义交互的效果。我们引入了一种名为语义嵌入token学习（SET）机制，该机制通过语义增强和语义引导的方式，进一步优化了视觉特征的表达和语义信息的捕捉能力。

上一篇：CVPR 2024 | 结构的重要性：解决图像修复中扩散模型的语义差异问题

下一篇：CVPR 2024 | 用于基于事件目标检测的场景自适应稀疏Transformer

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

论文信息

题目：Progressive Semantic-Guided Vision Transformer for Zero-Shot Learning

中文标题：用于零样本学习的渐进式语义引导视觉Transformer

作者：Shiming Chen, Wenjin Hou, Salman Khan, Fahad Shahbaz Khan

论文创新点

发表评论

最新留言

关于作者

推荐文章