博客列表-白红宇的个人博客

CVPR 2025 | 突破注意力机制！vHeat：基于热传导的视觉表征模型

发布日期：2025-06-08 05:23:56 浏览次数：7 分类：精选文章

基于热传导的视觉表征模型vHeat中国科学院大学与鹏城国家实验室提出了一种全新的视觉表征模型vHeat，突破了传统视觉模型中attention机制的计算复杂度瓶颈。vHeat以物理学中的热传导原理为基础，将图片特征块视为"热源"，通过预测热传导率提取图像特征。与传统的attention机制相比，vHeat在计算复杂度（1.5次方）、全局感受野以及物理可解释性方面均有显著优势。v......

阅读正文

CVPR 2025 | 学习型图像压缩中的平衡率失真优化

发布日期：2025-06-08 05:19:53 浏览次数：4 分类：精选文章

论文信息题目：BalancedRate-DistortionOptimizationinLearnedImageCompression学习型图像压缩中的平衡率失真优化作者：YichiZhang,ZhihaoDuan,YuningHuang,FengqingZhu论文创新点我们提出了一个创新性的平衡率失真（R-D）优化框架，将传统的单目标R-D优化转化为多目标优化（MOO）问题。通过这种方法，我们能......

阅读正文

CVPR 2024 | 通过中值随机平滑实现真实世界超分辨率的通用鲁棒性

发布日期：2025-06-08 05:15:50 浏览次数：4 分类：精选文章

论文信息题目：UniversalRobustnessviaMedianRandomizedSmoothingforReal-WorldSuper-Resolution通过中值随机平滑实现真实世界超分辨率的通用鲁棒性作者：ZakariyaChaouai,MohamedTamaazousti论文创新点本文在超分辨率（SR）领域提出了多项创新贡献：1.**探索对抗攻击方法在SR中的应用**：首次将快速梯......

阅读正文

CVPR 2024 | 视觉新突破！首个无自然语言的纯视觉大模型！

发布日期：2025-06-08 05:11:47 浏览次数：4 分类：精选文章

构建大型视觉模型（LVM）的探索：仅靠像素就能走多远？随着大型语言模型（LLM）的崛起，视觉模型的研究也备受关注。UC伯克利和约翰霍普金斯大学的研究者在一篇新论文中探讨了构建大型视觉模型所需的关键要素，展示了仅靠像素数据即可实现的强大潜力。研究概述研究者提出了一种基于视觉句子的统一模型框架，能够处理多种视觉任务。这一框架利用VQGAN生成视觉token，并将这些token连接成一维序列，类似于语言......

阅读正文

CVPR 2024 | 结构的重要性：解决图像修复中扩散模型的语义差异问题

发布日期：2025-06-08 05:07:44 浏览次数：4 分类：精选文章

论文信息题目：StructureMatters:TacklingtheSemanticDiscrepancyinDiffusionModelsforImageInpainting结构的重要性：解决图像修复中扩散模型的语义差异问题作者：Liu,Y.,Zhang,X.,Wang,Z.,&Li,J.论文创新点提出了一种全新的结构引导纹理扩散模型(StrDiffusion)，通过引入稀疏结构作为辅......

阅读正文

CVPR 2024 | 用于零样本学习的渐进式语义引导视觉Transformer

发布日期：2025-06-08 05:03:42 浏览次数：4 分类：精选文章

用于零样本学习的渐进式语义引导视觉Transformer论文信息题目：ProgressiveSemantic-GuidedVisionTransformerforZero-ShotLearning中文标题：用于零样本学习的渐进式语义引导视觉Transformer作者：ShimingChen,WenjinHou,SalmanKhan,FahadShahbazKhan<section>&l......

阅读正文

CVPR 2024 | 用于基于事件目标检测的场景自适应稀疏Transformer

发布日期：2025-06-08 04:59:37 浏览次数：4 分类：精选文章

论文信息论文题目：SceneAdaptiveSparseTransformerforEvent-basedObjectDetection作者：彭延松、李贺碧、张悦亦、孙晓燕、吴峰GitHub地址：https://github.com/Peterande/SAST论文创新点本文提出了两大核心创新：窗口-token共稀疏化机制与场景自适应稀疏优化。窗口-token共稀疏化机制：通过引入评分模块与选择模......

阅读正文

CVPR 2024 | 文本引导的变分图像生成用于工业异常检测与分割

发布日期：2025-06-08 04:55:34 浏览次数：4 分类：精选文章

文本引导的变分图像生成用于工业异常检测与分割MingyuLee,JongwonChoi论文创新点本文提出了一种基于文本信息的变分图像生成方法，旨在通过学习目标对象的文本信息，从大规模文本库中生成高质量的无缺陷数据图像。为解决工业图像数据中缺陷数据缺乏多样性的问题，本文开发了一种关键词到提示生成器，该生成器能够根据输入图像与文本信息的对比，自动生成最优提示词。此外，本文提出了一个基于方差感知的图像生......

阅读正文

CVPR 2024 | 基于跨模态特征映射的多模态工业异常检测

发布日期：2025-06-08 04:51:32 浏览次数：3 分类：精选文章

论文信息题目：MultimodalIndustrialAnomalyDetectionbyCrossmodalFeatureMapping基于跨模态特征映射的多模态工业异常检测作者：AlexCostanzino,PierluigiZamaRamirez,GiuseppeLisanti,LuigiDiStefano源码：https://cvlab-unibo.github.io/Crossmodal......

阅读正文

CVPR 2024 | 基于自增强的无监督盲图像去模糊

发布日期：2025-06-08 04:47:27 浏览次数：3 分类：精选文章

论文信息题目：UnsupervisedBlindImageDeblurringBasedonSelf-Enhancement基于自增强的无监督盲图像去模糊作者：LufeiChen,XiangpengTian,ShuhuaXiong,YinjieLei,ChaoRen论文创新点本文提出了一种基于自增强的无监督盲图像去模糊框架，该框架能够无需依赖真实的成对数据集，逐步生成改进的伪清晰和模糊图像对。为此......

阅读正文

共 1002747 条，总 100275 页，当前第 82 页

首页

尾页

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

关于作者

推荐文章