CVPR 2024 | 文本引导的变分图像生成用于工业异常检测与分割
发布日期:2025-06-08 04:55:34 浏览次数:4 分类:精选文章

本文共 292 字,大约阅读时间需要 1 分钟。

文本引导的变分图像生成用于工业异常检测与分割

Mingyu Lee, Jongwon Choi

论文创新点

本文提出了一种基于文本信息的变分图像生成方法,旨在通过学习目标对象的文本信息,从大规模文本库中生成高质量的无缺陷数据图像。为解决工业图像数据中缺陷数据缺乏多样性的问题,本文开发了一种关键词到提示生成器,该生成器能够根据输入图像与文本信息的对比,自动生成最优提示词。

此外,本文提出了一个基于方差感知的图像生成器,该生成器扩展了传统的VQGAN模型,能够更好地捕捉目标对象的多样性特征,从而生成具有较高质量的无缺陷数据图像。这些技术的结合为工业异常检测和分割提供了新的解决方案。

上一篇:CVPR 2024 | 用于基于事件目标检测的场景自适应稀疏Transformer
下一篇:CVPR 2024 | 基于跨模态特征映射的多模态工业异常检测

发表评论

最新留言

感谢大佬
[***.8.128.20]2026年06月05日 10时06分29秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章