CVPR 2024 | 文本引导的变分图像生成用于工业异常检测与分割-白红宇的个人博客

发布日期：2025-06-08 04:55:34 浏览次数：4 分类：精选文章

本文共 292 字，大约阅读时间需要 1 分钟。

文本引导的变分图像生成用于工业异常检测与分割

Mingyu Lee, Jongwon Choi

论文创新点

本文提出了一种基于文本信息的变分图像生成方法，旨在通过学习目标对象的文本信息，从大规模文本库中生成高质量的无缺陷数据图像。为解决工业图像数据中缺陷数据缺乏多样性的问题，本文开发了一种关键词到提示生成器，该生成器能够根据输入图像与文本信息的对比，自动生成最优提示词。

此外，本文提出了一个基于方差感知的图像生成器，该生成器扩展了传统的VQGAN模型，能够更好地捕捉目标对象的多样性特征，从而生成具有较高质量的无缺陷数据图像。这些技术的结合为工业异常检测和分割提供了新的解决方案。

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！