ECCV 2024 | Dolfin: 无自编码器的扩散布局Transformer
发布日期:2025-06-08 05:52:15
浏览次数:3
分类:精选文章
本文共 307 字,大约阅读时间需要 1 分钟。
Dolfin: 无自编码器的扩散布局Transformer
作者
Yilin Wang, Zeyuan Chen, Liangjun Zhong, Zheng Ding, Zhuowen Tu
论文创新点
Dolfin模型通过创新性的设计,在无需自编码器的情况下直接在原始空间进行操作,有效保留了几何特征如边界框对齐,同时显著提升了模型的透明性和可访问性。
此外,Dolfin提出了一种双向扩散模型和自回归扩散模型(Dolfin-AR),后者特别擅长捕捉对象或项目之间的丰富语义,进一步拓展了模型的应用场景。
这种架构设计不仅简化了模型结构,还显著提升了模型的灵活性和适用性,为图像生成和相关领域带来了新的可能性。
发表评论
最新留言
表示我来过!
[***.240.166.169]2026年06月14日 10时30分42秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!