ChatGPT绝对是属于年轻人的一个大机会
chatgpt中文版 http://chatgpt.guige.xyz
刚刚过去的几个月,无疑是生成式AI爆发的奇点。
说到生成式AI,就不能不提到AIGC。AIGC全称为AI-Generated Content,指基于预训练大模型、生成式对抗网络(GAN)等人工智能技术,通过已有数据寻觅规律,并通过释放泛化能力生成相关技术的内容。
AIGC 在图象生成中的示例
虽然在文生图领域,分散模型仿佛已一统天下,但GAN 仍然存在不可磨灭的优势。这使得一些研究者在这一方向上延续努力,并获得了非常实用的成果,相关的论文已被 CVPR 2023 接收。
这次我整理了46篇【CVPR 2023的AIGC利用汇总】图象转换、翻译/可控文生图/图象恢复/语义布局可控生成/医学图象/face相关的基于diffusion分散模型/GAN生成对抗方法论文合集+部份代码,我特地选了6篇具有代表性的文章为大家叙述,希望对在该领域想发论文的同学带来一些新思路!
并且今天不要钱为大家送一波福利!
扫描二维码,回复【GAN】
领取46篇CVPR 2023 AIGC利用论文和部份代码合集
全是pdf格式,非常方便,想要的同学千万不要错过!


“
01
GAN的反击!朱俊彦新作GigaGAN,出图速度秒杀Stable Diffusion
题目:


最近,文字-图象生成技术的成功已席卷全球,激起了大众的想象力。从技术的角度来看,它也标志着设计生成图象模型所青睐的架构的巨大变化。GANs曾是事实上的选择,有StyleGAN这样的优秀技术。随着DALL·e2的出现,自回归和分散模型仿佛一夜之间成为大范围生成模型的新标准。
CycleGAN 的主要作者、曾获 2018 年 ACM SIGGRAPH 最好博士论文奖的朱俊彦是这篇 CVPR 论文的第二作者。
该研究首先使用 StyleGAN2 进行实验,并视察到简单地扩大主干网络会致使训练不稳定。基于此,研究者肯定了几个关键问题,并提出了一种在增加模型容量的同时稳定训练的技术。
“
02
基于示例的图象转换的屏蔽和自适应变压器
题目:


该论文提出了一个基于样本的图象转换新方法。用于此任务的先进方法主要集中在建立跨域语义对应上,但跨域语义匹配具有挑战性,匹配毛病终究会下降生成图象的质量。
为了克服这一挑战,该论文提出了一种掩码和自适应变换器 (MAT),用于学习准确的跨域对应关系,并履行上下文感知特点增强。为了实现后者,使用样本的输入源特点和全局样式代码作为补充信息来解码图象。
另外,设计了一种新的对照风格学习方法,用于获得质量辨别风格表示,这反过来有益于高质量图象的生成。实验结果表明在各种图象转换任务中表现更好。
“
03
具有列行纠缠像素合成的高效尺度不变生成器
题目:


该论文说明任意尺寸图象生成(Any-scale image synthesis)提供了一种高效和可扩大的解决方案,可以在任何比例下合成逼真的图象,乃至超过2K分辨率。
这项工作提出了列行耦合的像素生成(Column-Row Entangled Pixel Synthesis,CREPS),一种既高效又具有尺度等变性的新型生成模型,而不使用任何空间卷积或粗到细的设计。在各种数据集上的实验,包括FFHQ、LSUNChurch、MetFaces和Flickr-Scenery,证实了CREPS具有在任意任意分辨率下合成尺度一致图象的能力。
“
04
图象恢复,基于GAN生成对抗/diffusion分散模型方法
题目:


该论文研究JPEG图象恢复问题,即加密比特流中的比特毛病。比特毛病会致使解码后的图象内容出现不可预测的色偏和块位移,这些问题没法通过现有的主要依赖于像素域中预定义退化模型的图象恢复方法来解决。该论文提出了一个强健的JPEG解码器,并采取两阶段补偿和对齐框架来恢复受比特流破坏的JPEG图象。
具体而言,JPEG解码器采取了一种具有容错机制的方法来解码受损的JPEG比特流。两阶段框架由自补偿和对齐(SCA)阶段和引导补偿和对齐(GCA)阶段组成。在三个区别比特毛病率的基准测试上进行了实验。实验结果和消融研究表明了我们所提出的方法的优越性。
“
05
PosterLayout:内容感知视觉文本演示布局的新基准和方法
题目:


该论文提出了设计序列构成(DSF)方法,以摹拟人类设计师的设计进程重新组织布局中的元素,并提出了一种基于CNN-LSTM的条件生成对抗网络(GAN)来生成适当的布局。具体来讲,鉴别器是设计序列感知的,将监督生成器的“设计”进程。
实验结果验证了新基准的有用性和所提出方法的有效性,该方法通过为区别的画布生成适当的布局实现了最好性能。
“
06
使用人脑活动的潜伏分散模型进行高分辨率图象重建
题目:


本文提出一种基于分散模型(DM)的新方法,通过功能性磁共振成像(functional magnetic resonance imaging,fMRI)从人脑活动来重构出图象。通过研究LDM的区别组成部份(例如图象的潜伏向量Z、条件输入C和去噪U-Net的区别元素)与区别的脑功能之间的关系,表征了LDM的内部机制。
方法可以在简单的方式下重构具有高保真度的高分辨率图象,而不需要任何额外的训练和精调复杂的深度学习模型。还提供了从神经科学角度对区别LDM组件的定量解释。整体而言,研究提出了一种重构人类脑活动中图象的有前程的方法,并为理解DM提供了新的框架。
并且今天不要钱为大家送一波福利!
扫描二维码,回复【GAN】
领取46篇CVPR 2023 【AIGC利用论文+部份代码合集】
全是pdf格式,非常方便,想要的同学千万不要错过!


这次我还约请了高级视觉算法研究员的吉米老师,用一小时的时间给大家分享《sota、difussion和GAN结合论文中稿的支持点》,以《Generative Adversarial Nets》-NIPS2014论文为例,手把手教大家如何带入difussion学习和应用aigc技术发论文。
扫码预约直播+领46篇论文合集
桂&哥&网&络www.guIgEge.cn
本文来源于chatgptplus账号购买平台,转载请注明出处:https://chatgpt.guigege.cn/jiaocheng/29602.html 咨询请加VX:muhuanidc