近日,CCF A类会议SIGGRAPH Asia 2023科技论文评审结束,中心2021级硕士生王昌硕论文“Anything to Glyph: Artistic Font Synthesis via Text-to-Image Diffusion Model”被录用(Conditionally accept)。SIGGRAPH ASIA是计算机图形学领域的顶级会议。
基于深度学习的艺术字生成是一项非常具有挑战性的任务,以往的方法主要关注于艺术字的纹理、颜色以及字形的变换,并将这些变换扩展到所有文字上。然而我们注意到,现实生活中的场景经常出现由各种物体组成的艺术字,而以往的工作无法生成这种类型的艺术字。本文基于text-to-image扩散模型,提出了一种新的弱位置约束方法以及一种隐空间语义增强模块,实现了高质量的zero-shot由物体组成的创新艺术字生成。通过与多种约束方法进行比较,这种弱约束方法能够在约束物体位置的同时不影响物体的原本形状,从而得到具有更好视觉效果的生成结果。