计算机科学与技术学院康辉教授指导的2022级博士研究生张书豪的论文 “HSI: A Holistic Style Injector for Arbitrary Style Transfer” 被CCF A类会议CVPR 2025录用。论文第一作者为张书豪,第二作者为康辉教授,通讯作者为我院梅芳副教授,其他作者包括我院2024级硕士生刘洋和2023级博士生李洪娟。
该工作针对基于注意力机制的任意风格迁移方法中存在的局部过度匹配和高计算复杂度问题,提出了一种新型注意力风格转换模块,即整体风格注入器(Holistic Style Injector, HSI)。HSI具有三个主要特点:全局风格提取、动态双重关系构建和线性转换过程。全局风格提取着重于在内容图像上渲染各种全局风格模式,同时防止局部失真并丰富风格信息;动态双重关系构建同时建立局部内容到全局风格和全局内容到全局风格的关系,根据语义相似性灵活调整风格和内容分布之间的匹配,以获得更和谐的风格化结果;线性转换过程则基于高效的元素级乘法完成风格整合,实现线性复杂度的风格迁移。实验结果表明,该方法在效果和效率方面均优于现有最先进的方法。
IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 是计算机视觉与模式识别领域最具影响力的会议之一, CCF推荐A类会议。