徐昊教授团队的论文“Toward Zero-shot Character Recognition: A Gold Standard Dataset with Radical-level Annotations”被ACM MM 2023录用。论文的第一作者为意大利特伦托大学与吉林大学计算机科学与技术学院联合培养的2020级博士生刁晓蕾,由Fausto Giunchiglia教授和徐昊教授共同指导。通讯作者为徐昊教授和考古学院 古文字团队李春桃教授,其他作者还包括计算机学院,人工智能学院和考古学院的博士生和硕士生。
甲骨文作为现代汉字的源头,是中华文化的瑰宝。甲骨文识别和破译作为古文字研究中重要的部分,对中华文化的理解和传承具有重要价值。但由于字符使用频率的不同,甲骨文的数据分布具有显著不平衡的特点,这对甲骨文相关研究带来了挑战。零样本字符识别任务考虑了数据分布不平衡的问题,为真实的甲骨文研究场景提供了一个可行的解决方案。针对甲骨文的特殊性,结合古文字专业知识,本文构建了一个同时包含部首级和字符级注释的甲骨文图像数据集,称为ACCID,通过提供真实世界中的具有显著类别分布不平衡和小样本问题的甲骨文字符图像,为上述方法的评估提供了一个新的基准。该数据同时含有甲骨文的字符级和部首级注释,其中部首级注释包括部首类别、部首位置、结构关系。 为了提高 ACCID 的适应性,提出了一种基于拼接的合成字符算法来扩充训练样本,并应用图像去噪方法来提高图像质量。在充分吸收专家考释古文字方法的基础上,本文提出了一种基于字符分解和重组的零样本字符识别的基线方法,用以对所提出的数据集进行评估。实验结果定量和定性地证明了所提出的基准ACCID的高质量和基线模型的有效性。
ACM MM 全称为国际多媒体大会(ACM International Conference on Multimedia),是多媒体领域顶级国际会议,也是计算机学会收录的计算机图形学与多媒体领域A类会议。ACM MM 2023将于2023年10月29日至11月3日在加拿大渥太华举办。