The Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (ACL-IJCNLP 2021)(CCF A类会议)将于2021年8月线上举行,计算机科学与技术学院李熙铭副教授、欧阳继红教授等的论文“Semi-Supervised Text Classification with Balanced Deep Representation Distributions”被录用。论文的第一作者为欧阳继红教授的博士生李长春,通讯作者为李熙铭副教授、欧阳继红教授。
现有的半监督文本分类方法主要是基于自训练思想构建的,它们的效果很大程度上受到无标签数据的伪标签的准确度的影响。然而,这些无标签数据的伪标签的准确度通常是很低的,这主要是由半监督文本分类中标签的表示分布间的巨大差别引起的边缘偏差问题导致的。为了解决这一问题,作者应用角度边缘损失,同时结合高斯线性变换以平衡标签间角度方差,提出了一种新的半监督文本分类方法S2TC-BDD。实验结果表明,S2TC-BDD明显优于现有的半监督文本分类方法。
ACL会议(Annual Meeting of the Association for Computational Linguistics)是自然语言处理与计算语言学领域最高级别的学术会议,由计算语言学协会主办。