计算机科学与技术学院李熙铭副教授等的论文“Topic extraction from extremely short texts with variational manifold regularization”被机器学习领域重要国际期刊Machine Learning Journal(CCF B类)录用。论文第一作者为李熙铭副教授,通讯作者为王杨教授(合肥工业大学)。
随着社交媒体的普及,短文本已然成为文本数据传播的主要信息载体,因此短文本主题建模是机器学习领域的重要研究课题。针对短文本的稀疏问题,该工作首次提出使用短文本相似性信息,引入变分拉普拉斯约束项,提升短文本主题建模效果,并提出基于近似最近邻算法的在线推理方法,可高效处理大规模短文本数据。