計算機科學與技術學院李熙銘副教授等的論文“Topic extraction from extremely short texts with variational manifold regularization”被機器學習領域重要國際期刊Machine Learning Journal(CCF B類)錄用。論文第一作者為李熙銘副教授,通訊作者為王楊教授(合肥工業大學)。
随着社交媒體的普及,短文本已然成為文本數據傳播的主要信息載體,因此短文本主題建模是機器學習領域的重要研究課題。針對短文本的稀疏問題,該工作首次提出使用短文本相似性信息,引入變分拉普拉斯約束項,提升短文本主題建模效果,并提出基于近似最近鄰算法的在線推理方法,可高效處理大規模短文本數據。