您當前位置: 首頁  >  科學研究  >  伟德動态  >  正文

伟德動态

伟德国际BETVlCTOR名家講座系列報道(徐曉偉)

發布日期:2019-06-18 發布人: 點擊量:

2019年6月15日上午,美國阿肯色大學徐曉偉教授應伟德国际BETVlCTOR邀請,在計算機樓A521報告廳作了題為“Multi-Resolution Models for Learning Multilevel Abstract Representations of Text”的學術報告。


徐曉偉教授,美國阿肯色大學-小石城分校信息科學系知識發現和數據挖掘(Advanced Knowledge Discovery and Data Mining Research Laboratory)實驗室主任;兼任阿肯色大學數學系教授。1983年在南開大學數學系獲得學士學位,1987年在中國科學院沈陽計算技術研究所獲得碩士學位,1998年在德國慕尼黑大學(University of Munich)獲得博士學位。徐曉偉教授的研究領域包括數據挖掘、機器學習、生物信息、數據管理及高性能計算,曾多次在模式識别和數據挖掘領域的知名國際會議上作大會特邀報告,在學術期刊上發表具有原創性的研究成果。其中,他提出的基于密度聚類的一系列理論算法被寫入教科書。


在本次報告中,徐曉偉教授首先對傳統的神經網絡模型進行了深刻的分析,接下來分别介紹了文本挖掘領域最重要的Embedding步驟裡采用的最新算法Global Vectors (GloVe)、fastText、Embedding from Language Models(ELMo)和Bidirectional Encoder Representations from Transformers (BERT)等。在此基礎上,徐教授介紹了他們團隊近期的研究成果。首先,将各個Embedding算法進行一個類似于組合的過程,大幅度提升了文本挖掘工作中Embedding過程的準确率。在接下來的處理步驟中,又提出了一個全新的并且覆蓋範圍極廣的神經網絡模型,幾乎涵蓋了現今使用的傳統神經網絡模型的全部算法,同時對所提出模型的評價标準做了詳細的解釋。多組實驗對比結果證明了該模型的準确性及普适性是極為優越的。最後,徐教授介紹了下一步研究計劃:第一,要嚴格通過數學證明該算法的合理性;第二,能否找到更加适合的損失函數(比如基于聚類算法的思想),以進一步提升該模型的性能;第三,徐教授提到該算法不僅僅隻能應用在文本挖掘領域内,也希望大家能提出好的想法,将該算法的應用拓展。


報告後,徐曉偉教授與到場師生進行了深入的交流與讨論,解答了大家對于文本挖掘和深度神經網絡所提出的問題。本次講座不僅提高了大家關于深度神經網絡的了解,也令大家對于文本挖掘和數據挖掘領域産生了濃厚的興趣。


Baidu
sogou