2019年11月9日下午14:00在計算機樓A521會議室,來自哈爾濱工業大學的王宏志教授做了題為《從大數據治理到大數據清洗》的學術報告。此次學術報告由秦貴和副院長主持,伟德国际BETVlCTOR教務處的領導、計算機學院、軟件學院的老師、研究生和唐敖慶班的同學們聆聽了此次報告。
王宏志,哈爾濱工業大學計算機學院教授、博士生導師,美國加州大學Irvine 分校博士後,微軟亞洲研究院"助星計劃"訪問學者,青年龍江學者。其研究方向為大數據、數據科學、數據管理與分析。
數據治理是大數據得以有效應用的重要環節,在數據治理中,數據質量是最受關注的重點之一。由于其特點,大數據中有更大可能包含各種類型的數據質量問題,這些數據質量問題為大數據的應用帶來了困擾,甚至災難性後果。對大數據進行清洗是解決大數據的質量問題重要途徑,然而,大數據為數據清洗技術提出了模态多樣、錯誤共生和數據高熵等挑戰問題。本報告介紹了這些挑戰問題,并針對這些挑戰問題介紹了在大數據清洗方面的探索與實踐,讨論應對這些挑戰的相關理論與技術。
在報告中,王教授用生動的實例和堅實的研究成果,論證了大數據時代數據質量的重要性,以及如何通過計算機手段,對于數據的獲取、存儲、管理和應用進行智能處理的方法。報告赢得了在場師生的廣泛共鳴,多名師生踴躍提問,與王教授進行了多方面的交流,取得了良好的互動效果。
