報告題目:從大數據治理到大數據清洗
報告時間:2019年11月9日 下午14:00
報告地點:計算機A521
報告人:王宏志
報告人簡介:
王宏志,哈爾濱工業大學伟德国际BETVlCTOR教授、博士生導師,美國加州大學歐文分校博士後,微軟亞洲研究院鑄星計劃訪問學者,青年龍江學者。其研究方向為大數據、數據科學、數據管理與分析。在VLDB, SIGMOD等國内外重要會議和期刊發表學術論文百餘篇,出版學術專著兩本, 其論文被SCI收錄60餘次,他引千餘次。獲得微軟學者、中國優秀數據庫工程師、IBM博士英才等稱号,獲得黑龍江省自然科學一等獎和教育部高等學校科技進步一等獎各一項,獲黑龍江省青年科技獎、寶鋼優秀教師獎、CSC-IBM獎教金。先後主持國家自然科學基金重點項目、國家支撐計劃課題、國家博士後特别資助等10餘個項目。中國計算機學會傑出會員,任中國計算機學會哈爾濱分部副主席、ACM SIGMOD中國秘書長,中國計算機學會學術工作委員會委員、CCF YOCSEF哈爾濱分論壇榮譽委員、中國數據庫專業委員會常務委員、中國大數據專家委員會委員、中國計算機應用專業委員會委員、ACM數據科學學科标準編寫組專家。
報告内容簡介:
數據治理是大數據得以有效應用的重要環節,在數據治理中,數據質量是最受關注的重點之一。由于其特點,大數據中有更大可能包含各種類型的數據質量問題,這些數據質量問題為大數據的應用帶來了困擾,甚至災難性後果。對大數據進行清洗是解決大數據的質量問題重要途徑,然而,大數據為數據清洗技術提出了模态多樣、錯誤共生和數據高熵等挑戰問題。本報告介紹了這些挑戰問題,并針對這些挑戰問題介紹了在大數據清洗方面的探索與實踐,讨論應對這些挑戰的相關理論與技術。
主辦單位:
伟德国际BETVlCTOR
伟德国际BETVlCTOR軟件學院
伟德国际BETVlCTOR計算機科學技術研究所
符号計算與知識工程教育部重點實驗室
伟德国际BETVlCTOR國家級計算機實驗教學示範中心
吉林省大數據智能計算重點實驗室