學術新聞
「大數據」的影響層面涵蓋醫療、教育、交通、商業,乃當今炙手可熱的研究與應用主題。但你知道「大數據」究竟和舊式的資料有什麼不同嗎?曾獲教育部第60屆學術獎得主、本校資管系陳彥良教授於四月十八日校慶系列講座主講「大數據分析的過去現在與未來」,帶師生一窺目前網路行銷不可或缺的關鍵因素—「大數據」。
從過去到現在:質與量的大爆炸
「二、三十年前,記憶體又小又貴,大家蒐集資料時僅能透過公家的資訊系統。」陳彥良說,傳統數據的應用範圍多為企業或政府資訊系統以及儀器數據。此外,過去的使用者只能透過鍵盤輸入所需數據,儲存在檔案、資料庫等形成結構化資料,傳統環境導致整體能使用及分析的資料單純,且種類有限。
那麼傳統數據是如何演變成如今高速進步且足以撼動市場經濟的大數據呢?陳彥良表示,隨著科技發展,現今任一網頁都涵蓋比過去大量的多媒體資料,加上「凡走過必留痕跡」的使用者行為,如使用者瀏覽網頁,導致資料本身產生質與量的爆炸性改變;此外,手機的普及讓使用者把資訊系統帶到所行之處,增添了動態性資料。這些資料的應用於是隨之發展,傳統數據的層次可藉由將各個小型資料合併後,進行分析得出額外的資訊與資料關聯性,最後從而洞察出隱藏智慧與商業機會,如此即能提取其中最重要的價值。
大數據:從數字與資料中看見商機
大數據的特徵為4V,分別是Volume(大量)、Velocity(快速)、Variety(種類)、Veracity(真實性)。陳彥良說,從2010到未來的2050,資料量將成長五十倍到達35ZB;有超過300億的RFID感光裝置,能夠讓資料處理更快速。大數據的資料來源包括網頁瀏覽、科學儀器、行動設備,如手機、行動晶片,與網路科技。過去的老舊模式是由少數公司產生資料,多數人使用資料;而現在的萬物聯網世代是由眾人產生資料,且眾人使用資料。陳彥良說:「這是一個無所遁形的時代。」網路使用者的一舉一動都將在無垠的資料海中留下一抹痕跡。
接著,陳彥良介紹大數據常用的資料探勘技術,如分類、分群、關聯分析等,並以美國大賣場Walmart為例,讓聽眾印象深刻。他說,Walmart的員工進行關聯分析之後發現有趣的現象:購買尿布的消費者同時也會購買啤酒。為什麼呢?他們開始深入了解,得知因為賣場大多離家遠,太太會請先生在下班後順道添購尿布,而疲憊的先生則會順手帶上啤酒以做犒賞。於是Walmart將兩樣商品置於鄰近處,果真提升了銷售量。
大數據之應用,最讓眾人熟悉的例子莫過於YouTube的音樂推薦和社群網站Facebook好友推薦。陳彥良說:「我們在Facebook上做的每個動作,加好友、瀏覽動態、戳一下,都會變成他們的資料。」這些資料讓企業能透過群集分析,針對用戶做個人化廣告與行銷;透過影響力分析可以找到意見領袖,進而能行銷產品或是掌握特定議題的輿論。
最後,陳彥良談到大數據未來的發展,他認為透過各領域的結合,讓資料與商業相輔相成,創造新的商業機會,即能展現大數據極致的價值。就如同阿里集團經營的淘寶網,結合銷售平台、商品交易、資料數據三方面來達到最大的經濟效益,形成良性數字媒體生態圈。大數據研究帶來發展的無限可能且正在改變整個市場;但同時,如何在數據和隱私間達成平衡,將是我們未來不可避免的挑戰。