展望大數據的應用
 


DDC數位化論文典藏聯盟



展望大數據的應用


應用系統組
蔡毓娟

    『大數據』這已經成為最近這幾年最為火熱的名詞,不僅是多數人看好的未來新趨勢,最關鍵的應用是如何從大數據的資料分析中取得價值。大數據是可以由各種不同來源的資料組合而成,可以是來自企業內部的交易資料、由外部社群網站去得的資料、物聯網取得的資訊、個人行動裝置取得的GPS位置資訊或是政府部門的公開資訊等等。數據資料每天是以驚人的速度在成長,根據McKinsey預估,目前Internet上數位資料是以每年40%的速度成長,直到2020年數位資料匯成長到目前的44倍。IDC2011年預測直到2020年,數位資料會是以每兩年倍數速度的成長。因此大數據在資料的儲存、處理與分析皆面臨非常大的挑戰。根據Gartner20148月時所做的一個新興技術的預測分析,該報告是以10年為一個基準,分析119種不同的領域,超過2000種不同的技術。然而大數據與資料科學家這兩種技術目前則正處於高峰,預估在未來的5-10年會有蓬勃的各種應用出現。
 
    根據Gartner2012年提出的3V定義,大數據是由高容量、高處理速度與高度多樣性資料所形成的新型態資料,需要能夠及時的進行資料處理並整合各種不同的異質資料,藉此來協助訂定有價值的策略,而這才是真正大數據分析應用的核心價值之所在。在從前做任何決策,憑藉是個人經驗並輔以少數面相的資料進行預測分析。而現在則是可以利用多方收集到的資料,進行資料分析並建立預測模型,提供更精確的資訊來做決策。在未來,有大數據分析的幫助之下,能夠整合更多樣性的資料,不僅為決策提供精確的分析資料, 更可以利用分析所得的資訊創造出新的模式,創造更高的價值。
 
    常見的大數據應用領域,如在商業上:用來做決策分析、市場銷售之預測、設計新的銷售方式等,在醫學上:利用電子病歷、就診相關資料等做分析和預測等,在科學上:利用大量的地理資訊和環境相關資料來做一些預警, 如防洪, 地震等等。兩個大數據分析的應用的著名例子,一為2012年歐巴馬競選總統時大量運用大數據分析來做為競選的策略與募款策略的擬定,另一為著名線上串流服務公司Netflix2013年時成功推出重製且低製作成本的電視劇─紙牌屋。2012年歐巴馬競選總統時在具有決定性的搖擺州進行不同策略的競選活動,是利用著名社群網站Twitter上的推文並結合其他資料進行大數據資料分析結果,制定不同的競選活動與廣告策略。其在小額募款的策略是採寄送email的方式來進行,根據每天發送出的各種不同主旨、寄件者與內容的email,與實際收到募款的金額和回應去分析要怎樣寄送email比較容易讓支持者捐款。最後數據分析,由第一夫人蜜雪兒歐巴馬為寄件者發出的募款email最具成效,而競選團隊負責人—Messina比副總統拜登鄧有效果。最後順利募集競選資金10億美元。著名線上串流公司Netflix2013年成功推出重製且低製作成本的電視劇─紙牌屋,為另一個著名利用大數據資料分析成功創造新的商業模式之例子。根據Netflix內部的訂閱資料進行多面向的分析, 可以知道訂閱者的喜好。他們找到一個規則:喜歡看老牌英國電視劇紙牌屋的訂閱者,同時也是影星Kevin Spacey的影迷,也喜歡導演David Fincher的影片。因此投資1億美金重新根據訂閱者的喜好內容製作該電視劇。該電視劇推出後在全美增加2百萬新的訂閱者,在2013年的第一季,比起前一季增加7%新的訂閱者,而全球增加1百萬新的訂閱者,86%的訂閱者都非常喜歡該電視劇。成功利用大數據分析創造新的商業模式。
 
    大數據之應用並非百利而無害,才在隱私保護上面臨巨大的挑戰。在進行大數據分析之應用時,由於收集到來自各分不同的資料來源,雖然個別資料可能已經做了去個人化的資料保護機制,但不能確保各不同資料間不會產生自動連結的關係,而造成隱私外洩。以著名的Taget超市為例,其使用企業內部的歷史交易記錄整合其他外部資料,做了洩漏個人隱私的市場行銷,寄給未成年少女的父親超市的孕婦專屬折價券。進行大資料數據收集時,必須要達到隱私保護與安全性的要求,不收集個人化的資料。各國政府同時也需要針對目前現有的隱私保護之相關法令進行再審視,並擴增可適用於大數據相關的條文。

DDC數位化論文典藏聯盟


典藏閱覽組

電子書平台簡介:  
為因應國內對於博碩士論文之需求並協助國內各學術研究機構 能更便利及以更優惠之價格獲得博碩士論文之電子資源,故國 內圖書館界相關單位共同成立美加地區數位化論文典藏聯盟, 期共享數位資源並獲得更佳之產品及服務。只要是參加聯盟的 會員皆可透過網路連線彼此分享訂購之論文,其運作理念即為 建立電子資源共享模式, 一員購置,全員受惠,隨時間推進, 資源數量亦隨之累積。自2001年9月聯盟成立起,至今已有包 括台灣大學、交通大學…等一百多所大學圖書館加入本聯盟。 目前「召集單位」為國立政治大學圖書館;「伺服主機單位」為 中央研究院計算機中心。  

連線方式

由本校圖書資訊館-電子資源整合查詢系統登入 (登入的帳號、密碼與本校電子郵件相同)

操作步驟

 

、由本校電子資源整合查詢系統登入 (登入的帳號、密碼 與本校電子郵件相同)。         

  二、點選【電子書】→再點選左方的【電子書平台】 ,接著由DDC數位化論 文典藏聯盟的連結進入,目前共收錄3250筆的資料。
 
 

三、隨意點選任一筆的題名,即可連結至DDC數位化論文典藏聯 盟的頁面。

 
 

四、進到DDC數位化論文典藏聯盟的頁面,上方可看到每篇論文的題名並提供PDF全文下載,下方則是論文摘要與相關的書目資料。

 
        

五、點選首頁可瀏覽更多的資訊。(1)右上方有提供簡單查詢的方框,(2)左邊的論文資源可看到所典藏論文的年份與數量;左下 方為推薦論文可供參考。(3)中間為聯盟公告與新論文上架的訊息。

 
        

、點選論文檢索可提供更多檢索欄位做進階查詢。若點選論文瀏覽,則可依英文字母排序或年份來做瀏覽。

 

 

 

Copyright 2012 © 圖書資訊館 Library and Information Center
81148 高雄市楠梓區高雄大學路700號
700, Kaohsiung University Rd., Nanzih District, 811. Kaohsiung, Taiwan, R.O.C
本館流通服務台電話:07-5919306