巨量資料(Big Data)
人氣(18108)
巨量資料(Big Data)又稱為大數據或海量資料,由巨型資料集組成,意指針對大量資料的整合服務。據維基百科定義,海量資料指的則是所涵蓋之資料量規模大到難在合理時間內進行「擷取」、「管理」、「處理」、並「整理」成企業經營決策所需的資訊;因此,其須藉由雲端科技,利用平行運算及搜尋等方式,才能提供使用者在一定的時間內快速獲得所需資料,將其整理為可用資訊。
海量資料的內容涵蓋範圍,共包含結構化、半結構化及非結構化的三大類資料(涵蓋文字、圖像及影音等),另根據IBM的定義,它還有四個特性:分別是資料龐「大」(Volume)、變化飛「快」(Velocity)、種類繁「雜」(Variety)、真偽存「疑」(Veracity)等。
應用領域包括大科學、RFID、感測裝置網路、天文學、大氣學、交通運輸、基因組學、生物學、大社會資料分析、網際網路檔案處理、製作網路搜尋引擎索引、通訊記錄明細、軍事偵查、金融,醫療,社群網路、通勤時間預測、醫療記錄、相片圖像和影像封存、大規模的電子商務等。
|
|
|
|