巨量資料的特點

2020-10-06 13:00:15

資料集主要特點

  • Volume(大量): 資料量巨大,從TB到PB級別。

  • Velocity(高速): 資料量在持續增加(兩位數的年增長率)。

  • Variety(多樣): 資料型別複雜,超過80%的資料是非結構化的。

  • Value(低密度高價值): 低成本創造高價值。

其他特徵

  • 資料來自大量源,需要做相關性分析。
  • 需要實時或者準實時的流式採集,有些應用90%寫vs.10%讀。
  • 資料需要長時間儲存,非熱點資料也會被隨機存取。