簡述大數據的四個特徵

2020-08-10 18:01:35

大數據的四個特徵:1、數據體量巨大;2、數據型別繁多;3、價值密度低;4、處理速度快。

大數據的四個特徵:

一是數據體量巨大(Volume)。

截至目前,人類生產的所有印刷材料的數據量是200PB(1PB=210TB),而歷史上全人類說過的所有的話的數據量大約是5EB(1EB=210PB)。當前,典型個人計算機硬碟的容量爲TB量級,而一些大企業的數據量已經接近EB量級。

二是數據型別繁多(Variety)。

這種型別的多樣性也讓數據被分爲結構化數據和非結構化數據。相對於以往便於儲存的以文字爲主的結構化數據,非結構化數據越來越多,包括網路日誌、音訊、視訊、圖片、地理位置資訊等,這些多型別的數據對數據的處理能力提出了更高要求。

三是價值密度低(Value)。

價值密度的高低與數據總量的大小成反比。以視訊爲例,一部1小時的視訊,在連續不間斷的監控中,有用數據可能僅有一二秒。如何通過強大的機器演算法更迅速地完成數據的價值「提純」成爲目前大數據背景下亟待解決的難題。

四是處理速度快(Velocity)。

這是大數據區分於傳統數據挖掘的最顯著特徵。根據IDC的「數位宇宙」的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。

以上就是簡述大數據的四個特徵的詳細內容,更多請關注php中文網其它相關文章!