什么是大數據?一般所理解的大數據,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。而大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)也被人們所認可。就目前來看,我們所看到的大數據包含最多的也只是大量這個特性,像價值等并未得到充分的體現。
大數據時代的到來,讓很多企業對獲取數據的欲望到了異常熾熱的程度,雖然數據存儲的成本越來越低,但它并不是免費的。然而,對于許多大公司來說,它們對于數據欲望的增長速度要比數據存儲成本降低的速度快得多。
許多企業往往在收集完數據之后,并不迅速處理這些數據,造成數據存儲成本增加。而他們也并沒有從這些數據中獲取任何價值。在另一個層面上,企業中的一些數據集已經開始造成了企業的收益遞減。因為數據樣本數量超過一個臨界點之后,無論增加多少數據,對于預測結果不會有任何太大的影響。也就是說,樣本數量過多,所花費的成本也就越多,但對于目標沒有任何實質性的價值。同時,數據冗余的,企業支出的不僅僅是存儲成本,還會面臨許多其他的問題。假如一旦發生數據泄露的話,尤其是業務數據,那么公司將會承擔巨大的損失。
數據越多,整理分析數據所需要的時間也就越多。當數據倉庫的規模達到數十億條記錄時,那么光是檢索數據就需要花上幾個小時,甚至是幾個星期。這時候,這些信息非但不會給企業帶來任何商業價值,反而會阻礙企業系統的運轉,因為這些系統根本不能處理這么大信息量。
因此,企業不能盲目追求大數據,而應當結合企業的具體情況,對有效的商業信息進行收集、篩選、分析,決策,從而讓數據為企業所用,為企業帶來價值。總而言之,數據能不能帶來商業價值,不在于數據本身,而在于如何運用數據。其最大的價值也不在于大數據本身,而在于加強了企業和個人對數據的重視和利用。