
大數據分析

大數據分析是指對規模巨大的數據進(jìn)行分析。大數據可以概括為5個(gè)V, 數據量大(Volume)、速度快(Velocity)、類(lèi)型多(Variety)、價(jià)值(Value)、真實(shí)性(Veracity)。大數據作為時(shí)下最火熱的IT行業(yè)的詞匯,隨之而來(lái)的數據倉庫、數據安全、數據分析、數據挖掘等等圍繞大數據的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點(diǎn)。隨著(zhù)大數據時(shí)代的來(lái)臨,大數據分析也應運而生
異步處理的大數據分析中遵守了捕獲、存儲加分析的流程,過(guò)程中數據由傳感器、網(wǎng)頁(yè)服務(wù)器、銷(xiāo)售終端、移動(dòng)設備等獲取,之后再存儲到相應設備上,之后再進(jìn)行分析。由于這些類(lèi)型的分析都是通過(guò)傳統的關(guān)系型數據庫管理系統(RDBMS)進(jìn)行的,數據形式都需要轉換或者轉型成為RDBMS能夠使用的結構類(lèi)型,例如行或者列的形式,并且需要和其它的數據相連續。
處理的過(guò)程被稱(chēng)之為提取、轉移、加載或者稱(chēng)為ETL。首先將數據從源系統中提取處理,再將數據標準化處理且將數據發(fā)往相應的數據倉儲等待進(jìn)一步分析。在傳統數據庫環(huán)境中,這種ETL步驟相對直接,因為分析的對象往往是為人們熟知的金融報告、銷(xiāo)售或者市場(chǎng)報表、企業(yè)資源規劃等等。然而在大數據環(huán)境下,ETL可能會(huì )變得相對復雜,因此轉型過(guò)程對于不同類(lèi)型的數據源之間處理方式是不同的。
當分析開(kāi)始的時(shí)候,數據首先從數據倉儲中會(huì )被抽出來(lái),被放進(jìn)RDBMS里以產(chǎn)生需要的報告或者支撐相應的商業(yè)智能應用。在大數據分析的環(huán)節中,裸數據以及經(jīng)轉換了的數據大都會(huì )被保存下來(lái),因為可能在后面還需要再次轉換。
異步處理的大數據分析中遵守了捕獲、存儲加分析的流程,過(guò)程中數據由傳感器、網(wǎng)頁(yè)服務(wù)器、銷(xiāo)售終端、移動(dòng)設備等獲取,之后再存儲到相應設備上,之后再進(jìn)行分析。由于這些類(lèi)型的分析都是通過(guò)傳統的關(guān)系型數據庫管理系統(RDBMS)進(jìn)行的,數據形式都需要轉換或者轉型成為RDBMS能夠使用的結構類(lèi)型,例如行或者列的形式,并且需要和其它的數據相連續。
處理的過(guò)程被稱(chēng)之為提取、轉移、加載或者稱(chēng)為ETL。首先將數據從源系統中提取處理,再將數據標準化處理且將數據發(fā)往相應的數據倉儲等待進(jìn)一步分析。在傳統數據庫環(huán)境中,這種ETL步驟相對直接,因為分析的對象往往是為人們熟知的金融報告、銷(xiāo)售或者市場(chǎng)報表、企業(yè)資源規劃等等。然而在大數據環(huán)境下,ETL可能會(huì )變得相對復雜,因此轉型過(guò)程對于不同類(lèi)型的數據源之間處理方式是不同的。
當分析開(kāi)始的時(shí)候,數據首先從數據倉儲中會(huì )被抽出來(lái),被放進(jìn)RDBMS里以產(chǎn)生需要的報告或者支撐相應的商業(yè)智能應用。在大數據分析的環(huán)節中,裸數據以及經(jīng)轉換了的數據大都會(huì )被保存下來(lái),因為可能在后面還需要再次轉換。
上一篇:九次方大數據
下一篇:大數據時(shí)代