資料倉儲相對於操作型資料庫來說其突出特點是什麼

2022-07-19 18:02:05

突出特點是「海量資料支援」和「快速檢索技術」。資料倉儲是決策支援系統和聯機分析應用資料來源的結構化資料環境,而資料庫是整個資料倉儲環境的核心,是資料存放的地方和提供對資料檢索的支援;相對於操縱型資料庫來說其突出的特點是對海量資料的支援和快速的檢索技術。

本教學操作環境:windows7系統、Dell G3電腦。

資料倉儲相對於操作型資料庫來說其突出特點是「海量資料支援」和「快速檢索技術」。

資料倉儲,英文名稱為Data Warehouse,可簡寫為DW或DWH。資料倉儲,是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它是單個資料儲存,出於分析性報告和決策支援目的而建立。 為需要業務智慧的企業,提供指導業務流程改進、監視時間、成本、品質以及控制。

資料倉儲是決策支援系統(dss)和聯機分析應用資料來源的結構化資料環境。資料倉儲研究和解決從資料庫中獲取資訊的問題。資料倉儲的特徵在於面向主題、整合性、穩定性和時變性。

資料倉儲的特點

資料倉儲,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,它並不是所謂的「大型資料庫」。資料倉儲的方案建設的目的,是為前端查詢和分析作為基礎,由於有較大的冗餘,所以需要的儲存也較大。為了更好地為前端應用服務,資料倉儲往往有如下幾點特點:

1、效率足夠高。

資料倉儲的分析資料一般分為日、周、月、季、年等,可以看出,日為週期的資料要求的效率最高,要求24小時甚至12小時內,客戶能看到昨天的資料分析。由於有的企業每日的資料量很大,設計不好的資料倉儲經常會出問題,延遲1-3日才能給出資料,顯然不行的。

2、資料品質。

資料倉儲所提供的各種資訊,肯定要準確的資料,但由於資料倉儲流程通常分為多個步驟,包括資料淨化,裝載,查詢,展現等等,複雜的架構會更多層次,那麼由於資料來源有髒資料或者程式碼不嚴謹,都可以導致資料失真,客戶看到錯誤的資訊就可能導致分析出錯誤的決策,造成損失,而不是效益。

3、擴充套件性。

之所以有的大型資料倉儲系統架構設計複雜,是因為考慮到了未來3-5年的擴充套件性,這樣的話,未來不用太快花錢去重建資料倉儲系統,就能很穩定執行。主要體現在資料建模的合理性,資料倉儲方案中多出一些中間層,使海量資料流有足夠的緩衝,不至於資料量大很多,就執行不起來了。

從上面的介紹中可以看出,資料倉儲技術可以將企業多年積累的資料喚醒,不僅為企業管理好這些海量資料,而且挖掘資料潛在的價值,從而成為通訊企業運營維護系統的亮點之一。

廣義的說,基於資料倉儲的決策支援系統由三個部件組成:資料倉儲技術,聯機分析處理技術和資料探勘技術,其中資料倉儲技術是系統的核心,在這個系列後面的文章裡,將圍繞資料倉儲技術,介紹現代資料倉儲的主要技術和資料處理的主要步驟,討論在通訊運營維護系統中如何使用這些技術為運營維護帶來幫助。

4、面向主題

操作型資料庫的資料組織面向事務處理任務,各個業務系統之間各自分離,而資料倉儲中的資料是按照一定的主題域進行組織的。主題是與傳統資料庫的面向應用相對應的,是一個抽象概念,是在較高層次上將企業資訊系統中的資料綜合、歸類並進行分析利用的抽象。每一個主題對應一個宏觀的分析領域。資料倉儲排除對於決策無用的資料,提供特定主題的簡明檢視。

資料倉儲的組成

資料抽取工具

把資料從各種各樣的儲存方式中拿出來,進行必要的轉化、整理,再存放到資料倉儲內。對各種不同資料儲存方式的存取能力是資料抽取工具的關鍵,應能生成COBOL程式、MVS作業控制語言(JCL)、UNIX指令碼、和SQL語句等,以存取不同的資料。資料轉換都包括,刪除對決策應用沒有意義的資料段;轉換到統一的資料名稱和定義;計算統計和衍生資料;給缺值資料賦給預設值;把不同的資料定義方式統一。

資料庫

是整個資料倉儲環境的核心,是資料存放的地方和提供對資料檢索的支援。相對於操縱型資料庫來說其突出的特點是對海量資料的支援和快速的檢索技術。

後設資料

後設資料是描述資料倉儲內資料的結構和建立方法的資料。可將其按用途的不同分為兩類,技術後設資料和商業後設資料。

技術後設資料是資料倉儲的設計和管理人員用於開發和日常管理資料倉儲使用的資料。包括:資料來源資訊;資料轉換的描述;資料倉儲內物件和資料結構的定義;資料清理和資料更新時用的規則;源資料到目的資料的對映;使用者存取許可權,資料備份歷史記錄,資料匯入歷史記錄,資訊釋出歷史記錄等。

商業後設資料從商業業務的角度描述了資料倉儲中的資料。包括:業務主題的描述,包含的資料、查詢、報表;

後設資料為存取資料倉儲提供了一個資訊目錄(informationdirectory),這個目錄全面描述了資料倉儲中都有什麼資料、這些資料怎麼得到的、和怎麼存取這些資料。是資料倉儲執行和維護的中心,資料倉儲伺服器利用他來存貯和更新資料,使用者通過他來了解和存取資料。

資料市集

為了特定的應用目的或應用範圍,而從資料倉儲中獨立出來的一部分資料,也可稱為部門資料或主題資料(subjectarea)。在資料倉儲的實施過程中往往可以從一個部門的資料市集著手,以後再用幾個資料市集組成一個完整的資料倉儲。需要注意的就是在實施不同的資料市集時,同一含義的欄位定義一定要相容,這樣在以後實施資料倉儲時才不會造成大麻煩。

國外知名的Garnter關於資料市集產品報告中,位於第一象限的敏捷商業智慧產品有QlikView, Tableau和SpotView,都是全記憶體計算的資料市集產品,在巨量資料方面對傳統商業智慧產品巨頭形成了挑戰。國內BI產品起步較晚,知名的敏捷型商業智慧產品有PowerBI, 永洪科技的Z-Suite,SmartBI,FineBI商業智慧軟體等,其中永洪科技的Z-Data Mart是一款熱記憶體計算的資料市集產品。國內的德昂資訊也是一家資料市集產品的系統整合商。

資料倉儲管理

安全和特權管理;跟蹤資料的更新;資料品質檢查;管理和更新後設資料;審計和報告資料倉儲的使用和狀態;刪除資料;複製、分割和分發資料;備份和恢復;儲存管理。

資訊釋出系統

把資料倉儲中的資料或其他相關的資料傳送給不同的地點或使用者。基於Web的資訊釋出系統是對付多使用者存取的最有效方法。

存取工具

為使用者存取資料倉儲提供手段。有資料查詢和報表工具;應用開發工具;管理資訊系統(EIS)工具;線上分析(OLAP)工具;資料探勘工具。

更多相關知識,請存取欄目!

以上就是資料倉儲相對於操作型資料庫來說其突出特點是什麼的詳細內容,更多請關注TW511.COM其它相關文章!