電子商務師考試內容:資料倉庫

傳統的資料庫技術是單一的資料資源,即資料庫為中心,進行從事事務處理到決策分析等各種型別的資料處理工作。近年來,隨著計算機應用,網路計算,開始向兩個不同的方向拓展,一是廣度計算,一是深度計算,廣度計算的含義是把計算機的應用範圍儘量擴大,間時實現廣泛的資料交流,網際網路就是廣度計算的特徵,另一方面就是人們對以往計算機的簡單資料操作,提出了更高的要求,希望計算機能夠更多的參與資料分析與決策的制定等領域。下面yjbys考試網小編為大家講述了電子商務師考試內容:資料倉庫,供參考。

電子商務師考試內容:資料倉庫

經過數十年的發展,在企業的資料庫中已經儲存了大量的日常業務資料,並且傳統的業務系統一般也是直接建立在這種事務處理環境上的。隨著技術的進步,人們逐漸認識到,在目前的計算機處理能力上,事物處理和分析處理具有極不相同的性質,直接使用事務處理環境來支援決策是行不通的。

事務處理環境不適宜DSS(決策支援系統)應用的原因主要有以下五條:

  (1)事務處理和分析處理的效能特性不同

在事務處理環境中,使用者的行為特點是資料的存取操作頻率高而每次操作處理的時間短;在分析處理環境中,使用者的行為模式與此完全不同,某個DSS應用程式可能需要連續幾個小時,從而消耗大量的系統資源。將具有如此不同處理效能的兩種應用放在同一個環境中執行顯然是不適當的。

  (2)資料整合問題

DSS需要整合的資料。全面而正確的資料是進行有效分析和決策的首要前提,相關資料收集得越完整,得到的結果就越可靠。當前絕大多數企業內資料的真正狀況是分散而非整合的。造成這種分散的原因有多種,主要有事務處理應用分散、“蜘蛛網”問題、資料不一致問題、外部資料和非結構化資料。

  (3)資料動態整合問題

靜態整合的最大缺點在於,如果在資料整合後資料來源中資料發生了變化,這些變化將不能反映給決策者,導致決策者使用的是過時的資料。整合資料必須以一定的週期(例如24小時)進行重新整理,顯然,事務處理系統不具備動態整合的能力。

  (4)歷史資料問題

事務處理一般只需要當前資料,在資料庫中一般也是儲存短期資料,且不同資料的儲存期限也不一樣,即使有一些歷史資料儲存下來了,也被束之高閣,未得到充分利用。但對於決策分析而言,歷史資料是相當重要的,許多分析方法必須以大量的歷史資料為依託。沒有歷史資料的詳細分析,是難以把握企業的發展趨勢的。DSS對資料在空間和時間的廣度上都有了更高的要求,而事務處理環境難以滿足這些要求。

  (5)資料的`綜合問題

在事務處理系統中積累了大量的細節資料,一般而臺,DSS並不對這些細節資料進行分析:在分析前,往往需要對細節資料進行不同程度的綜合。而事務處理系統不具備這種綜合能力,根據規範化理論,這種綜合還往往因為是一種資料冗餘而加以限制。

要提高分析和決策的效率和有效性,分析型處理及其資料必須與操作型處理及其資料相分離。因此,必須把分析型資料從事務處理環境中提取出來,按照 DSS 處理的需要進行重新組織,建立單獨的分析處理環境,資料倉庫正是為了構建這種新的分析處理環境中出現的一種資料儲存和組織技術。著名的資料倉庫專家n在其著作《Building the Data warehouse》 一書中給予如下描述:資料倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、整合的(Integrate)、相對穩定的(Non –Volatile)、反映歷史變化(Time Variant)的資料集合,用於支援管理決策。

根據資料倉庫概念的含義,資料倉庫擁有以下四個特點:

 (1)面向主題。操作型資料庫的資料組織面向事務處理任務,各個業務系統之間各自分離,而資料倉庫中的資料是按照一定的主題域進行組織。主題是一個抽象的概念,是指使用者使用資料倉庫進行決策時所關心的重點方面,一個主題通常與多個操作型資訊系統相關。

(2)整合的。面向事務處理的操作型資料庫通常與某些特定的應用相關,資料庫之間相互獨立,並且往往是異構的。而資料倉庫中的資料是在對原有分散的資料庫資料抽取、清理的基礎上經過系統加工、彙總和整理得到的,必須消除源資料中的不一致性,以保證資料倉庫內的資訊是關於整個企業的一致的全域性資訊。

(3)相對穩定的。操作型資料庫中的資料通常實時更新,資料根據需要及時發生變化。資料倉庫的資料主要供企業決策分析之用,所涉及的資料操作主要是資料查詢,一旦某個資料進人資料倉庫以後,一般情況下將被長期保留,也就是資料倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的載入、重新整理。

(4)反映歷史變化。操作型資料庫主要關心當前某一個時間段內的資料,而資料倉庫中的資料通常包含歷史資訊,系統記錄了企業從過去某一時點(如開始應用資料倉庫的時點)到月前的各個階段的資訊,通過這些資訊,可以對企業的發展歷程和未來趨勢做出定量分析和預測

整個資料倉庫系統是一個包含四個層次的體系結構。

資料來源是資料倉庫系統的基礎,是整個系統的資料來源泉。通常包括企業內部資訊和外部資訊。內部資訊包括存放於RDBMS中的各種業務處理資料和各類文件資料。外部資訊包括各類法律法規,市場資訊和競爭對手的資訊等等。

資料的儲存與管理是整個資料倉庫系統的核心。資料倉庫的真正關鍵是資料的儲存和管理。資料倉庫的組織管理方式決定了它有別於傳統資料庫。同時也決定了其對外部資料的表現形式。要決定採用什麼產品和技術來建立資料倉庫的核心,則需要從資料倉庫的技術特點著手分析。針對現有各業務系統的資料,進行抽取、清理,並有效整合,按照主題進行組織。資料倉庫按照資料的覆蓋範圍可以分為企業級資料倉庫和部門級資料倉庫(通常稱為資料集市)。

OLAP伺服器:對分析需要的資料進行有效整合。按多維模型予以組織,以便進行多角度、多層次的分析,並發現趨勢。其具體實現可以分為:ROLAP、MOLAP和HOLAP。ROLAP基本資料和聚合資料均存放在RDBMS之中; MOLAP基本資料和聚合資料均存放於多維資料庫中;HOLAP基本資料存放於RDBMS之中,聚合資料存放於多維資料庫中。

前端工具主要包括各種報表工具、查詢、資料分析工具、資料探勘工具以及各種基於資料倉庫或資料集市的應用開發工具。其中資料分析工具主要針對OLAP伺服器,報表工具、資料探勘工具主要針對資料倉庫。

資料倉庫組織和管理資料的方法與普通資料庫不同。主要表現在三個方面: