初級經濟師重點知識:數據倉庫與數據挖掘
導語:數據倉庫可簡稱爲DW或DWH,是決策支持系統(dss)和聯機分析應用數據源的結構化數據環境。下面是本站小編整理的考試內容,大家一起來看看吧。
數據倉庫與數據挖掘
1.數據倉庫數據倉庫(Data Warehouse,DW)是一種新的數據庫應用技術。數據倉庫是一個面向主題的集成的相對穩定的隨時間不斷變化的數據集合。數據倉庫中的數據來源於其他數據庫,是對多個不同的業務數據庫進行有效集成後按主題進行重組。
與傳統的操作型數據庫相比,數據倉庫具有以下特點。
(1)面向主題。
操作型數據庫的數據組織面向事務處理任務,各個業務系統之間各自分離,而數據倉庫中的數據是按照一定的主題域進行組織。面向主題的數據組織方式,就是在較高層次上,將企業相關業務數據庫中的數據進行綜合、分類,並進行分析和抽象,形成一個完整統一的.描述。
(2)數據集成。
數據倉庫的集成性是指從原來分散的數據庫中抽取的數據在進入數據倉庫之前,必須經過系統加工、彙總和整理,以消除源數據在表達上和含義上的不一致性,保證數據倉庫中的信息是關於整個企業的一致的全局信息。
(3)數據相對穩定。
數據倉庫的數據主要供企業決策分析之用,所涉及的數據操作主要是數據查詢。數據的穩定性是指一旦某個數據進人數據倉庫以後,一般情況下將被長期保留,最終用戶只能通過分析工具進行查詢、分析,但不能修改和刪除其中的數據,通常只需要定期的加載、刷新。
(4)數據隨時間變化。
數據倉庫中的數據通常包含歷史信息,系統記錄了企業從過去某一時點到目前的各個階段的信息,通過這些信息,可以對企業的發展歷程和未來趙勢做出定量分析和預測,數據倉庫隨着時間的變化不斷增加新的數據內容;隨着時間的變化,數據以更高的層次被不斷綜合,以適應趨勢分析的要求。
相關文章
-
2015計算機四級數據庫複習重點:數據庫概念設計及數據建模
概念設計過程1、 概念設計的依據:是需求分析階段的文檔,通過對這些文檔的'分析理解,構造出信息模型,編寫數據庫概念設計說明書,信息模型和數據庫概念設計說明書是數據庫邏輯設計的依據;2、 概念設計的基本步驟:(1) 確定實 -
2015年計算機四級《數據庫工程師》複習重點:數據庫系統
1數據庫系統體系結構1、 數據庫系統體系結構:是指數據庫系統的組成構件、各構件的功能及各構件間的協同工作方式;2、 分類:(1) 集中式:全部數據和數據管理功能均集中在一臺計算機上的數據庫系統;包括單用戶和主從式兩 -
2015年計算機四級《數據庫工程師》複習重點:數據庫基本概念
1 信息與數據1、 信息、物質、能量是組成客觀世界並促進社會發展的三大基本要素;2、 信息(Information)--是客觀世界事物的存在方式和運動狀態的反映,是對事物之間相互聯繫、相互作用的描述。信息具有可感知、可存儲 -
2015計算機四級《數據庫工程師》複習重點:數據庫的物理結構
1、 數據庫中的應用數據是以文件形式存儲在外存上的,文件在邏輯上被組織成記錄的序列,即每個DB文件可看作是邏輯記錄的`集合;2、 一個文件在磁盤上佔有一定的物理存儲空間,文件中的每個邏輯記錄被映射存儲到某個特定的磁 -
計算機四級考試《數據庫工程師》知識:關係數據庫基本概念
1 關係模型1、 關係模型採用一個二維表格在計算機中組織、存儲、處理和管理數據。(1) 關係名(數據庫名):由字母數字組成;(2) 屬性名;(3) 關係模式和關係:描述模式描述關係的靜態結構,由模式名、關係模式所包含的屬性及 -
2015計算機四級《數據庫工程師》複習重點:數據庫的運行和維護
數據庫的試運行1、 應用程序調試完成並已有一小部分數據入庫,就可以開始數據庫的試運行,也稱聯合調試;2、 試運行十分重要,因爲:(1) 檢測應用程序在接近真實的環境中運行是否符合設計要求;(2) 檢測系統設計的性能和評 -
計算機四級考試《數據庫工程師》知識:數據庫概念設計
1 數據庫概念設計的任務1、 定義和描述應用領域涉及的數據範圍;2、 獲取應用領域或問題域的信息模型;3、 描述清楚數據的屬性特徵;4、 描述清楚數據之間的關係;5、 定義和描述數據的約束;6、 說明數據的安全性要求; -
計算機二級《MySQL》知識點:將數據裝入數據庫表
2017年9月計算機二級考試將於9月23日開考,爲了使廣大考生在備戰時更快的掌握相應知識點,本文是本站小編搜索整理的關於計算機二級《MySQL》知識點:將數據裝入數據庫表,供參考借鑑,預祝考生們考出自己理想的成績!想了解更多 -
2015計算機四級《數據庫工程師》複習重點:數據庫事務概要設計
1、 如數據處理需求分析的結果是數據流圖,則可將待設計的事務看作是程序,採用軟件工程中面向數據流的程序設計方法,設計事務內部的數據處理流程和結構,也就是設計事務處理邏輯,過程包括:(1) 從數據流圖中識別出該事務對應的 -
計算機四級考試《數據庫工程師》重點知識:函數依賴
1、 函數依賴:(1) 設R(U)爲一關係模式,X和Y爲屬性全集U的子集,若對於R(U)的任意一個可能的關係r,r中不可能存在兩個元組在X上的屬性值相等,而在Y上的屬性值不等,則稱X函數決定Y或Y函數依賴於X,並記作XY,其中X稱爲決定因素,因