計算機四級數據庫數據模型考點

引導語:數據模型(DataModel)是數據特徵的抽象,是數據庫管理的教學形式框架。以下是本站小編分享給大家的計算機四級數據庫數據模型考點,歡迎閱讀!

計算機四級數據庫數據模型考點

一、數據模型

 1.數據模型的三要素

(1)數據結構 數據結構是所研究的對象類型(Object Type)的集合。這些對象和對象類型是數據庫的組成成分。一般可分爲兩類:一類是與數據類型、內容和其它性質有關的對象;一類是與數據之間的聯繫有關的對象。前者如網狀模型中的數據項和記錄,關係模型中的域、屬性和關係等。後者如網狀模型中的關係模型(set type)。在數據庫領域中,通常按照數據結構的類型來命名數據模型,進而對數據庫管理系統進行分類。如層次結構、網狀結構和關係結構的數據模型分別稱作爲層次模型、網狀模型和關係模型。相應地,數據庫分別稱作爲層次數據庫、網狀數據庫和關係數據庫。

(2)數據操作 數據操作是指對各種對象類型的實例(或值)所允許執行的操作的集合,包括操作及有關的操作規則。在數據庫中,主要的操作有檢索和更新(包括插入、刪除、修改)兩大類。數據模型定義了這些操作的定義、語法(即使用這些操作時所用的語言)。數據結構是對系統靜態特性的描述,而數據操作是對系統動態特性的描述。兩者既有聯繫,又有區別。

(3)數據的約束條件 數據的約束條件是完整性規則的集合。完整性規則是指在給定的數據模型中,數據及其聯繫所具有的制約條件和依存條件,用以限制符合數據模型的數據庫的狀態以及狀態的變化,確保數據的正確性、有效性和一致性。

 2.概念模型

數據模型是數據庫系統的核心和基礎。每個DBMS軟件都是基於某種數據模型的。爲了把現實世界中的具體事物或事物之間的聯繫表示成DBMS所支持的數據模型,人們首先必須將現實世界的事物及其之間的聯繫進行抽象,轉換爲信息世界的概念模型;然後將信息世界的概念模型轉換爲機器世界的數據模型。也就是說,首先把現實世界中的客觀對象抽象成一種信息結構。這種信息結構並不依賴於具體的計算機系統和DBMS。然後,再把概念模型轉換爲某一計算機系統上某一DBMS所支持的數據模型。因此,概念模型是從現實世界到機器世界的一箇中間層次。現實世界的事物反映到人的大腦之中,然後人們開始認識這些事物,經過選擇、命名、分類和組織等抽象工作之後形成概念模型,並進入到信息世界。

•用戶(user) 關心的是現實世界中的事物、事物的屬性及其相互關係。例如,用戶可能關心他的顧客及其屬性,如顧客地址、銀行帳號等等。用戶也關心自己的定貨帳目,如誰訂的貨、訂的什麼和訂多少等等。

•系統分析員(analyst) 同樣也關心現實世界,但是系統分析員需要分析用戶的信息需求。作爲需求分析的結果,分析員必須以文檔的形式對需求進行結構化的描述;這個文檔就是信息模型。

•實體(Entity) 實體是構成數據庫的基本元素。實體是指一個存在的東西以區別這個東西所具有的屬性和這個東西與其它東西的聯繫。實體可以是人,也可以是物;可以是實際對象,也可以是概念;可以是事物本身,也可以是指事物之間的聯繫。

•屬性(Attribute) 一個實體可以由若干個屬性來刻畫。屬性是相對實體而言的,是實體所具有的特性。

•關鍵字(Key) 能唯一地標識實體的屬性的集合稱爲關鍵字(或碼)。

•域(Domain) 屬性的取值範圍稱作域。

•實體型(Entity Type) 一類實體所具有的共同特徵或屬性的集合稱爲實體型。一般用實體名及其屬性來抽象地刻畫一類實體的實體型。

•實體集(Entity Set) 同型實體的集合叫實體集。例如,學生就是一個實體集。實體集的名即是實體型。對於學生和(學號,姓名,年齡,系,年級)均是實體型,而學生是對實體型(學號,姓名,年齡,系,年級)所起的名稱,兩者是指同一客觀對象。但本科生和研究生可以爲相同實體型,而實體集不同。

•聯繫(Relationship) 現實世界的事物之間是有聯繫的。一般存在兩類聯繫:一是實體內部的組成實體的屬性之間的聯繫,二是實體之間的聯繫。在考慮實體內部的聯繫時,是把屬性看作爲實體。一般來說,兩個實體之間的聯繫可分爲三種:

(1)一對一(1∶1)聯繫 若對於實體集A中的每一個實體,實體集B中至多有唯一的一個實體與之聯繫,反之亦然,則稱實體集A與實體集B具有一對一聯繫,記作1∶1。

(2)一對多(1∶n)聯繫 若對於實體集A中的每個實體,實體集B中有n個實體(n≥0)與之聯繫;反之,對於實體集B中的每一個實體,實體集A中至多隻有一個實體與之聯繫,則稱實體集A與實體集B有一對多聯繫,記爲1∶n。相應地有多對一(n∶1)聯繫 多對一聯繫,從本質上說,是一對多聯繫的逆轉。其定義同一對多聯繫類似,不再贅述。

(3)多對多(m∶n)聯繫 若對於實體集A中的每一個實體,實體集B中有n個實體(n≥0)與之聯繫;反之,對於實體集B中的每一個實體,實體集A中也有m個實體(m≥0)與之對應,則稱實體集A與實體集B具有多對多聯繫,記作m∶n。實質上,多對多聯繫是任意一種聯繫。另外,同一實體集內的各個實體間也可以有各種聯繫。概念模型的表示方法最常用的是實體一聯繫方法(Entity-Relationship Approach),簡稱E-R方法。該方法是由在1976年提出的。E-R方法用E-R圖來描述某一組織的概念模型。在這裏僅介紹E-R圖的要點。在E-R圖中:

(1)長方形框表示實體集,框內寫上實體型的名稱。

(2)用橢圓框表示實體的屬性,並用有向邊把實體框及其屬性框連接起來。

(3)用菱形框表示實體間的聯繫,框內寫上聯繫名,用無向邊把菱形框及其有關的實體框連接起來,在旁邊標明聯繫的種類。如果聯繫也具有屬性,則把屬性框和菱形框也用無向邊連接上。

 3.三種主要的數據模型

實際DBMS所支持的數據模型主要有三種:

•層次模型(Hierarchical Model)

•網狀模型(Network Model)

•關係模型(Relational Model)其中,關係模型是當前DBMS所支持的數據模型的主流。90年代運行的DBMS幾乎都是基於關係模型的。層次模型和網狀模型統稱爲非關係模型。非關係模型的結構可以和圖論中的圖相對應,比較直觀,但在理論上不完備,實現效率較低,故此目前很少用。但是最近,層次模型在研究面向對象的DBMS中已得到重視。在關係模型中,數據在用戶的觀點中(或在用戶視圖中)的邏輯結構是一張二維表(Table)。

•關係(Relation),對應於平常講的一張表。

•元組(Tuple),表中的一行。

•屬性(Attribute),表中的一列稱爲一個屬性,給每一列起一個名,稱爲屬性名。這一列或這個屬性所有可能取的值的集合稱爲這個屬性的值域(Domain),值域中的一個元素叫做這個屬性的值。

•主關鍵字(Primary Key Attribute或Primary Key),是指能唯一標識一個元組的一個或一組屬性。

•分量(Attribute value),是指元組中的一個屬性值。

•關係模式(Relational Schema),是對關係的描述,一般用關係名(屬性名1,屬性名2,…,屬性名n)來表示。同層次模型和網狀模型相比較,關係模型具有下列特點:

(1)概念單一 在關係模型中,無論是實體還是實體之間的聯繫都用關係來表示。在關係模型中,在用戶的觀點中,數據的邏輯結構就是表,也只有這唯一的概念。在非關係模型中,用戶要區分記錄型與記錄型之間的聯繫兩個概念;當環境複雜時,數據結構異常複雜,難以掌握。而關係模型,由於概念單一,可以變複雜爲直觀、簡單,易學易用。

(2)規範化 所謂關係規範化是指在關係模型中,每一個關係都要滿足一定的條件要求。這些條件被稱爲規範條件。對於關係,一個最基本的規範條件是,要求關係中的每一個屬性(或分量)均是不可分的數據項;也就是說不允許表中有表,表是不可嵌套的。

(3)在關係模型中,用戶對數據的操作的輸入和輸出都是表,也就是說,用戶通過操作舊錶而得到一張新表。總之,關係模型概念簡單,結構清晰,用戶易學易用,有嚴格的以數學爲基礎的關係理論作指導,便於DBMS的實現。基於關係的DBMS簡化了應用程序員的工作,便於數據庫應用系統的設計和維護。故此,關係模型自誕生以後就得到了迅速的發展,成爲應用最爲廣泛的、唯一的數據模型。

 二、數據庫系統的結構

1.數據庫系統的三級模式結構

數據庫管理系統的三級模式結構由外模式、模式和內模式組成。外模式(external schema),或子模式(subschema)或用戶模式(user schema),是指數據庫用戶所看到的數據結構,是用戶看到的數據視圖。模式(schema)或邏輯模式(logic schema),是數據庫中對全體數據的邏輯結構和特性的描述,是所有用戶所見到的數據視圖的總和。外模式是模式的一部分。內模式(internal schema),或存儲模式(storage schema),或物理模式(physical schema),是指數據在數據庫系統內的存儲介質上的表示,即對數據的物理結構和存取方式的描述。模式描述的'是數據的全局的邏輯結構,決定了DBMS的功能。外模式涉及的僅是局部的邏輯結構,是模式的子集,是對模式的調用。數據庫系統的三級模式是對數據進行三個層次抽象的工具。通過三級模式,把對數據的具體組織留給DBMS來完成,使得用戶能在高層次上處理數據的邏輯結構,而不必關心數據的物理結構。爲了實現這三個層次這間的聯繫,DBMS在溝通三級模式中提供了兩個映象:外模式-模式映象模式-內模式映象

(1)模式 模式規定了數據庫中全部數據的一個邏輯表示或描述形式。模式既不同於內模式,也不同於外模式。它比內模式抽象,不涉及數據的物理結構和存儲介質。它與具體的應用程序或高級語言無關。

(2)外模式 外模式是個別用戶的數據視圖,即與某一應用有關的數據的邏輯表示。

(3)內模式 內模式是全部數據庫的內部表示或底層描述,是用來定義數據的物理結構和存取方式的。

(4)二級映象 對於同一個模式,可以有任意多個外模式。外模式-模式的映象定義了某個外模式和模式之間的對應關係。這些映象的定義通常包含在各自的外模式中。當模式改變時,外模式-模式的映象要做相應的改變,以保證外模式的不變性。這是數據庫管理員(DBA)的責任。模式-內模式的映象定義了數據邏輯結構和存儲結構之間的對應關係。例如,字段的內部表示等。當數據庫的存儲結構改變時,模式-內模式的映象也須做相應的修改,以使得模式保持不變性。這仍是DBA的責任。正是由於上述二級映象的功能及其自動實現,使得數據庫系統中的數據具有較高的邏輯獨立性和物理獨立性,從而大大地方便了用戶的使用。

(5)概念模式與模式ANSI研究組於1975年2月提出一個臨時報告。1978年提出一個最終報告,稱之爲ANˉSI/SPARC報告,簡稱爲SPARC報告。SPARC報告中指出,數據庫管理系統應具有三級模式的結構,即概念模式、外模式和內模式。其中外模式和內模多與上面所講的大致相當。但SPARC報告中的概念模式是指一個組織或部門所對應的現實世界的真實模型,即概念模型。概念模式僅描述實體及其屬性和聯繫,不涉及機器世界的概念。概念模型是信息世界範疇內的信息的結構,而模式是機器世界範疇內的概念模型的邏輯表示。概念模型獨立於具體的計算機系統,甚至是和計算機無關的,是一個組織或部門的模型。常用的描述概念模式的方法是E-R方法。模式是依賴於具體的計算機及其DBMS的。模式通過三種具體模型:層次模型、網狀模型和關係模型來加以實現。概念模式必須轉換成具體的數據模型,然後才能在相應的DBMS上實現。概念模型和模式都是描述信息或數據的整體結構的,然而它們是在不同的抽象層次上加以描述的。概念模型離機器更遠,形式化程度低。從遠離機器的觀點看,概念模型更抽象些,但更接近現實世界。而模式描述使用的是形式化的語言-模式DDL,而概念模型描述使用的是E-R圖和一些自然語言。

 2.使用數據庫的計算機系統結構

廣義地講,實際上使用數據庫的計算機系統由下列幾個部分組成的:

(1)硬件部分 包括主機、外部存儲設備、網絡設備和電源等。

(2)軟件部分 包括操作系統、DBMS、編譯系統和應用開發工具軟件等。

(3)人員 包括數據庫管理員(Data Base Administrator-DBA),系統分析員(System Anaˉlyst)、應用程序員(Application Programmer)和用戶(User)。

3.數據庫管理系統

數據庫管理系統DBMS是數據庫系統的核心。DBMS是負責數據庫的建立、使用和維護的軟件。DBMS建立在操作系統之上,實施對數據庫的統一管理和控制。用戶使用的各種數據庫命令以及應用程序的執行,最終都必須通過DBMS。另外,DBMS還承擔着數據庫的安全保護工作,按照DBA所規定的要求,保證數據庫的完整性和安全性。DBMS的主要功能包括以下幾個主要方面:

(1)數據庫的定義功能 DBMS通過提供數據描述語言(也稱數據定義語言)(Data Descripˉtive Language———DDL)來對外模式、模式和內模式加以描述。然後模式翻譯程序把用DDL寫的各種模式的定義源碼翻譯成相應的內部表示,形成相應的目標形式,分別叫目標外模式、目標模式、目標內模式,這些目標模式是對數據庫的描述,而不是數據本身。(目標)模式只刻畫了數據庫的形式或框架,而不包括數據庫的內容。這些目標模式被保存在數據字典(或系統目標)之中,作爲DBMS存取和管理數據的基本依據。例如,DBMS根據這些模式定義,進行物理結構和邏輯結構的映象,進行邏輯結構和用戶視圖的映象,以導出用戶要檢索的數據的存取方式。

(2)數據操縱功能 DBMS提供數據操縱語言(Data Manipulation Language———DML)實現對數據庫中數據的一些基本操作,如:檢索、插入、修改、刪除和排序等等。DML有兩類:一類是嵌入主語言的,如嵌入到C或COBOL等高級語言中。這類DML語言本身不能單獨使用,故此稱爲宿主型的DML或嵌入式DML。另一類是非嵌入式語言(包括交互式命令語言和結構化語言),它的語法簡單,可以獨立使用,由單獨的解釋或編譯系統來執行,所以一般稱爲自主型或自含型的DML。命令語言是行結構語言,單條執行。結構化語言是命令語言的擴充或發展,增加了程序結構描述或過程控制功能,如循環、分支等功能。命令語言一般逐條解釋執行。結構化語言可以解釋執行,也可以編譯執行。現在DBMS一般均提供命令語言的交互式環境和結構環境兩種運行方式,供用戶選擇。DBMS控制和執行DML語句(或DML程序),完成對數據庫的操作。對於自主型的結構化的DML,DBMS通常採用解釋執行的方法,但也有編譯執行的方法,而且編譯執行的越來越多。另外,很多系統同時設有解釋和編譯兩種功能,由用戶選其一。對於嵌入型或縮主型DML,DBMS一種提供兩種方法:

①預編譯方法。

②修改和擴充主語言編譯程序(亦稱增強編譯方法)。預編譯方法是,由DBMS提供一個預處理程序,對源程序進行語法掃描,識別出DML語句,並把這些語句轉換成主語言中的特殊調用語句。主語言必須和DML有調用接口。這樣在連接形成目標時和主語言語句一起形成可執行的目標。

(3)數據庫運行管理 數據庫運行期間的動態管理是DBMS的核心部分,包括併發控制、存取控制(或安全性檢查、完整性約束條件的檢查)、數據庫內部的維護(如索引、數據字典的自動維護等)、緩衝區大小的設置等等。所有的數據庫操作都是在這個控制部分的統一管理下,協同工作,以確保事務處理的正常運行,保證數據庫的正確性、安全性和有效性。

(4)數據庫的建立和維護功能 數據庫的建立和維護包括初始數據的裝入、數據庫的轉儲或後備功能、數據庫恢復功能、數據庫的重組織功能和性能分析等功能,這些功能一般都由各自對應的實用功能子程序來完成。DBMS隨軟件產品和版本不同而有所差異。通常大型機上的DBMS功能最全,小型機上的DBMS功能稍弱點,微機上的DBMS更弱些。但是,目前,由於硬件性能和價格的改進,微機上的DBMS功能越來越全。