樹分類器

[拼音]:guanxi shujuku

[英文]:relational data base

採用關係模型的資料庫,有時也指關係資料庫系統。關係資料模型是1970年E.F.科德提出的。隨後,他對關係代數、關係演算和關係規範化理論等方面的發展作出了重要貢獻,併為關係資料庫系統的理論和實踐奠定了基礎。

關係模型

給定一組域(域是值的集合)D1,D2,…,Dn(這組域中可以有相同域),則其笛卡爾乘積D1×D2×…×Dn的子集可以構成一張二維表,稱為一個關係。n為關係的目或度。表的每一行稱為一個元組;表的每一列是同類型的資料。表的列必須具有唯一性的名字,稱為屬性名。一個元組中的某一屬性值稱為一個分量。關係模型中關係的每一個分量,必須是不可分的資料項。

關係模式用於描述關係。它是一個五元組〈R,U,D,DOM,F〉。其中,R為關係名;U為屬性集合;它們來自一組域D;DOM為屬性到域的對映;F為一組資料相關,是一類完整性約束條件。某一時刻一個關係模式的例項稱為關係狀態,簡稱關係。關係模型的操作部分具有關係處理能力。它把整個關係作為操作物件。具有關係處理能力的關係資料語言,可分為關係代數、關係演算和介於兩者之間的語言。一般以關係代數作為度量語言處理功能的標準。關係代數除提供傳統的集合運算如並、交、差運算外,還提供了選擇(SELECT)、投影(PROJECT)、連線(JOIN)等操作。

如果由關係代數的選擇、投影、連線操作表達的任何查詢均能為某種語言表達,而不必使用迭代、遞迴命令,則可認為該語言具有關係處理能力。

關係資料庫管理系統

關係資料庫的管理系統有三個必要條件:

(1)資料庫中的全部資訊均用二維表表示;

(2)在這些表之間不存在使用者可見的導航鏈;

(3)具有關係處理能力的資料語言。滿足以上三個條件的資料庫管理系統稱為最小關係系統。不具備第三個條件的資料庫管理系統稱為表系統或半關係系統。如果一個數據庫管理系統還滿足另外兩個條件:

(1)支援全部的關係代數操作;

(2)支援關係模型的兩個完整性規則(實體完整性和實體間參照完整性),則稱為全關係系統。

按資料語言的特徵,關係資料庫管理系統又可分為一致性關係系統和非一致性關係系統。一致性關係系統的資料語言,既可以終端互動方式使用,又可以嵌入宿主語言,用編寫應用程式的方式使用,否則就稱為非一致性關係系統。

關係資料理論

研究關係模型中資料相關和規範化的理論。資料相關是關係模型中描述資料之間聯絡的一類完整性約束條件,通常通過資料之間值的相等與否來體現。資料相關包括函式相關、多值相關、互連相關和連線相關等,最常用的是前兩種。

關係資料理論的研究以關係模型為背景。由於關係模型可以等價地轉換為其他資料模型,關係資料理論的研究具有普遍意義。關係資料理論中資料相關的理論,用明確的概念來描述和分析資料模型中資料關聯這一類特殊的完整性約束。這是形式語義的一種方法,規範化的概念和正規化的定義給出了判別模式好壞的準則,使資料庫設計有了評價模式的理論依據。模式分解的概念和演算法,又為資料庫設計提供了輔助設計的工具。關係資料理論不僅是資料庫的理論基礎,而且是資料庫設計的指南和工具。

資料相關是語義範疇的概念。但是,為了形式推理的需要,這些資料相關都有嚴格的形式定義。例如,R(U)是屬性集 U上的一個關係模式,X、Y是 U的子集。對於R(U)的任何一個可能的關係r,若r中不可能有兩個元組在X中屬性值相等而在Y中的屬性值不等,則稱X函式決定Y或Y函式相關X,記作X→Y。

在R(U)的任何一個關係r中,若存在元組t、s∈r,使t[X]=s[X],則必存在元組ω、v∈r,使得ω[X]=v[X]=t[X],ω[Y]=t[Y],ω[Z]=s[Z],v[Y]=s[Y],v[Z]=t[Z]成立。式中X,Y是U的子集,Z=U-X-Y。則稱Y多值相關於X,記為X→Y。

利用數學和演算法作為工具,對資料相關的研究已得到了函式相關範圍內的一組完備而有效的推理規則──阿姆斯特朗公理系統,以及函式相關與多值相關範圍內的一組完備而有效的推理規則。

如果關係模式所對應的關係中,每一分量是不可分的資料項,則稱此關係模式滿足第一正規化(1NF)。第一正規化的關係模式可能存在插入、刪除、更新異常和資料冗餘等缺點。這類缺點是由於關係模式中存在不合適的資料相關造成的。人們按照屬性間資料相關的性質,衡量關係模式的規範化程度,滿足不同條件的關係模式屬於不同的正規化。規範化和正規化的概念是E.F.科德於1971至1972年提出的,他在函式相關範圍內給出了第一正規化至第三正規化(3NF)的定義。1974年,E.F.科德等提出了修正的第三正規化即BC正規化(BCNF)。1976年,F.法金又在函式相關和多值相關範圍內提出了第四正規化 (4NF)。後又有人在連線相關的範圍內提出了第五正規化 (5NF)的概念。正規化越高關係模式的規範化程度越高。把低一級正規化的關係模式轉換為高一級正規化關係模式的過程稱為規範化過程。規範化過程就是逐步消除不合適的資料相關的過程。這個過程如下:

規範化的方法通常用投影分解法。這種分解結果不是唯一的。關於分解後的關係模式與原模式“等價”的討論產生了不同分解準則下的分解演算法(即分解法和合成法)。這些準則是:

(1)分解具有無損連線性;

(2)分解保持函式相關;

(3)分解既要有無損連線性又要保持函式相關。按準則①用分解法分解後的模式一定可達到5NF;按準則②或③用合成法分解後的模式一定可達到3NF,但不一定能達到更高的正規化。

參考書目

薩師煊、王珊:《資料庫系統概論》,高等教育出版社,北京,1984。

參考文章

什麼是關係資料庫系統?自動化