SQL關(guān)系模型的知識梳理總結(jié)
關(guān)系模型
關(guān)系數(shù)據(jù)庫是建立在關(guān)系模型上的。而關(guān)系模型本質(zhì)上就是若干個存儲數(shù)據(jù)的二維表,可以把它們看作很多Excel表。
表的每一行稱為記錄(Record),記錄是一個邏輯意義上的數(shù)據(jù)。
表的每一列稱為字段(Column),同一個表的每一行記錄都擁有相同的若干字段。
字段定義了數(shù)據(jù)類型(整型、浮點(diǎn)型、字符串、日期等),以及是否允許為NULL
。注意NULL
表示字段數(shù)據(jù)不存在。一個整型字段如果為NULL
不表示它的值為0,同樣的,一個字符串型字段為NULL
也不表示它的值為空串''
。
通常情況下,字段應(yīng)該避免允許為NULL。不允許為NULL可以簡化查詢條件,加快查詢速度,也利于應(yīng)用程序讀取數(shù)據(jù)后無需判斷是否為NULL。
和Excel表有所不同的是,關(guān)系數(shù)據(jù)庫的表和表之間需要建立“一對多”,“多對一”和“一對一”的關(guān)系,這樣才能夠按照應(yīng)用程序的邏輯來組織和存儲數(shù)據(jù)。
在關(guān)系數(shù)據(jù)庫中,關(guān)系是通過主鍵和外鍵來維護(hù)的。
主鍵
例如,假設(shè)我們把name
字段作為主鍵,那么通過名字小明或小紅就能唯一確定一條記錄。但是,這么設(shè)定,就沒法存儲同名的同學(xué)了,因?yàn)椴迦胂嗤麈I的兩條記錄是不被允許的。
對主鍵的要求,最關(guān)鍵的一點(diǎn)是:記錄一旦插入到表中,主鍵最好不要再修改,因?yàn)橹麈I是用來唯一定位記錄的,修改了主鍵,會造成一系列的影響。
由于主鍵的作用十分重要,如何選取主鍵會對業(yè)務(wù)開發(fā)產(chǎn)生重要影響。如果我們以學(xué)生的身份證號作為主鍵,似乎能唯一定位記錄。然而,身份證號也是一種業(yè)務(wù)場景,如果身份證號升位了,或者需要變更,作為主鍵,不得不修改的時(shí)候,就會對業(yè)務(wù)產(chǎn)生嚴(yán)重影響。
所以,選取主鍵的一個基本原則是:不使用任何業(yè)務(wù)相關(guān)的字段作為主鍵。
因此,身份證號、手機(jī)號、郵箱地址這些看上去可以唯一的字段,均不可用作主鍵。
作為主鍵最好是完全業(yè)務(wù)無關(guān)的字段,我們一般把這個字段命名為id
。
外鍵
一對多
當(dāng)我們用主鍵唯一標(biāo)識記錄時(shí),我們就可以在students
表中確定任意一個學(xué)生的記錄:
id | name | other columns… |
---|---|---|
1 | 小明 | … |
2 | 小紅 | … |
我們還可以在classes
表中確定任意一個班級記錄:
id | name | other columns… |
---|---|---|
1 | 一班 | … |
2 | 二班 | … |
但是我們?nèi)绾未_定students
表的一條記錄,例如,id=1
的小明,屬于哪個班級呢?
由于一個班級可以有多個學(xué)生,在關(guān)系模型中,這兩個表的關(guān)系可以稱為“一對多”,即一個classes
的記錄可以對應(yīng)多個students
表的記錄。
為了表達(dá)這種一對多的關(guān)系,我們需要在students
表中加入一列class_id
,讓它的值與classes
表的某條記錄相對應(yīng):
id | class_id | name | other columns… |
---|---|---|---|
1 | 1 | 小明 | … |
2 | 1 | 小紅 | … |
5 | 2 | 小白 | … |
這樣,我們就可以根據(jù)class_id
這個列直接定位出一個students
表的記錄應(yīng)該對應(yīng)到classes
的哪條記錄。
例如:
小明的class_id
是1
,因此,對應(yīng)的classes
表的記錄是id=1
的一班;小紅的class_id
是1
,因此,對應(yīng)的classes
表的記錄是id=1
的一班;小白的class_id
是2
,因此,對應(yīng)的classes
表的記錄是id=2
的二班。
在students
表中,通過class_id
的字段,可以把數(shù)據(jù)與另一張表關(guān)聯(lián)起來,這種列稱為外鍵。
外鍵并不是通過列名實(shí)現(xiàn)的,而是通過定義外鍵約束實(shí)現(xiàn)的:
ALTER TABLE students ADD CONSTRAINT fk_class_id FOREIGN KEY (class_id) REFERENCES classes(id)
其中,外鍵約束的名稱fk_class_id
可以任意,FOREIGN KEY (class_id)
指定了class_id
作為外鍵,REFERENCES classes (id)
指定了這個外鍵將關(guān)聯(lián)到classes
表的id
列(即classes
表的主鍵)。
通過定義外鍵約束,關(guān)系數(shù)據(jù)庫可以保證無法插入無效的數(shù)據(jù)。**即如果classes
表不存在id=99
的記錄,students
表就無法插入class_id=99
的記錄。
由于外鍵約束會降低數(shù)據(jù)庫的性能,大部分互聯(lián)網(wǎng)應(yīng)用程序?yàn)榱俗非笏俣龋⒉辉O(shè)置外鍵約束,而是僅靠應(yīng)用程序自身來保證邏輯的正確性。這種情況下,class_id
僅僅是一個普通的列,只是它起到了外鍵的作用而已。
要刪除一個外鍵約束,也是通過ALTER TABLE
實(shí)現(xiàn)的:
ALTER TABLE students DROP FOREIGN KEY fk_class_id
注意:刪除外鍵約束并沒有刪除外鍵這一列。刪除列是通過DROP COLUMN ...實(shí)現(xiàn)的。
多對多
通過一個表的外鍵關(guān)聯(lián)到另一個表,我們可以定義出一對多關(guān)系。有些時(shí)候,還需要定義“多對多”關(guān)系。例如,一個老師可以對應(yīng)多個班級,一個班級也可以對應(yīng)多個老師,因此,班級表和老師表存在多對多關(guān)系。
多對多關(guān)系實(shí)際上是通過兩個一對多關(guān)系實(shí)現(xiàn)的,即通過一個中間表,關(guān)聯(lián)兩個一對多關(guān)系,就形成了多對多關(guān)系
一對一
一對一關(guān)系是指,一個表的記錄對應(yīng)到另一個表的唯一一個記錄。
細(xì)心的話會發(fā)現(xiàn),既然是一對一關(guān)系,那為啥不給students
表增加一個mobile
列,這樣就能合二為一了?
如果業(yè)務(wù)允許,完全可以把兩個表合為一個表。但是,有些時(shí)候,如果某個學(xué)生沒有手機(jī)號,那么,contacts
表就不存在對應(yīng)的記錄。實(shí)際上,一對一關(guān)系準(zhǔn)確地說,是contacts
表一對一對應(yīng)students
表。
還有一些應(yīng)用會把一個大表拆成兩個一對一的表,目的是把經(jīng)常讀取和不經(jīng)常讀取的字段分開,以獲得更高的性能。例如,把一個大的用戶表分拆為用戶基本信息表user_info
和用戶詳細(xì)信息表user_profiles
,大部分時(shí)候,只需要查詢user_info
表,并不需要查詢user_profiles
表,這樣就提高了查詢速度。
總結(jié):關(guān)系數(shù)據(jù)庫通過外鍵可以實(shí)現(xiàn)一對多、多對多和一對一的關(guān)系。外鍵既可以通過數(shù)據(jù)庫來約束,也可以不設(shè)置約束,僅依靠應(yīng)用程序的邏輯來保證。
索引
索引的概念與用法
在關(guān)系數(shù)據(jù)庫中,如果有上萬甚至上億條記錄,在查找記錄的時(shí)候,想要獲得非常快的速度,就需要使用索引。
索引是關(guān)系數(shù)據(jù)庫中對某一列或多個列的值進(jìn)行預(yù)排序的數(shù)據(jù)結(jié)構(gòu)。**通過使用索引,可以讓數(shù)據(jù)庫系統(tǒng)不必掃描整個表,而是直接定位到符合條件的記錄,這樣就大大加快了查詢速度。
例如,對于students
表:
id | class_id | name | gender | score |
---|---|---|---|---|
1 | 1 | 小明 | M | 90 |
2 | 1 | 小紅 | F | 95 |
3 | 1 | 小軍 | M | 88 |
如果要經(jīng)常根據(jù)score
列進(jìn)行查詢,就可以對score
列創(chuàng)建索引:
ALTER TABLE students ADD INDEX idx_score(score);
使用ADD INDEX idx_score (score)就創(chuàng)建了一個名稱為idx_score,使用列score的索引。
索引名稱是任意的,索引如果有多列,可以在括號里依次寫上。
ALTER TABLE students ADD INDEX idx_name_score (name, score);
索引的效率取決于索引列的值是否散列,即該列的值如果越互不相同,那么索引效率越高。**反過來,如果記錄的列存在大量相同的值,例如gender
列,大約一半的記錄值是M
,另一半是F
,因此,對該列創(chuàng)建索引就沒有意義。
可以對一張表創(chuàng)建多個索引。索引的優(yōu)點(diǎn)是提高了查詢效率,缺點(diǎn)是在插入、更新和刪除記錄時(shí),需要同時(shí)修改索引,因此,索引越多,插入、更新和刪除記錄的速度就越慢。
對于主鍵,關(guān)系數(shù)據(jù)庫會自動對其創(chuàng)建主鍵索引。使用主鍵索引的效率是最高的,因?yàn)橹麈I會保證絕對唯一。
唯一索引
在設(shè)計(jì)關(guān)系數(shù)據(jù)表的時(shí)候,看上去唯一的列,例如身份證號、郵箱地址等,因?yàn)樗麄兙哂袠I(yè)務(wù)含義,因此不宜作為主鍵。
但是,這些列根據(jù)業(yè)務(wù)要求,又具有唯一性約束:即不能出現(xiàn)兩條記錄存儲了同一個身份證號。這個時(shí)候,就可以給該列添加一個唯一索引。例如,我們假設(shè)students
表的name
不能重復(fù):
ALTER TABLE students ADD UNIQUE INDEX uni_name(name);
通過UNIQUE
關(guān)鍵字我們就添加了一個唯一索引。
也可以只對某一列添加一個唯一約束而不創(chuàng)建唯一索引:
ALTER TABLE students ADD CONSTRAINT uni_name UNIQUE (name);
這種情況下,name
列沒有索引,但仍然具有唯一性保證。
無論是否創(chuàng)建索引,對于用戶和應(yīng)用程序來說,使用關(guān)系數(shù)據(jù)庫不會有任何區(qū)別。
這里的意思是說,當(dāng)我們在數(shù)據(jù)庫中查詢時(shí),如果有相應(yīng)的索引可用,數(shù)據(jù)庫系統(tǒng)就會自動使用索引來提高查詢效率,如果沒有索引,查詢也能正常執(zhí)行,只是速度會變慢。
因此,索引可以在使用數(shù)據(jù)庫的過程中逐步優(yōu)化。
Tips
1.通過對數(shù)據(jù)庫表創(chuàng)建索引,可以提高查詢速度。但索引越多,插入和更新的速度越慢。
2.索引加得不好,查詢不會變快,甚至?xí)兟?/p>
3.通過創(chuàng)建唯一索引,可以保證某一列的值具有唯一性。
4.數(shù)據(jù)庫索引對于用戶和應(yīng)用程序來說都是透明的。
以上就是SQL關(guān)系模型的知識梳理總結(jié)的詳細(xì)內(nèi)容,更多關(guān)于SQL關(guān)系模型的資料請關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。