1 數(shù)據(jù)庫
數(shù)據(jù)庫是一個以某種有組織的方式存儲的數(shù)據(jù)集合盾剩。最簡單的辦法是將數(shù)據(jù)庫想象為一個文件柜出刷。這個文件柜是一個存放數(shù)據(jù)的物理位置瘾腰,不管數(shù)據(jù)是什么,也不管數(shù)據(jù)是如何組織的舒憾。
數(shù)據(jù)庫(database)
保存有組織的數(shù)據(jù)的容器(通常是一個文件或一組文件)镀钓。
注意:誤用導(dǎo)致混淆
人們通常用數(shù)據(jù)庫這個術(shù)語來代表他們使用的數(shù)據(jù)庫軟件,這是不正確的镀迂,也因此產(chǎn)生了許多混淆丁溅。確切地說,數(shù)據(jù)庫軟件應(yīng)稱為數(shù)據(jù)庫管理系統(tǒng)(即DBMS)探遵。數(shù)據(jù)庫是通過DBMS創(chuàng)建和操縱的容器窟赏,而具體它究竟是什么,形式如何箱季,各種數(shù)據(jù)庫都不一樣涯穷。
2 表
你往文件柜里放資料時,并不是隨便將它們?nèi)舆M某個抽屜就完事了藏雏,而是在文件柜中創(chuàng)建文件拷况,然后將相關(guān)的資料放入特定的文件中。
在數(shù)據(jù)庫領(lǐng)域中掘殴,這種文件稱為表赚瘦。表是一種結(jié)構(gòu)化的文件,可用來存儲某種特定類型的數(shù)據(jù)奏寨。表可以保存顧客清單起意、產(chǎn)品目錄,或者其他信息清單病瞳。
表(table)
某種特定類型數(shù)據(jù)的結(jié)構(gòu)化清單揽咕。
這里的關(guān)鍵一點在于,存儲在表中的數(shù)據(jù)是同一種類型的數(shù)據(jù)或清單套菜。決不應(yīng)該將顧客的清單與訂單的清單存儲在同一個數(shù)據(jù)庫表中亲善,否則以后的檢索和訪問會很困難。應(yīng)該創(chuàng)建兩個表逗柴,每個清單一個表逗爹。
數(shù)據(jù)庫中的每個表都有一個名字來標識自己。這個名字是唯一的嚎于,即數(shù)據(jù)庫中沒有其他表具有相同的名字。
說明:表名
使表名成為唯一的挟冠,實際上是數(shù)據(jù)庫名和表名等的組合于购。有的數(shù)據(jù)庫還使用數(shù)據(jù)庫擁有者的名字作為唯一名的一部分。也就是說知染,雖然在相同數(shù)據(jù)庫中不能兩次使用相同的表名肋僧,但在不同的數(shù)據(jù)庫中完全可以使用相同的表名。
表具有一些特性,這些特性定義了數(shù)據(jù)在表中如何存儲嫌吠,包含存儲什么樣的數(shù)據(jù)止潘,數(shù)據(jù)如何分解,各部分信息如何命名等信息辫诅。描述表的這組信息就是所謂的模式(schema)凭戴,模式可以用來描述數(shù)據(jù)庫中特定的表,也可以用來描述整個數(shù)據(jù)庫(和其中表的關(guān)系)炕矮。
模式
關(guān)于數(shù)據(jù)庫和表的布局及特性的信息么夫。
3 列和數(shù)據(jù)類型
表由列組成。列存儲表中某部分的信息肤视。
列(column)
表中的一個字段档痪。所有表都是由一個或多個列組成的。
理解列的最好辦法是將數(shù)據(jù)庫表想象為一個網(wǎng)格邢滑,就像個電子表格那樣腐螟。網(wǎng)格中每一列存儲著某種特定的信息。例如困后,在顧客表中乐纸,一列存儲顧客編號,另一列存儲顧客姓名操灿,而地址锯仪、城市、州以及郵政編碼全都存儲在各自的列中趾盐。
提示:分解數(shù)據(jù)
正確地將數(shù)據(jù)分解為多個列極為重要庶喜。例如,城市救鲤、州久窟、郵政編碼應(yīng)該總是彼此獨立的列。通過分解這些數(shù)據(jù)本缠,才有可能利用特定的列對數(shù)據(jù)進行分類和過濾(如找出特定州或特定城市的所有顧客)斥扛。如果城市和州組合在一個列中,則按州進行分類或過濾就會很困難丹锹。
你可以根據(jù)自己的具體需求來決定把數(shù)據(jù)分解到何種程度稀颁。例如,一般可以把門牌號和街道名一起存儲在地址里楣黍。這沒有問題匾灶,除非你哪天想用街道名來排序,這時租漂,最好將門牌號和街道名分開阶女。
數(shù)據(jù)庫中每個列都有相應(yīng)的數(shù)據(jù)類型颊糜。數(shù)據(jù)類型(datatype)定義了列可以存儲哪些數(shù)據(jù)種類。例如秃踩,如果列中存儲的是數(shù)字(或許是訂單中的物品數(shù))衬鱼,則相應(yīng)的數(shù)據(jù)類型應(yīng)該為數(shù)值類型。如果列中存儲的是日期憔杨、文本鸟赫、注釋、金額等芍秆,則應(yīng)該規(guī)定好恰當(dāng)?shù)臄?shù)據(jù)類型惯疙。
數(shù)據(jù)類型
所允許的數(shù)據(jù)的類型。每個表列都有相應(yīng)的數(shù)據(jù)類型妖啥,它限制(或允許)該列中存儲的數(shù)據(jù)霉颠。
數(shù)據(jù)類型限定了可存儲在列中的數(shù)據(jù)種類(例如,防止在數(shù)值字段中錄入字符值)荆虱。數(shù)據(jù)類型還幫助正確地分類數(shù)據(jù)蒿偎,并在優(yōu)化磁盤使用方面起重要的作用。因此怀读,在創(chuàng)建表時必須特別關(guān)注所用的數(shù)據(jù)類型诉位。
注意:數(shù)據(jù)類型兼容
數(shù)據(jù)類型及其名稱是SQL不兼容的一個主要原因。雖然大多數(shù)基本數(shù)據(jù)類型得到了一致的支持菜枷,但許多高級的數(shù)據(jù)類型卻沒有苍糠。更糟的是,偶然會有相同的數(shù)據(jù)類型在不同的DBMS中具有不同的名稱啤誊。對此用戶毫無辦法岳瞭,重要的是在創(chuàng)建表結(jié)構(gòu)時要記住這些差異。
4 行
表中的數(shù)據(jù)是按行存儲的蚊锹,所保存的每個記錄存儲在自己的行內(nèi)瞳筏。如果將表想象為網(wǎng)格,網(wǎng)格中垂直的列為表列牡昆,水平行為表行姚炕。
例如,顧客表可以每行存儲一個顧客丢烘。表中的行編號為記錄的編號柱宦。
行(row)
表中的一個記錄。
說明:是記錄還是行播瞳?
你可能聽到用戶在提到行時稱其為數(shù)據(jù)庫記錄(record)捷沸。這兩個術(shù)語多半是可以交替使用的,但從技術(shù)上說狐史,行才是正確的術(shù)語痒给。
5 主鍵
表中每一行都應(yīng)該有一列(或幾列)可以唯一標識自己。顧客表可以使用顧客編號骏全,而訂單表可以使用訂單ID苍柏。雇員表可以使用雇員ID或雇員社會安全號。
主鍵(primary key)
一列(或一組列)姜贡,其值能夠唯一標識表中每一行试吁。
唯一標識表中每行的這個列(或這幾列)稱為主鍵。主鍵用來表示一個特定的行楼咳。沒有主鍵熄捍,更新或刪除表中特定行就極為困難,因為你不能保證操作只涉及相關(guān)的行母怜。
提示:應(yīng)該總是定義主鍵
雖然并不總是需要主鍵余耽,但多數(shù)數(shù)據(jù)庫設(shè)計者都會保證他們創(chuàng)建的每個表具有一個主鍵,以便于以后的數(shù)據(jù)操作和管理苹熏。
表中的任何列都可以作為主鍵碟贾,只要它滿足以下條件:
- 任意兩行都不具有相同的主鍵值;
- 每一行都必須具有一個主鍵值(主鍵列不允許NULL值)轨域;
- 主鍵列中的值不允許修改或更新袱耽;
- 主鍵值不能重用(如果某行從表中刪除,它的主鍵不能賦給以后的新行)干发。
主鍵通常定義在表的一列上朱巨,但并不是必需這么做,也可以一起使用多個列作為主鍵枉长。在使用多列作為主鍵時冀续,上述條件必須應(yīng)用到所有列,所有列值的組合必須是唯一的(但單個列的值可以不唯一)搀暑。
還有一種非常重要的鍵沥阳,稱為外鍵,我們將在第12課中介紹自点。
什么是SQL
SQL(發(fā)音為字母S-Q-L或sequel)是結(jié)構(gòu)化查詢語言(Structured Query Language)的縮寫桐罕。SQL是一種專門用來與數(shù)據(jù)庫溝通的語言。
與其他語言(如英語或Java桂敛、C功炮、PHP這樣的編程語言)不一樣,SQL中只有很少的詞术唬,這是有意而為的薪伏。設(shè)計SQL的目的是很好地完成一項任務(wù)——提供一種從數(shù)據(jù)庫中讀寫數(shù)據(jù)的簡單有效的方法。
SQL有如下的優(yōu)點粗仓。
- SQL不是某個特定數(shù)據(jù)庫供應(yīng)商專有的語言嫁怀。幾乎所有重要的DBMS都支持SQL设捐,所以學(xué)習(xí)此語言使你幾乎能與所有數(shù)據(jù)庫打交道。
- SQL簡單易學(xué)塘淑。它的語句全都是由有很強描述性的英語單詞組成萝招,而且這些單詞的數(shù)目不多。
- SQL雖然看上去很簡單存捺,但實際上是一種強有力的語言槐沼,靈活使用其語言元素,可以進行非常復(fù)雜和高級的數(shù)據(jù)庫操作捌治。
下面我們將開始真正學(xué)習(xí)SQL岗钩。
說明:SQL的擴展
許多DBMS廠商通過增加語句或指令,對SQL進行了擴展肖油。這種擴展的目的是提供執(zhí)行特定操作的額外功能或簡化方法兼吓。雖然這種擴展很有用,但一般都是針對個別DBMS的构韵,很少有兩個以上的供應(yīng)商支持這種擴展周蹭。
標準SQL由ANSI標準委員會管理,從而稱為ANSI SQL疲恢。所有主要的DBMS凶朗,即使有自己的擴展,也都支持ANSI SQL显拳。各個實現(xiàn)有自己的名稱棚愤,如PL/SQL、Transact-SQL 等杂数。
本書講授的SQL主要是ANSI SQL宛畦。在使用某種DBMS特定的SQL時,會特別說明揍移。