1.MySQL體系結構
由圖苟呐,可以看出MySQL最上層是連接組件痒芝。下面服務器是由連接池、管理工具和服務牵素、SQL接口严衬、解析器、優(yōu)化器笆呆、緩存请琳、存儲引擎、文件系統(tǒng)組成腰奋。
連接池:由于每次建立建立需要消耗很多時間单起,連接池的作用就是將這些連接緩存下來,下次可以直接用已經(jīng)建立好的連接劣坊,提升服務器性能。
管理工具和服務:系統(tǒng)管理和控制工具屈留,例如備份恢復局冰、Mysql復制、集群等
SQL接口:接受用戶的SQL命令灌危,并且返回用戶需要查詢的結果康二。比如select from就是調用SQL Interface
解析器:?SQL命令傳遞到解析器的時候會被解析器驗證和解析。解析器是由Lex和YACC實現(xiàn)的勇蝙,是一個很長的腳本沫勿, 主要功能:
a . 將SQL語句分解成數(shù)據(jù)結構,并將這個結構傳遞到后續(xù)步驟味混,以后SQL語句的傳遞和處理就是基于這個結構的
b. 如果在分解構成中遇到錯誤产雹,那么就說明這個sql語句是不合理的
優(yōu)化器:查詢優(yōu)化器,SQL語句在查詢之前會使用查詢優(yōu)化器對查詢進行優(yōu)化翁锡。他使用的是“選取-投影-聯(lián)接”策略進行查詢蔓挖。
用一個例子就可以理解: select uid,name from user where gender = 1;
這個select 查詢先根據(jù)where 語句進行選取,而不是先將表全部查詢出來以后再進行gender過濾
這個select查詢先根據(jù)uid和name進行屬性投影馆衔,而不是將屬性全部取出以后再進行過濾
將這兩個查詢條件聯(lián)接起來生成最終查詢結果
緩存器:?查詢緩存瘟判,如果查詢緩存有命中的查詢結果,查詢語句就可以直接去查詢緩存中取數(shù)據(jù)角溃。
通過LRU算法將數(shù)據(jù)的冷端溢出拷获,未來得及時刷新到磁盤的數(shù)據(jù)頁,叫臟頁减细。
這個緩存機制是由一系列小緩存組成的匆瓜。比如表緩存,記錄緩存,key緩存陕壹,權限緩存等
MySQL中內存大致分為:全局內存(Global buffer)质欲、線程內存(Thread buffer)?兩大部分。
全局內存:緩沖池里面有數(shù)據(jù)緩存糠馆、索引緩存嘶伟、鎖信息、插入緩存等等又碌。此外還有重做日志緩存九昧、額外的內存池。
線程內存:Master Thread毕匀、IO Thread铸鹰、Purage Thread、Page Cleaner Thread皂岔。
CheckPoint技術:緩沖池的設計目的為了協(xié)調CPU速度與磁盤速度的鴻溝蹋笼。因此跟新或者刪除的時候直接操作的是內存的數(shù)據(jù),先寫入重做日志躁垛,然后再修改內存池里面的數(shù)據(jù)剖毯,最后定時刷新到磁盤上。
(1) 參數(shù)文件:啟動MySQL實例的時候逊谋,指定一些初始化參數(shù),比如:緩沖池大小土铺、數(shù)據(jù)庫文件路徑胶滋、用戶名密碼等。
(2) 日志文件:比如:錯誤日志悲敷、二進制日志究恤、慢查詢日志、查詢日志等等镀迂。
通過show variables like "error_log"來查看錯誤日志存放內容丁溅。
通過show variables like "long_query_time"來查看慢查詢日志記錄的閾值。默認的慢查詢日志的閥值是10秒探遵,也就是查詢時長超過10秒就會記錄到慢查詢日志文件窟赏;
(3) socket文件:當用UNIX域套接字方式進行連接的時候需要的文件。
(4) pid文件:MySQL實例的進程ID文件箱季。
(5) 表結構文件:用來存放MySQL表結構定義文件涯穷。
.frm后綴命名的文件都是表結構文件,和存儲引擎類型無關藏雏。所有的表都會生成一個.frm文件拷况;
(6) 存儲引擎文件:存儲引擎正在存儲了記錄和索引等數(shù)據(jù)。
(1)共享表空間:共享表空間文件以.ibdata*來命名; 共享表空間下赚瘦,innodb所有數(shù)據(jù)保存在一個單獨的表空間里面粟誓,而這個表空間可以由很多個文件組成,一個表可以跨多個文件存在起意,所以其大小限制不再是文件大小的限制鹰服,而是其自身的限制。從Innodb的官方文檔中可以看到揽咕,其表空間的最大限制為64TB悲酷,也就是說,Innodb的單表限制基本上也在64TB左右了亲善,當然這個大小是包括這個表的所有索引等其他相關數(shù)據(jù)设易。
共享表空間主要存放double write、undo log(undo log沒有獨立的表空間蛹头,需要存放在共享表空間)
(2)獨立表空間:每個表擁有自己獨立的表空間用來存儲數(shù)據(jù)和索引顿肺。
(3)查看數(shù)據(jù)庫是否啟用獨立表空間:
show variables like ‘innodb_file_per_table’;查看,innodb_file_per_table=ON,表示啟用了獨立表空間渣蜗;
(4)使用獨立表空間的優(yōu)點:
如果使用軟鏈接將大表分配到不同的分區(qū)上挟冠,易于管理數(shù)據(jù)文件
易于監(jiān)控解決IO資源使用的問題;
易于修復和恢復損壞的數(shù)據(jù)袍睡;
相互獨立的,不會影響其他innodb表肋僧;
導出導入只針對單個表斑胜,而不是整個共享表空間;
解決單個文件大小的限制嫌吠;
對于大量的delete操作止潘,更易于回收磁盤空間;
碎片較少辫诅,易于整理optimize table凭戴;
易于安全審計;
易于備份
如果在innodb表已創(chuàng)建后設置innodb_file_per_table炕矮,那么數(shù)據(jù)將不會遷移到單獨的表空間上么夫,而是續(xù)集使用之前的共享表空間。只有新創(chuàng)建的表才會分離到自己的表空間文件肤视。
(5)共享表空間的數(shù)據(jù)文件配置:
innodb_data_file_path參數(shù):設置innoDB共享表空間數(shù)據(jù)文件的名字和大小档痪,例如innodb_data_file_path=ibdata1:12M:autoextend(初始大小12M,不足自增)
innodb_data_home_dir參數(shù):innodb引擎的共享表空間數(shù)據(jù)文件的存放目錄
目前主要是使用獨立表空間邢滑,但是共享表空間也是需要的腐螟,共享表空間主要存放double write、undo log等
(1)每頁=16Kb(頁類型:數(shù)據(jù)頁乐纸、undo頁衬廷、系統(tǒng)頁、事務數(shù)據(jù)頁汽绢、插入緩沖位圖頁吗跋、插入緩沖空閑列表頁、未壓縮的二進制大對象頁庶喜、壓縮的二進制大對象頁)
(2)區(qū)=64個連續(xù)的頁=64*16Kb=1MB