一、 統(tǒng)計(jì)信息的收集??
良好查詢性能最重要的先決條件是正確的統(tǒng)計(jì)信息,陳舊的統(tǒng)計(jì)信息可能會(huì)導(dǎo)致優(yōu)化器生成低效的執(zhí)行計(jì)劃虑绵。KingbaseES內(nèi)部存在著一個(gè)統(tǒng)計(jì)進(jìn)程只怎,以采樣的方式收集統(tǒng)計(jì)信息阵翎。該統(tǒng)計(jì)進(jìn)程不是使用全部數(shù)據(jù)作為樣本進(jìn)行統(tǒng)計(jì)轻绞,而是隨機(jī)地采集表中的一部分元組作為樣本來生成統(tǒng)計(jì)信息抱怔。通過調(diào)整default_statistics_target的值可以改變樣本容量蛀柴,目前default_statistics_target的默認(rèn)值是100螃概,在計(jì)算樣本容量時(shí),采用300?××?defualt_statistics_target=30000作為采樣的樣本默認(rèn)容量鸽疾。
采樣的方式包括:
自動(dòng)收集
主動(dòng)收集
1.1.?自動(dòng)收集??
KingbaseES會(huì)默認(rèn)自動(dòng)收集統(tǒng)計(jì)信息吊洼,在配置參數(shù)autovacuum開啟的情況下,會(huì)有一個(gè)后臺(tái)進(jìn)程自動(dòng)檢測制肮。
autovacuum是kingbase提供的一個(gè)deamon進(jìn)程冒窍,在kingbase中,事務(wù)提交/回滾時(shí)會(huì)發(fā)消息給進(jìn)程sysstat豺鼻,sysstat會(huì)匯總這份信息并記錄到文件中综液,autovacuum launcher會(huì)定期讀取文件,獲得當(dāng)某個(gè)表的改動(dòng)超過閾值時(shí)便會(huì)觸發(fā)一次統(tǒng)計(jì)信息的更新操作儒飒。autovacuum會(huì)執(zhí)行analyze操作更新統(tǒng)計(jì)信息谬莹,analyze操作對(duì)表進(jìn)行隨機(jī)采樣更新統(tǒng)計(jì)信息,而不是讀取表的每一行桩了。這些閾值等一系列配置參數(shù)保存在kingbse.conf里面附帽,主要包括:
1、總控autovacuum參數(shù):
autovacuum:
是否允許自動(dòng)vacuum井誉,默認(rèn)值是on蕉扮。
log_autovacuum_min_duration:
默認(rèn)值為-1,不記錄vacuum日志颗圣。0記錄所有vacuumlog喳钟。
正整數(shù),單位為微秒在岂,表示vacuum執(zhí)行時(shí)間小于該值的不記錄荚藻,大于該值的的記錄log。
autovacuum_max_workers:
最大的autovacuum進(jìn)程的數(shù)量洁段,默認(rèn)值為3。
autovacuum_naptime:
檢查數(shù)據(jù)庫的時(shí)間間隔共郭。默認(rèn)為1分鐘祠丝。
2疾呻、自動(dòng)vacuum參數(shù):
autovacuum_vacuum_threshold:
激活自動(dòng)vaccum的最小DML操作的行數(shù)。默認(rèn)值50写半。
autovacuum_vacuum_scale_factor:
該參數(shù)采用百分比的方式設(shè)定閥值岸蜗。默認(rèn)值為20%。
說明?:表上update和delete記錄總數(shù) >= autovacuum_vacuum_scale_factor *?表上記錄數(shù)(reltuples)+ autovacuum_vacuum_threshold后叠蝇,觸發(fā)vacuum璃岳。
3、自動(dòng)analyze參數(shù)
autovacuum_analyze_threshold:
激活自動(dòng)analyze操作的最小行數(shù)悔捶。默認(rèn)值50铃慷。
autovacuum_analyze_scale_factor:
到達(dá)閥值時(shí)自動(dòng)激活analyze操作。默認(rèn)值為10%蜕该。
說明?:表上insert犁柜、update和delete記錄總數(shù) >= autovacuum_ analyze _scale_factor *?表上記錄數(shù)(reltuples)+ autovacuum_ analyze _threshold后,觸發(fā)自動(dòng)analyze堂淡。
4馋缅、事務(wù)ID相關(guān)參數(shù)
autovacuum_freeze_max_age:
為防止事務(wù)ID的重置,在啟用vacuum操作之前绢淀,表的sys_class.relfrozenxid字段的最大值萤悴,默認(rèn)為2億。
說明?:表上事務(wù)的最大年齡配置參數(shù)autovacuum_freeze_max_age皆的,達(dá)到這個(gè)閥值將觸發(fā) autovacuum進(jìn)程覆履。
3.3.3.2.?主動(dòng)收集??
主動(dòng)收集是指用戶通過定時(shí)腳本或者人工執(zhí)行analyze命令來進(jìn)行。此命令將觸發(fā)數(shù)據(jù)庫對(duì)統(tǒng)計(jì)信息進(jìn)行收集并更新祭务。
但是不帶參數(shù)運(yùn)行 ANALYZE 會(huì)為數(shù)據(jù)庫中所有的表更新統(tǒng)計(jì)信息内狗。這可能會(huì)是運(yùn)行時(shí)間非常長的處理,因此一般不建議這樣做义锥。當(dāng)數(shù)據(jù)被改變時(shí)柳沙,使用者應(yīng)該有選擇地 ANALYZE 表。在大型表上運(yùn)行 ANALYZE 可能需要很長時(shí)間拌倍。如果在非常大的表的所有列上運(yùn)行 ANALYZE 行不通赂鲤,使用者可以只使用 ANALYZE table(column, ...)為選擇的列生成統(tǒng)計(jì)信息。 確保包括用在連接柱恤、WHERE 子句数初、SORT 子句、GROUP BY 子句或者 HAVING 子句中的列梗顺。
主動(dòng)收集統(tǒng)計(jì)時(shí)機(jī)的信息一般為:
裝載大量數(shù)據(jù)后
CREATE INDEX 操作后
在大量更改底層數(shù)據(jù)的 INSERT泡孩、UPDATE 以及 DELETE 操作之后
執(zhí)行計(jì)劃的代價(jià)估算不準(zhǔn)確時(shí)
注意
ANALYZE僅在表上要求一個(gè)讀鎖,因此它可以與其他數(shù)據(jù)庫活動(dòng)并行運(yùn)行寺谤。但不要在執(zhí)行裝載仑鸥、INSERT吮播、UPDATE、DELETE 以及 CREATE INDEX 操作期間運(yùn)行 ANALYZE眼俊。因?yàn)樵趫?zhí)行完上面的操作后意狠,表的信息發(fā)生了改變,需要重新做ANALYZE疮胖。