Quartz框架(一)—Quartz的基本配置
Quartz框架(二)—jobstore數(shù)據(jù)庫表字段詳解
Quartz框架(三)—任務(wù)的并行/串行執(zhí)行
Quartz框架(四)—misfire處理機(jī)制
Quartz框架(五)— 有狀態(tài)的job和無狀態(tài)job
Quartz框架(六)— Trigger狀態(tài)轉(zhuǎn)換
Quartz框架(七)— Quartz集群原理
Quartz框架(八)— Quartz實(shí)現(xiàn)異步通知
Quartz框架(九)— 動(dòng)態(tài)操作Quartz定時(shí)任務(wù)
Quartz框架(十)監(jiān)聽
1. Quartz集群
Quartz急群眾每個(gè)節(jié)點(diǎn)是一個(gè)獨(dú)立的Quartz任務(wù)應(yīng)用看彼,它又管理者其他節(jié)點(diǎn)。該集群需要分別對(duì)每個(gè)節(jié)點(diǎn)分別啟動(dòng)或停止囚聚,獨(dú)立的Quartz節(jié)點(diǎn)并不與另一個(gè)節(jié)點(diǎn)或是管理節(jié)點(diǎn)通信靖榕。Quartz應(yīng)用是通過共有相同數(shù)據(jù)庫表來感知到另一應(yīng)用。也就是說只有使用持久化JobStore存儲(chǔ)Job和Trigger才能完成Quartz集群顽铸。
Quartz的集群部署方案是分布式的茁计,沒有負(fù)責(zé)集中管理的節(jié)點(diǎn),而是利用數(shù)據(jù)庫杭鎖的方式來實(shí)現(xiàn)集群環(huán)境下的并發(fā)控制谓松。
一個(gè)scheduler實(shí)例在集群模式下首先獲取{0}LOCKS表中的行鎖星压;
向Mysql獲取杭鎖的語句:
select * from {0}LOCKS where sched_name = ? and lock_name = ? for update
{0}會(huì)替換為配置文件默認(rèn)配置的QRTZ_
。sched_name為應(yīng)用集群的實(shí)例名鬼譬,lock_name就是行級(jí)鎖名租幕。Quartz主要由兩個(gè)行級(jí)鎖。
lock_name | desc |
---|---|
STATE_ACCESS | 狀態(tài)訪問鎖 |
TRIGGER_ACCESS | 觸發(fā)器訪問鎖 |
Quartz集群爭(zhēng)用觸發(fā)器行鎖拧簸,鎖被占用只能等待劲绪,獲取觸發(fā)器行鎖之后,先獲取需要等待觸發(fā)的其他觸發(fā)器信息盆赤。數(shù)據(jù)庫更新觸發(fā)器狀態(tài)信息贾富,及時(shí)是否觸發(fā)器行鎖,供其他調(diào)度實(shí)例獲取牺六,然后在進(jìn)行觸發(fā)器任務(wù)調(diào)度操作颤枪,對(duì)數(shù)據(jù)庫操作就要先獲取行鎖。
#集群中應(yīng)用采用相同的Scheduler實(shí)例
org.quartz.scheduler.instanceName: wenqyScheduler
#集群節(jié)點(diǎn)的ID必須唯一淑际,可由quartz自動(dòng)生成
org.quartz.scheduler.instanceId: AUTO
#通知Scheduler實(shí)例要它參與到一個(gè)集群當(dāng)中
org.quartz.jobStore.isClustered: true
#需持久化存儲(chǔ)
org.quartz.jobStore.class=org.quartz.impl.jdbcjobstore.JobStoreTX
org.quartz.jobStore.driverDelegateClass=org.quartz.impl.jdbcjobstore.StdJDBCDelegate
#數(shù)據(jù)源
org.quartz.jobStore.dataSource=myDS
#quartz表前綴
org.quartz.jobStore.tablePrefix=QRTZ_
#數(shù)據(jù)源配置
org.quartz.dataSource.myDS.driver: com.mysql.jdbc.Driver
org.quartz.dataSource.myDS.URL: jdbc:mysql://localhost:3306/ncdb
org.quartz.dataSource.myDS.user: root
org.quartz.dataSource.myDS.password: 123456
org.quartz.dataSource.myDS.maxConnections: 5
org.quartz.dataSource.myDS.validationQuery: select 0
同一集群下畏纲,instanceName必須相同扇住,instanceId可自動(dòng)生成,isClustered為true盗胀,持久化存儲(chǔ)艘蹋,指定數(shù)據(jù)庫類型對(duì)應(yīng)的驅(qū)動(dòng)類和數(shù)據(jù)源連接。
2. 集群故障轉(zhuǎn)移
每個(gè)服務(wù)器會(huì)定時(shí)(org.quartz.jobStore.clusterCheckinInterval這個(gè)時(shí)間)更新SCHEDULER_STATE表中的LAST_CHECK_TIME(將服務(wù)器的當(dāng)前時(shí)刻更新為最后更新時(shí)刻)字段票灰,遍歷集群各兄弟節(jié)點(diǎn)的實(shí)例狀態(tài)女阀,檢測(cè)集群各個(gè)兄弟節(jié)點(diǎn)的健康狀態(tài)。
2.1 如何檢測(cè)故障節(jié)點(diǎn)
當(dāng)集群的一個(gè)節(jié)點(diǎn)的Scheduler實(shí)例執(zhí)行CHECKIN時(shí)屑迂,他會(huì)查看是否有其他節(jié)點(diǎn)Scheduler實(shí)例在到達(dá)他們預(yù)期的時(shí)間還未CHECKIN浸策,則認(rèn)為該節(jié)點(diǎn)故障。
LAST_CHECK_TIME+CHECKIN_INTERVAL<System.currentTimeMillis()
源碼請(qǐng)參考org.quartz.impl.jdbcjobstore.JobStoreSupport下的
/**
* Get a list of all scheduler instances in the cluster that may have failed.
* This includes this scheduler if it is checking in for the first time.
*/
protected List<SchedulerStateRecord> findFailedInstances(Connection conn)
throws JobPersistenceException {
// find failed instances...
if (calcFailedIfAfter(rec) < timeNow) {
}
protected long calcFailedIfAfter(SchedulerStateRecord rec) {
return rec.getCheckinTimestamp() +
Math.max(rec.getCheckinInterval(),
(System.currentTimeMillis() - lastCheckin)) +
7500L;
}
那么則認(rèn)為該節(jié)點(diǎn)故障惹盼。
2.2 如何處理故障節(jié)點(diǎn)
集群管理線程檢測(cè)到故障節(jié)點(diǎn)庸汗,就會(huì)更新觸發(fā)器的狀態(tài),狀態(tài)更新如下:
故障節(jié)點(diǎn)觸發(fā)器更新前狀態(tài) | 更新后狀態(tài) |
---|---|
BLOCK | WAITING |
PAUSED_BLOCK | PAUSED |
ACQUIRED | WAITING |
COMPLETE | 無手报,刪除Trigger |
需要注意的是:若qrtz_fired_triggers
不是ACQUIRED狀態(tài)蚯舱,而是執(zhí)行狀態(tài),且jobRequestRecovery=true:
- 創(chuàng)建一個(gè)SimpleTrigger昧诱,存儲(chǔ)到triggers表中;
- status=waiting,MISFIRE_INSTR=MISFIRE_INSTRUCTION_IGNORE_MISFIRE_POLICY所袁。
然后刪除firedTrigger盏档。恢復(fù)故障的任務(wù)燥爷。
集群管理線程會(huì)刪除故障節(jié)點(diǎn)的實(shí)例狀態(tài)(qrtz_scheduler_state表)蜈亩,即重置了所有故障節(jié)點(diǎn)觸發(fā)任務(wù)一般,原先故障任務(wù)和正常任務(wù)一樣就交由了調(diào)度處理線程處理前翎。
3. 注意問題
1. 時(shí)間同步問題
Quartz實(shí)際并不關(guān)心你是在相同還是不同的機(jī)器上運(yùn)行節(jié)點(diǎn)稚配。當(dāng)集群放置在不同的機(jī)器上時(shí),稱之為水平集群港华。節(jié)點(diǎn)跑在同一臺(tái)機(jī)器上時(shí)道川,稱之為垂直集群。對(duì)于垂直集群立宜,存在著單點(diǎn)故障的問題冒萄。這對(duì)高可用性的應(yīng)用來說是無法接受的,因?yàn)橐坏C(jī)器崩潰了橙数,所有的節(jié)點(diǎn)也就被終止了尊流。對(duì)于水平集群,存在著時(shí)間同步問題灯帮。
節(jié)點(diǎn)用時(shí)間戳來通知其他實(shí)例它自己的最后檢入時(shí)間崖技。假如節(jié)點(diǎn)的時(shí)鐘被設(shè)置為將來的時(shí)間逻住,那么運(yùn)行中的Scheduler將再也意識(shí)不到那個(gè)結(jié)點(diǎn)已經(jīng)宕掉了。另一方面迎献,如果某個(gè)節(jié)點(diǎn)的時(shí)鐘被設(shè)置為過去的時(shí)間瞎访,也許另一節(jié)點(diǎn)就會(huì)認(rèn)定那個(gè)節(jié)點(diǎn)已宕掉并試圖接過它的Job重運(yùn)行。最簡(jiǎn)單的同步計(jì)算機(jī)時(shí)鐘的方式是使用某一個(gè)Internet時(shí)間服務(wù)器(Internet Time Server ITS)忿晕。
2. 節(jié)點(diǎn)爭(zhēng)搶Job問題
因?yàn)镼uartz使用了一個(gè)隨機(jī)的負(fù)載均衡算法装诡,Job以隨機(jī)的方式由不同的實(shí)例執(zhí)行。Quartz官網(wǎng)上提到當(dāng)前践盼,還不存在一個(gè)方法來指派(釘住) 一個(gè) Job 到集群中特定的節(jié)點(diǎn)鸦采。