目標
把定時任務通過集群的方式進行管理調度泥畅,并采用分布式部署丁鹉,保證系統(tǒng)的高可用瓜贾,提高了容錯胆敞。那么如何保證定時任務只在集群的某一個節(jié)點上執(zhí)行着帽,或者一個任務如何拆分為多個獨立的任務項,由分布式的機器去分別執(zhí)行移层, 眾多的定時任務如何統(tǒng)一管理仍翰,現(xiàn)在有很多成熟的分布式定時任務框架,都能很好的實現(xiàn)上述的功能观话。
基本概念
elastic-job 是由當當網(wǎng)基于quartz 二次開發(fā)之后的分布式調度解決方案 予借, 由兩個相對獨立的子項目Elastic-Job-Lite和Elastic-Job-Cloud組成 。
elastic-job主要的設計理念是無中心化的分布式定時調度框架,思路來源于Quartz的基于數(shù)據(jù)庫的高可用方案蕾羊。但數(shù)據(jù)庫沒有分布式協(xié)調功能喧笔,所以在高可用方案的基礎上增加了彈性擴容和數(shù)據(jù)分片的思路帽驯,以便于更大限度的利用分布式服務器的資源龟再。
1. 分片
任務的分布式執(zhí)行,需要將一個任務拆分為多個獨立的任務項尼变,然后由分布式的服務器分別執(zhí)行某一個或幾個分片項利凑。
例如:有一個遍歷數(shù)據(jù)庫某張表的作業(yè),現(xiàn)有2臺服務器嫌术。
為了快速的執(zhí)行作業(yè)哀澈,那么每臺服務器應執(zhí)行作業(yè)的50%。 為滿足此需求度气,可將作業(yè)分成2片割按,每臺服務器執(zhí)行1片。
作業(yè)遍歷數(shù)據(jù)的邏輯可以為:服務器A遍歷ID以奇數(shù)結尾的數(shù)據(jù)磷籍;服務器B遍歷ID以偶數(shù)結尾的數(shù)據(jù)适荣。
如果分成10片,則服務器A被分配到分片項0,1,2,3,4院领;服務器B被分配到分片項5,6,7,8,9弛矛。
作業(yè)遍歷數(shù)據(jù)的邏輯可以為:服務器A遍歷ID以0-4結尾的數(shù)據(jù);服務器B遍歷ID以5-9結尾的數(shù)據(jù)
2. 分片項與業(yè)務處理解耦
Elastic-Job并不直接提供數(shù)據(jù)處理的功能比然,框架只會將分片項分配至各個運行中的作業(yè)服務器丈氓,開發(fā)者需要自行處理分片項與真實數(shù)據(jù)的對應關系。以上面例子分成10片為例强法,框架只負責決定服務器分配到哪些分片項万俗,由作業(yè)分配策略決定,但是每個分片處理哪一部分數(shù)據(jù)饮怯,比如第一個分片處理id以0-4結尾的數(shù)據(jù)闰歪,是由開發(fā)者去決定和處理的。
3. 中心化
xxl-job是中心化設計硕淑,在xxl-job中课竣,所有定時任務的執(zhí)行是在調度中心判斷作業(yè)到了執(zhí)行的時間,然后通知業(yè)務系統(tǒng)去執(zhí)行置媳,即是作業(yè)節(jié)點并不知道自己應該什么時候執(zhí)行定時任務于樟,只能通過調度中心去決定作業(yè)的執(zhí)行。缺點是部署麻煩拇囊。
4. 去中心化
elastic-job是去中心化設計迂曲,作業(yè)調度中心節(jié)點,各個作業(yè)節(jié)點是自治的寥袭,作業(yè)框架的程序在到達相應時間點時各自觸發(fā)調度路捧,缺點是可能會存在各個作業(yè)服務器的時間不一致的問題关霸。
使用
1. 引入maven依賴
<dependency>
<groupId>com.dangdang</groupId>
<artifactId>elastic-job-lite-spring</artifactId>
<version>2.1.5</version>
</dependency>
<dependency>
<artifactId>elastic-job-lite-core</artifactId>
<groupId>com.dangdang</groupId>
<version>2.1.5</version>
</dependency>
2. 配置注冊中心
<reg:zookeeper id="regCenter" server-lists="192.168.3.191:2181" namespace="elastic-job-zookeeper" base-sleep-time-milliseconds="${baseSleepTimeMilliseconds}" max-sleep-time-milliseconds="${maxSleepTimeMilliseconds}" max-retries="${maxRetries}" />
3. 事件追蹤(可選)
<bean id="elasticJobLog" class="com.alibaba.druid.pool.DruidDataSource" init-method="init" destroy-method="close">
<!--<property name="driverClassName" value="${event.rdb.driver}"/>-->
<property name="url" value="${event.rdb.url}"/>
<property name="username" value="${event.rdb.username}"/>
<property name="password" value="${event.rdb.password}"/>
</bean>
4.作業(yè)開發(fā)
package com.isuwang.soa.crm.dbc.action.shareCrm
import java.util.{Date, Optional}
...
@Transactional(value = "crm", rollbackFor = Array(classOf[Exception]))
class FxxkUpdateRecordAction() extends Action[Unit] with SimpleJob{
override def preCheck: Unit = {}
override def action: Unit = {
val beginTime = System.currentTimeMillis()
rangeConditions.append(rangeCondition)
searchQuery.rangeConditions(rangeConditions)
getDatas(fXRecords)
// 同步
fXRecords.foreach(x => {
val tripList = getTableColumnValue(x)
tripList.foreach(trip => {
try {
executeUpdate(trip._4, trip, x)
} catch {
case e: Throwable => {
logger.error(e.getMessage, e)
logger.info("=====>紛享更新回訪記錄失敗內容id:{}", x._id)
}
}
})
})
logger.info(s"====>${getClass.getName}耗時:{}秒", (System.currentTimeMillis() - beginTime) / 1000)
}
...
override def execute(shardingContext: ShardingContext): Unit = action
}
<job:simple id="FxxkUpdateRecordAction" class="com.isuwang.soa.crm.dbc.action.shareCrm.FxxkUpdateRecordAction" registry-center-ref="regCenter" sharding-total-count="1" cron="0 40 * * * ? " failover="true" description="每晚定時統(tǒng)計獲取紛享CRM當日更新的回訪記錄" overwrite="true" event-trace-rdb-data-source="elasticJobLog" />
failover:是否開啟任務執(zhí)行失效轉移,開啟表示如果作業(yè)在一次任務執(zhí)行中途宕機杰扫,允許將該次未完成的任務在另一作業(yè)節(jié)點上補償執(zhí)行
description:作業(yè)描述
overwrite:本地配置是否可覆蓋注冊中心配置队寇,如果可覆蓋,每次啟動作業(yè)都以本地配置為準
event-trace-rdb-data-source:作業(yè)事件追蹤的數(shù)據(jù)源Bean引用