Java 接入 canal

canal.adapter | 問題

canal.adapter | 原理
  • canal.adapter 會給它配置一個配置文件 shop.yml礼殊;
  • shop.yml 中會定義當 canal.deployer 同步過來 MySQL 的 binlog 時 canal.adapter 要執(zhí)行的 SQL沫勿,這里定義的 SQL 長這樣:
    select a.id,a.name,a.tags,concat(a.latitude,',',a.longitude) as location,a.remark_score,a.price_per_man,a.category_id,b.name as category_name,a.seller_id,c.remark_score as seller_remark_score,c.disabled_flag as seller_disabled_flag from shop a inner join category b on a.category_id = b.id inner join seller c on c.id = a.seller_id
canal.adapter | 問題
  • 一整條 SQL 要查出來這么多的字段短荐,但是 canal.adapter 只查變更的字段;
  • 并且卸奉,如果 SQL 中有 a.name, b.name 的話慰毅,canal.adapter 無法區(qū)分這是兩張表的兩個字段德撬,會把 a.name 和 b.name 同時更新成新的值谨胞;
canal.adapter | 問題 | 驗證步驟
  • 清空 ElasticSearch 中索引 shop 的全部文檔固歪;
  • 修改 MySQL 中 shop 表的一條記錄的 name 字段的值;
  • canal.adapter 索引進 ElasticSearch 的文檔只有更新的 name 字段胯努;
canal.adapter | 問題 | 解決方案
  • 不用 canal.adapter 同步數(shù)據(jù)到 ElasticSearch 中了牢裳;
  • 通過引入 canal 的依賴,在 Java 程序中康聂,自定義的將 canal.deployer 同步過來的 binlog 索引進 ElasticSearch 中贰健;
canal.adapter | 適用場景
  • 如果是簡單的將 MySQL 中的一張表和 ElasticSearch 中的一個索引對應胞四,用 canal.adapter 還是可以的恬汁;

SpringBoot 中引入 canal

  • 目前 mvn repository 中最新的依賴版本是 1.1.4,剛好之前自己編譯的 canal 也是 1.1.4辜伟,那就正好氓侧,不用重啟 canal.deployer 的其他版本;
  • 注意 canal.deployer 的版本要和引入依賴的版本一致导狡;
canal | 依賴
<dependency>
    <groupId>com.alibaba.otter</groupId>
    <artifactId>canal.client</artifactId>
    <version>1.1.4</version>
</dependency>
<dependency>
    <groupId>com.alibaba.otter</groupId>
    <artifactId>canal.common</artifactId>
    <version>1.1.4</version>
</dependency>
<dependency>
    <groupId>com.alibaba.otter</groupId>
    <artifactId>canal.protocol</artifactId>
    <version>1.1.4</version>
</dependency>
<dependency>
    <groupId>com.google.protobuf</groupId>
    <artifactId>protobuf-java</artifactId>
    <version>3.5.1</version>
</dependency>
Bean | 連接 canal.deployer
package tech.lixinlei.dianping.canal;

import com.alibaba.google.common.collect.Lists;
import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.client.CanalConnectors;
import org.springframework.beans.factory.DisposableBean;
import org.springframework.context.annotation.Bean;
import org.springframework.stereotype.Component;

import java.net.InetSocketAddress;

@Component
public class CanalClient implements DisposableBean{

    private CanalConnector canalConnector;

    @Bean
    public CanalConnector getCanalConnector(){
        canalConnector = CanalConnectors.newClusterConnector(Lists.newArrayList(
                new InetSocketAddress("127.0.0.1", 11111)),
                "example",
                "canal",
                "canal"
        );
        canalConnector.connect();
        // 指定filter约巷,格式{database}.{table},不傳參數(shù)就是 subscribe 所有的內(nèi)容
        canalConnector.subscribe();
        // 回滾尋找上次中斷的位置
        canalConnector.rollback();
        
        return canalConnector;
    }

    /**
     * 容器銷毀時調(diào)用
     * @throws Exception
     */
    @Override
    public void destroy() throws Exception {
        if(canalConnector != null){
            canalConnector.disconnect();
        }
    }

}
Bean | 定時從 canal.deployer 中讀取 binlog 并解析旱捧、索引進 ElasticSearch
package tech.lixinlei.dianping.canal;

import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.protocol.CanalEntry;
import com.alibaba.otter.canal.protocol.Message;
import com.google.protobuf.InvalidProtocolBufferException;
import org.apache.commons.lang3.StringUtils;
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.beans.BeansException;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.context.ApplicationContext;
import org.springframework.context.ApplicationContextAware;
import org.springframework.scheduling.annotation.Scheduled;
import org.springframework.stereotype.Component;
import tech.lixinlei.dianping.dal.ShopModelMapper;

import javax.annotation.Resource;
import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

@Component
public class CanalScheduling implements Runnable, ApplicationContextAware {

    private ApplicationContext applicationContext;

    @Autowired
    private ShopModelMapper shopModelMapper;

    @Resource
    private CanalConnector canalConnector;

    @Autowired
    private RestHighLevelClient restHighLevelClient;

    @Override
    @Scheduled(fixedDelay = 100)
    public void run() {
        System.out.println("run");
        long batchId = -1;
        try{
            int batchSize = 1000;
            Message message = canalConnector.getWithoutAck(batchSize);
            batchId = message.getId();
            List<CanalEntry.Entry> entries = message.getEntries();
            if(batchId != -1 && entries.size() > 0){
                entries.forEach(entry -> {
                    if(entry.getEntryType() == CanalEntry.EntryType.ROWDATA){
                        // 解析處理
                        publishCanalEvent(entry);
                    }
                });
            }
            canalConnector.ack(batchId);
        }catch(Exception e){
            e.printStackTrace();
            canalConnector.rollback(batchId);
        }
    }

    /**
     * 將 binlog 中的一條(entry)独郎,
     * 解析成受影響的記錄(change),再逐條解析受影響的記錄(change)枚赡,
     * 將記錄(rowData)的數(shù)據(jù)結構從 List 轉成 Map氓癌,
     * 完了交給 indexES 方式索引進 ElasticSearch;
     * @param entry binlog 中的一條贫橙;
     */
    private void publishCanalEvent(CanalEntry.Entry entry){
        CanalEntry.EventType eventType = entry.getHeader().getEventType();
        String database = entry.getHeader().getSchemaName();
        String table = entry.getHeader().getTableName();
        CanalEntry.RowChange change = null;
        try {
            change = CanalEntry.RowChange.parseFrom(entry.getStoreValue());
        } catch (InvalidProtocolBufferException e) {
            e.printStackTrace();
            return;
        }
        change.getRowDatasList().forEach(rowData -> {
            List<CanalEntry.Column> columns = rowData.getAfterColumnsList();
            String primaryKey = "id";
            CanalEntry.Column idColumn = columns.stream().filter(column -> column.getIsKey()
                    && primaryKey.equals(column.getName())).findFirst().orElse(null);

            Map<String,Object> dataMap = parseColumnsToMap(columns);
            try{
                indexES(dataMap, database, table);
            } catch (IOException e) {
                e.printStackTrace();
            }
        });
    }

    Map<String,Object> parseColumnsToMap(List<CanalEntry.Column> columns){
        Map<String,Object> jsonMap = new HashMap<>();
        columns.forEach(column -> {
            if(column == null){
                return;
            }
            jsonMap.put(column.getName(), column.getValue());
        });
        return jsonMap;
    }

    private void indexES(Map<String,Object> dataMap, String database, String table) throws IOException {
        if(!StringUtils.equals("dianping", database)){
            return;
        }

        // result 查出來的記錄是全字段贪婉,不像 canal.adapter 只能查出更改的字段;
        List<Map<String,Object>> result = new ArrayList<>();
        if(StringUtils.equals("seller", table)) {
            result = shopModelMapper.buildESQuery(new Integer((String)dataMap.get("id")), null, null);
        } else if (StringUtils.equals("category", table)){
            result = shopModelMapper.buildESQuery(null, new Integer((String)dataMap.get("id")), null);
        } else if (StringUtils.equals("shop", table)){
            result = shopModelMapper.buildESQuery(null, null, new Integer((String)dataMap.get("id")));
        } else {
            return;
        }

        // 調(diào)用 ES API 將 MySQL 中變化的數(shù)據(jù)索引進 ElasticSearch
        for(Map<String,Object> map : result){
            IndexRequest indexRequest = new IndexRequest("shop");
            indexRequest.id(String.valueOf(map.get("id")));
            indexRequest.source(map);
            restHighLevelClient.index(indexRequest, RequestOptions.DEFAULT);
        }

    }

    @Override
    public void setApplicationContext(ApplicationContext applicationContext) throws BeansException {
        this.applicationContext = applicationContext;
    }

}
在 SpringBoot 層面打開定時任務的開關
@SpringBootApplication(scanBasePackages = {"tech.lixinlei.dianping"})
@MapperScan("tech.lixinlei.dianping.dal")
@EnableAspectJAutoProxy(proxyTargetClass = true)
@EnableScheduling
public class DianpingApplication {

    public static void main(String[] args) {
        SpringApplication.run(DianpingApplication.class, args);
    }

}
根據(jù) binlog 中的內(nèi)容卢肃,查出需要更新進 ElasticSearch 中的數(shù)據(jù)的 SQL
public interface ShopModelMapper {

    List<Map<String,Object>> buildESQuery(@Param("sellerId")Integer sellerId,
                                          @Param("categoryId")Integer categoryId,
                                          @Param("shopId")Integer shopId);

}
<select id="buildESQuery" resultType="java.util.Map">
  select a.id,a.name,a.tags,concat(a.latitude,',',a.longitude) as location,
  a.remark_score,a.price_per_man,a.category_id,b.name as category_name,a.seller_id,
  c.remark_score as seller_remark_score,c.disabled_flag as seller_disabled_flag
  from shop a inner join category b on a.category_id = b.id inner join seller c on c.id=a.seller_id
  <if test="sellerId != null">
    and c.id = #{sellerId}
  </if>
  <if test="categoryId != null">
    and b.id = #{categoryId}
  </if>
  <if test="shopId != null">
    and a.id = #{shopId}
  </if>
</select>
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末疲迂,一起剝皮案震驚了整個濱河市才顿,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌尤蒿,老刑警劉巖郑气,帶你破解...
    沈念sama閱讀 211,123評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異腰池,居然都是意外死亡竣贪,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評論 2 384
  • 文/潘曉璐 我一進店門巩螃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來演怎,“玉大人,你說我怎么就攤上這事避乏∫” “怎么了?”我有些...
    開封第一講書人閱讀 156,723評論 0 345
  • 文/不壞的土叔 我叫張陵拍皮,是天一觀的道長歹叮。 經(jīng)常有香客問我,道長铆帽,這世上最難降的妖魔是什么咆耿? 我笑而不...
    開封第一講書人閱讀 56,357評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮爹橱,結果婚禮上萨螺,老公的妹妹穿的比我還像新娘。我一直安慰自己愧驱,他們只是感情好慰技,可當我...
    茶點故事閱讀 65,412評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著组砚,像睡著了一般吻商。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上糟红,一...
    開封第一講書人閱讀 49,760評論 1 289
  • 那天艾帐,我揣著相機與錄音,去河邊找鬼盆偿。 笑死柒爸,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的陈肛。 我是一名探鬼主播揍鸟,決...
    沈念sama閱讀 38,904評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了阳藻?” 一聲冷哼從身側響起晰奖,我...
    開封第一講書人閱讀 37,672評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎腥泥,沒想到半個月后匾南,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,118評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡蛔外,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,456評論 2 325
  • 正文 我和宋清朗相戀三年蛆楞,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片夹厌。...
    茶點故事閱讀 38,599評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡豹爹,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出矛纹,到底是詐尸還是另有隱情臂聋,我是刑警寧澤,帶...
    沈念sama閱讀 34,264評論 4 328
  • 正文 年R本政府宣布或南,位于F島的核電站孩等,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏采够。R本人自食惡果不足惜肄方,卻給世界環(huán)境...
    茶點故事閱讀 39,857評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蹬癌。 院中可真熱鬧权她,春花似錦、人聲如沸冀瓦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽翼闽。三九已至,卻和暖如春洲炊,著一層夾襖步出監(jiān)牢的瞬間感局,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評論 1 264
  • 我被黑心中介騙來泰國打工暂衡, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留询微,地道東北人。 一個月前我還...
    沈念sama閱讀 46,286評論 2 360
  • 正文 我出身青樓狂巢,卻偏偏與公主長得像撑毛,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子唧领,可洞房花燭夜當晚...
    茶點故事閱讀 43,465評論 2 348