netty 心跳包和斷線重連機制

為什么需要心跳包?劫谅?嚷掠?

心跳包主要是用來做TCP長連接保活的贯城。有時 socket 雖然是連接的但中間網(wǎng)絡(luò)可能有問題霹娄,這時你還在不停的往外發(fā)送數(shù)據(jù)鲫骗,但對方是收不到的踩晶,你不知道對方是不是還活著,不知道 socket 通道是不是還是聯(lián)通的。 心跳包就是你發(fā)送一些試探包給對方坦胶,對方回應(yīng)晴楔,如果一定時間內(nèi)比如30秒內(nèi)沒有收到任何數(shù)據(jù),說明對方或網(wǎng)絡(luò)可能有問題了纪岁。這時你主動斷開 socket 連接则果,避免浪費資源。

TCP 本來就有 keepAlive 機制為什么還需要應(yīng)用層自己實現(xiàn)心跳遗增?款青??

TCP keepAlive 也是在一定時間內(nèi)(默認2小時)socket 上沒有接收到數(shù)據(jù)時主動斷開連接饰及,避免浪費資源康震,這時遠端很可能已經(jīng)down機了或中間網(wǎng)絡(luò)有問題。也是通過發(fā)送一系列試探包看有沒有回應(yīng)來實現(xiàn)的屏箍。

TCP keepAlive 依賴操作系統(tǒng)橘忱,默認是關(guān)閉的,需要修改操作系統(tǒng)配置打開鹦付。
所以在應(yīng)用層實現(xiàn)心跳包還是必須的敲长。

netty 中通過 IdleStateHandler 在空閑的時候發(fā)送心跳包

為什么在空閑的時候發(fā)送心跳包,而不是每隔固定時間發(fā)送???

這個是顯而易見的祈噪,正常通信時說明兩端連接是沒有問題的辑鲤,所以只在空閑的時候發(fā)送心跳包。如果每隔固定時間發(fā)送就會浪費資源占用正常通信的資源月褥。

假設(shè)現(xiàn)在要做一個手機端推送的項目宁赤,所有手機通過 TCP 長連接連接到后臺服務(wù)器。心跳機制是這樣的:

  1. 手機端在寫空閑的時候發(fā)送心跳包給服務(wù)端决左,用 IdleStateHandler 來做 socket 的空閑檢測。 如果 5 秒內(nèi)沒有寫任何數(shù)據(jù)惑芭,則發(fā)送心跳包到服務(wù)端
ch.pipeline().addLast(new IdleStateHandler(0, 5, 0, TimeUnit.SECONDS));
ch.pipeline().addLast(new HeartbeatKeeper());

@ChannelHandler.Sharable
public class HeartbeatKeeper extends ChannelInboundHandlerAdapter {
    @Override
    public void userEventTriggered(ChannelHandlerContext ctx, Object evt) throws Exception {
        if (evt instanceof IdleStateEvent) {
            IdleState state = ((IdleStateEvent) evt).state();
            if (state == IdleState.WRITER_IDLE) {
                System.out.println("client send heart beat");
                ctx.channel().writeAndFlush("heart beat\n");
            }
        } else {
            super.userEventTriggered(ctx, evt);
        }
    }
}
  1. 服務(wù)端設(shè)置讀超時遂跟,如果 30 秒內(nèi)沒有收到一個客戶端的任何數(shù)據(jù)則關(guān)閉連接婴渡。
ch.pipeline().addLast(new IdleStateHandler(30, 0, 0, TimeUnit.SECONDS));
ch.pipeline().addLast(new IdleStateTrigger());

@ChannelHandler.Sharable
public class IdleStateTrigger extends ChannelInboundHandlerAdapter {

    @Override
    public void userEventTriggered(ChannelHandlerContext ctx, Object evt) throws Exception {
        if (evt instanceof IdleStateEvent) {
            IdleState state = ((IdleStateEvent) evt).state();
            if (state == IdleState.READER_IDLE) {
                ctx.channel().close();
            }
        } else {
            super.userEventTriggered(ctx, evt);
        }
    }
}

服務(wù)端接收到心跳包后要不要回復(fù)缩搅??硼瓣?

看其他博客說不要回復(fù),如果有 10萬空閑連接亿傅,光回復(fù)心跳包就要占用大量資源瘟栖。服務(wù)端讀超時后直接關(guān)閉連接,客戶端再進行重連酬滤。

斷線重連

斷線重連也很簡單就是在 channelInactive 的時候重新 connect 就行了。參考其他博客專門用一個 ChannelInboundHandler 來處理斷線重連氯檐。

@ChannelHandler.Sharable
public class ConnectionWatchDog extends ChannelInboundHandlerAdapter implements TimerTask {
    private final Bootstrap bootstrap;
    private final String host;
    private final int port;
    private volatile boolean reconnect;
    private int attempts;
    private Channel channel;
    private HashedWheelTimer timer = new HashedWheelTimer();
    private int reconnectDelay = 5;

    public ConnectionWatchDog(Bootstrap bootstrap, String host, int port, boolean reconnect) {
        this.bootstrap = bootstrap;
        this.host = host;
        this.port = port;
        this.reconnect = reconnect;
    }

    public Channel getChannel() {
        return this.channel;
    }

    public void channelActive(ChannelHandlerContext ctx) throws Exception {
        System.out.println("channelActive");
        channel = ctx.channel();
        ctx.fireChannelActive();
    }

    public void channelInactive(ChannelHandlerContext ctx) throws Exception {
        System.out.println("channelInactive");
        ctx.fireChannelInactive();
        channel = null;

        if (reconnect) {
            attempts = 0;
            scheduleReconnect();
        }
    }

    private void connect() {
        bootstrap.connect(host, port).addListener((future) -> {
            if (future.isSuccess()) {
                System.out.println("connected to " + host + ":" + port);
                attempts = 0;
            } else {
                System.out.println("connect failed " + attempts + " , to reconnect after " + reconnectDelay + " 秒");
                // 這里現(xiàn)在每5秒重連一次直到連接上冠摄,可自己實現(xiàn)重連邏輯
                scheduleReconnect();
            }
        });
    }

    public void run(Timeout timeout) {
        synchronized (this.bootstrap) {
            ++attempts;
            connect();
        }
    }

    private void scheduleReconnect() {
        timer.newTimeout(this, reconnectDelay, TimeUnit.SECONDS);
    }

    public void setReconnect(boolean reconnect) {
        this.reconnect = reconnect;
    }
}

這個 watchDog Handler 應(yīng)當放在 ChannelPipeline 的最前面

public void connect(String host, int port) {
    Bootstrap bootstrap = new Bootstrap().group(new NioEventLoopGroup())
            .channel(NioSocketChannel.class)
            .option(ChannelOption.TCP_NODELAY, true)
            .option(ChannelOption.CONNECT_TIMEOUT_MILLIS, 5000);

    watchDog = new ConnectionWatchDog(bootstrap, host, port, true);
    bootstrap.handler(new ChannelInitializer<SocketChannel>() {
        @Override
        protected void initChannel(SocketChannel ch) throws Exception {
            ch.pipeline().addLast(watchDog);
            ch.pipeline().addLast(new IdleStateHandler(0, 5, 0, TimeUnit.SECONDS));
            ch.pipeline().addLast(new HeartbeatKeeper());
            ch.pipeline().addLast(new LineBasedFrameDecoder(1024));
            ch.pipeline().addLast(new StringDecoder(CharsetUtil.UTF_8));
            ch.pipeline().addLast(new StringEncoder(CharsetUtil.UTF_8));

            ch.pipeline().addLast(new ClientDemoHandler());
        }
    });

    // 這里如果第一次連接不成功也可以嘗試多次連接
    bootstrap.connect(host, port);
}

客戶端給服務(wù)端發(fā)送心跳包河泳,服務(wù)端用給客戶端發(fā)心跳包嗎拆挥?韵洋??

其實客戶端和服務(wù)端都是相對的搪缨,這個看應(yīng)用場景。如果客戶端想要及時處理斷網(wǎng)负甸,路由故障等情況就需要接受服務(wù)端發(fā)來的心跳來檢測痹届。像斷網(wǎng),路由故障這種情況蚕捉,兩邊都不知道TCP連接的狀態(tài)柴淘,必須靠心跳。長連接服務(wù)端一般都要接收心跳包的为严,如果沒有心跳可能會有大量的無效連接,直接耗盡服務(wù)器資源第股,無效的連接要盡早關(guān)閉掉。

DEMO:
https://github.com/lesliebeijing/Netty-Demo

基于 Netty 寫的一個簡單的推送 DEMO诲锹,可用在手機端推送
https://github.com/lesliebeijing/EncPush

Netty 客戶端用在 Android 中也很穩(wěn)定,我們的物聯(lián)網(wǎng)項目Android和后臺都是用的 Netty改备。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市盐捷,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌聚谁,老刑警劉巖滞诺,帶你破解...
    沈念sama閱讀 219,539評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異朵耕,居然都是意外死亡淋叶,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評論 3 396
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來斟湃,“玉大人,你說我怎么就攤上這事注暗『逶停” “怎么了?”我有些...
    開封第一講書人閱讀 165,871評論 0 356
  • 文/不壞的土叔 我叫張陵屡立,是天一觀的道長。 經(jīng)常有香客問我勇皇,道長焚刺,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,963評論 1 295
  • 正文 為了忘掉前任兄淫,我火速辦了婚禮蔓姚,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘泄私。我一直安慰自己备闲,他們只是感情好,可當我...
    茶點故事閱讀 67,984評論 6 393
  • 文/花漫 我一把揭開白布咧纠。 她就那樣靜靜地躺著觉既,像睡著了一般。 火紅的嫁衣襯著肌膚如雪钧椰。 梳的紋絲不亂的頭發(fā)上符欠,一...
    開封第一講書人閱讀 51,763評論 1 307
  • 那天,我揣著相機與錄音诊沪,去河邊找鬼曾撤。 笑死,一個胖子當著我的面吹牛渐裸,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播昏鹃,決...
    沈念sama閱讀 40,468評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼洞渤,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了讯柔?” 一聲冷哼從身側(cè)響起宪巨,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤溜畅,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后怠晴,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體浴捆,經(jīng)...
    沈念sama閱讀 45,850評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,002評論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了页眯。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,144評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖碌奉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情嫉拐,我是刑警寧澤魁兼,帶...
    沈念sama閱讀 35,823評論 5 346
  • 正文 年R本政府宣布婉徘,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏判哥。R本人自食惡果不足惜献雅,卻給世界環(huán)境...
    茶點故事閱讀 41,483評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望塌计。 院中可真熱鬧挺身,春花似錦、人聲如沸锌仅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽热芹。三九已至贱傀,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間伊脓,已是汗流浹背府寒。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評論 1 272
  • 我被黑心中介騙來泰國打工报腔, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留株搔,地道東北人。 一個月前我還...
    沈念sama閱讀 48,415評論 3 373
  • 正文 我出身青樓纯蛾,卻偏偏與公主長得像纤房,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子翻诉,可洞房花燭夜當晚...
    茶點故事閱讀 45,092評論 2 355