起因:大面積機頂盒點播故障#
最怕遇到的問題就是大量用戶的隨機故障贮预,偏偏又遇到了。一個分前端機房下屬的大量用戶報點播故障契讲。一線報過來的故障現(xiàn)象又混亂仿吞,有說點不了,有說點播頁面進不了捡偏,不一而足唤冈,于是更難判斷故障。
定性:雙向網(wǎng)故障#
先查IPQAM银伟,看上去都好的你虹。報省網(wǎng)查VOD平臺,一如既往的石沉大海彤避。Ping機頂盒IP有些通傅物,有些不通,一會兒通琉预,一會兒不通董饰,最頭疼的隨機故障。
只好搬出FPing大招模孩,對整個網(wǎng)段狂掃尖阔,數(shù)百IP只有個別地址羞羞答答的露個頭,絕大多數(shù)都不可達榨咐。再掃幾次,還是多數(shù)IP還是愛搭不理谴供,更奇怪的是块茁,能Ping通的IP每次都不一樣,麻煩的隨機故障。
排障:EOC貓環(huán)路#
去查網(wǎng)關数焊,網(wǎng)關及以上路由一路暢通永淌。網(wǎng)關側貌似廣播包有點大,可能是廣播風暴佩耳。于是網(wǎng)關往下擼遂蛀,PON口,ONU干厚,真找到一個EOC上來的廣播報文特別多李滴。于是試著關了ONU,F(xiàn)Ping馬上如絲般順快爽滑蛮瞄。打開ONU所坯,終端馬上又吭哧吭哧出不來。蓋棺定論挂捅,罪魁禍首就是它了芹助。
通知一線,找到用戶家闲先,EOC貓的兩個口被一根網(wǎng)線環(huán)起來了状土。
總結:幾個隱患#
- EOC貓兩個口同VLAN
當年為了業(yè)務方便,營銷口要求這么做伺糠,技術口沒有堅持声诸,所以留下隱患 - ONU廣播包限流效果不好
ONU都做了廣播包限流的,無奈設備就是限不住退盯,廠家也給不出說法