在公司里做的一個接口系統(tǒng),主要是對接第三方的系統(tǒng)接口铭若,所以递览,這個系統(tǒng)里會和很多其他公司的項目交互。隨之而來一個很蛋疼的問題镜雨,這么多公司的接口冷离,不同公司接口的穩(wěn)定性差別很大纯命,訪問量大的時候亿汞,有的不怎么行的接口就各種出錯了疗我。
這個接口系統(tǒng)剛剛開發(fā)不久南捂,整個系統(tǒng)中溺健,處于比較邊緣的位置,不像其他項目剖膳,有日志庫,還有短信告警甸饱,一旦出問題叹话,很多情況下都是用戶反饋回來墩瞳,所以矗烛,我的想法是,拿起python碌嘀,為這個項目寫一個監(jiān)控歪架。如果在調(diào)用某個第三方接口的過程中和蚪,大量出錯了,說明這個接口有有問題了怯疤,就可以更快的采取措施集峦。
項目的也是有日志庫的抠刺,所有的info,error日志都是每隔一分鐘掃描入庫高蜂,日志庫是用的mysql备恤,表里有幾個特別重要的字段:
level?日志級別
message?日志內(nèi)容
file_name?Java代碼文件
log_time?日志時間
有日志庫,就不用自己去線上環(huán)境掃日志分析了湘纵,直接從日志庫入手滤淳。由于日志庫在線上時每隔1分鐘掃,那我就去日志庫每隔2分鐘掃一次铺敌,如果掃到有一定數(shù)量的error日志就報警偿凭,如果只有一兩條錯誤就可以無視了派歌,也就是短時間爆發(fā)大量錯誤日志,就可以斷定系統(tǒng)有問題了匾嘱。報警方式就用發(fā)送郵件霎烙,所以蕊连,需要做下面幾件事情:
操1.作MySql甘苍。
2.發(fā)送郵件。
3.定時任務(wù)趟佃。
4.日志。
5.運行腳本罐寨。
明確了以上幾件事情,就可以動手了跋破。
操作數(shù)據(jù)庫
使用MySQLdb這個驅(qū)動,直接操作數(shù)據(jù)庫租幕,主要就是查詢操作冀膝。
獲取數(shù)據(jù)庫的連接:
def?get_con():????host?=?"127.0.0.1"????port?=?3306????logsdb?=?"logsdb"????user?=?"root"????password?=?"never?tell?you"????con?=?MySQLdb.connect(host=host,?user=user,?passwd=password,?db=logsdb,?port=port,?charset="utf8")????return?con
從日志庫里獲取數(shù)據(jù)爵卒,獲取當(dāng)前時間之前2分鐘的數(shù)據(jù)蓝撇,首先牺六,根據(jù)當(dāng)前時間進(jìn)行計算一下時間
def?calculate_time():????now?=?datetime.now()????now_min?=?now.minute????if?now_min?<?2:????????now_min?+=?60?-?2????else:????????now_min?-=?2????return?now.replace(minute=now_min).strftime("%Y-%m-%d?%H:%M:%S")
然后,根據(jù)時間和日志級別去日志庫查詢數(shù)據(jù)
def?get_data():????select_time?=?calculate_time()????logger.info("select?time:"+select_time)????sql?=?"select?file_name,message?from?logsdb.app_logs_record?"???????????"where?log_time?>"+"'"+select_time+"'"???????????"and?level="+"'ERROR'"???????????"order?by?log_time?desc"????conn?=?get_con()????cursor?=?conn.cursor()????cursor.execute(sql)????results?=?cursor.fetchall()????cursor.close()????conn.close()????return?results
發(fā)送郵件
使用python發(fā)送郵件比較簡單畏纲,使用標(biāo)準(zhǔn)庫smtplib就可以
這里使用163郵箱進(jìn)行發(fā)送盗胀,你可以使用其他郵箱或者企業(yè)郵箱都行读整,不過host和port要設(shè)置正確咱娶。
def?send_email(content):
sender?=?"sender_monitor@163.com"????receiver?=?["rec01@163.com",?"rec02@163.com"]????host?=?'smtp.163.com'????port?=?465????msg?=?MIMEText(content)????msg['From']?=?"sender_monitor@163.com"????msg['To']?=?"rec01@163.com,rec02@163.com"????msg['Subject']?=?"system?error?warning"????try:????????smtp?=?smtplib.SMTP_SSL(host,?port)????????smtp.login(sender,?'123456')????????smtp.sendmail(sender,?receiver,?msg.as_string())????????logger.info("send?email?success")????except?Exception,?e:????????logger.error(e)
定時任務(wù)
使用一個單獨的線程膘侮,每2分鐘掃描一次琼了,如果ERROR級別的日志條數(shù)超過5條,就發(fā)郵件通知昧诱。
def?task():????while?True:????????logger.info("monitor?running")????????results?=?get_data()????????if?results?is?not?None?and?len(results)?>?5:????????????content?=?"recharge?error:"????????????logger.info("a?lot?of?error,so?send?mail")????????????for?r?in?results:????????????????content?+=?r[1]+'
'????????????send_email(content)????????sleep(2*60)
日志
為這個小小的腳本配置一下日志log.py盏档,讓日志可以輸出到文件和控制臺中燥爷。
# coding=utf-8
import logging
logger = logging.getLogger('mylogger')
logger.setLevel(logging.DEBUG)
fh = logging.FileHandler('monitor.log')
fh.setLevel(logging.INFO)
ch = logging.StreamHandler()
ch.setLevel(logging.INFO)
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
fh.setFormatter(formatter)
ch.setFormatter(formatter)
logger.addHandler(fh)
logger.addHandler(ch)
所以,最后稚配,這個監(jiān)控小程序就是這樣的app_monitor.py
# coding=utf-8
import threading
import MySQLdb
from datetime import datetime
from time import sleep
import smtplib
from email.mime.text import MIMEText
from log import logger
def get_con():
host = "127.0.0.1"
port = 3306
logsdb = "logsdb"
user = "root"
password = "never tell you"
con = MySQLdb.connect(host=host, user=user, passwd=password, db=logsdb, port=port, charset="utf8")
return con
def calculate_time():
now = datetime.now()
now_min = now.minute
if now_min < 2:
now_min += 60 - 2
else:
now_min -= 2
return now.replace(minute=now_min).strftime("%Y-%m-%d %H:%M:%S")
def get_data():
select_time = calculate_time()
logger.info("select time:"+select_time)
sql = "select file_name,message from logsdb.app_logs_record "
"where log_time >"+"'"+select_time+"'"
"and level="+"'ERROR'"
"order by log_time desc"
conn = get_con()
cursor = conn.cursor()
cursor.execute(sql)
results = cursor.fetchall()
cursor.close()
conn.close()
return results
def send_email(content):
sender = "sender_monitor@163.com"
receiver = ["rec01@163.com", "rec02@163.com"]
host = 'smtp.163.com'
port = 465
msg = MIMEText(content)
msg['From'] = "sender_monitor@163.com"
msg['To'] = "rec01@163.com,rec02@163.com"
msg['Subject'] = "system error warning"
try:
smtp = smtplib.SMTP_SSL(host, port)
smtp.login(sender, '123456')
smtp.sendmail(sender, receiver, msg.as_string())
logger.info("send email success")
except Exception, e:
logger.error(e)
def task():
while True:
logger.info("monitor running")
results = get_data()
if results is not None and len(results) > 5:
content = "recharge error:"
logger.info("a lot of error,so send mail")
for r in results:
content += r[1]+' '
send_email(content)
sleep(2*60)
def run_monitor():
monitor = threading.Thread(target=task)
monitor.start()
if __name__ == "__main__":
run_monitor()
運行腳本
腳本在服務(wù)器上運行午衰,使用supervisor進(jìn)行管理苇经。
在服務(wù)器(centos6)上安裝supervisor扇单,然后在/etc/supervisor.conf中加入一下配置
[program:app-monitor]
command = python /root/monitor/app_monitor.py
directory = /root/monitor
user = root
然后在終端中運行supervisord啟動supervisor奠旺。
在終端中運行supervisorctl,進(jìn)入shell响疚,運行status查看腳本的運行狀態(tài)。
總結(jié)
這個小監(jiān)控思路很清晰装诡,還可以繼續(xù)修改践盼,比如:監(jiān)控特定的接口,發(fā)送短信通知等等渔伯。
因為有日志庫肄程,就少了去線上正式環(huán)境掃描日志的麻煩,所以玄叠,如果沒有日志庫拓提,就要自己上線上環(huán)境掃描,在正式線上環(huán)境一定要小心哇~你的想法再精彩狐粱,那是想法的價值
而你的價值肌蜻,永遠(yuǎn)體現(xiàn)在行動之中
如果還停留在想的價值中必尼,請趕快行動,
如果你學(xué)習(xí)還停止在原處判莉,請咨詢我?guī)椭汩_始我有建立一個python學(xué)習(xí)交流群券盅,在群里我們相互幫助,相互關(guān)心娘侍,相互分享內(nèi)容泳炉,這樣出問題幫助你的人就比較多,群號是301氧腰,還有056刨肃,最后是051之景,這樣就可以找到大神聚合的群,如果你只愿意別人幫助你锻狗,不愿意分享或者幫助別人轻纪,那就請不要加了,你把你會的告訴別人這是一種分享潦嘶。