上一節(jié)內(nèi)容中,我們通過Python進(jìn)行了電子郵件發(fā)送功能的處理
本節(jié)內(nèi)容內(nèi)容主要講解接收郵件功能的處理
通過SMTP協(xié)議發(fā)送郵件,我們通過POP3協(xié)議接收郵件
回顧一下郵件發(fā)送的過程
電子郵件 -> MUA -> MTA -> ...MTA -> MDA <- MUA <- 電子郵件
我們發(fā)送郵件主要實(shí)現(xiàn)的是MUA->MTA的過程
使用的模塊如下
smtplib
email.header.Header
email.utils.parseaddr/formataddr
email.mime.mutipart.MIMEMultipart
email.mime.base.MMEBase
email.mime.text.MIMEText
本節(jié)內(nèi)容
- POP3協(xié)議簡(jiǎn)介
- 收取郵件
1. POP3協(xié)議簡(jiǎn)介
1.1簡(jiǎn)介
POP3協(xié)議康谆,全名為Post Office Protocol - Vesion 3,郵局協(xié)議 版本3
POP3協(xié)議是TCP/IP協(xié)議族中的一種坟奥,由RFC1939定義
協(xié)議主要用于支持使用客戶端遠(yuǎn)程管理在服務(wù)器上的電子郵件
提供了SSL加密的POP3協(xié)議被稱為POP3S
POP協(xié)議主持離線有限處理蜈抓,通常情況下郵件發(fā)送到服務(wù)器上,電子郵件客戶端將郵件從郵件服務(wù)器獲取到個(gè)人終PC上跋破,郵件服務(wù)器上的郵件會(huì)被刪除簸淀;目前POP3郵件服務(wù)器大部分可以獲取郵件的同時(shí)不刪除服務(wù)器上的郵件
1.2特性
默認(rèn)端口:110
默認(rèn)傳輸協(xié)議:TCP
使用的軟件結(jié)構(gòu):C/S
訪問模式:離線訪問
1.3 POP3常見命令碼
POP3常見命令碼
1.4 python中使用POP3
python中提供了poplib模塊用于進(jìn)行POP3協(xié)議的支持
核心的處理過程主要是如下兩個(gè)步驟
- 使用poplib模塊接收郵件
- 使用email模塊解析郵件
2. POP3讀取郵箱信息
常規(guī)操作步驟:
- 定義連接pop3服務(wù)器的信息
- 連接pop3服務(wù)器
- 登錄pop3服務(wù)器
- 獲取郵件服務(wù)器中郵件的信息【數(shù)量、大小毒返、列表等等】
import poplib
# 服務(wù)器連接信息
pop_user = "xxxxxxxxx@qq.com"
pop_pass = "這里請(qǐng)使用您的授權(quán)碼"
pop_server = "pop.qq.com"
# 連接到pop3服務(wù)器
print("開始連接pop3服務(wù)器")
server = poplib.POP3_SSL(pop_server)
print("連接服務(wù)器成功")
# 設(shè)置打印調(diào)試信息
server.set_debuglevel(1)
# 設(shè)置打印pop3服務(wù)歡迎文字
print(server.getwelcome().decode("utf-8"))
# 登錄服務(wù)器
print("準(zhǔn)備登錄POP服務(wù)器")
server.user(pop_user)
server.pass_(pop_pass)
print("登錄身份驗(yàn)證成功租幕,準(zhǔn)備獲取郵件信息")
# stat()返回郵件數(shù)量和占用空間
print("郵件數(shù)量:%s, 大信◆ぁ:%s" % server.stat())
print("~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~")
# 返回郵件詳細(xì)列表信息mails
resp, mails, octets = server.list()
print(resp)
print(mails)
print(octets)
# 退出服務(wù)器
server.quit()
上述代碼執(zhí)行完成后劲绪,會(huì)出現(xiàn)如下結(jié)果:
注意:下面出現(xiàn)*cmd*字樣的是調(diào)試信息,其中出現(xiàn)的類似USER/PASS等都是POP3的命令碼盆赤,可以參考前面的命令碼部分了解一下
開始連接pop3服務(wù)器
連接服務(wù)器成功
+OK QQMail POP3 Server v1.0 Service Ready(QQMail v2.0)
準(zhǔn)備登錄POP服務(wù)器
cmd 'USER 1007821300@qq.com'
cmd 'PASS kyecgawxkkupbegh'
登錄身份驗(yàn)證成功贾富,準(zhǔn)備獲取郵件信息
cmd 'STAT'
stat [b'+OK', b'105', b'3796095']
郵件數(shù)量:105, 大形:3796095
~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
cmd 'LIST'
b'+OK'
[b'1 36817', b'2 27060', b'3 1860', b'4 63794', b'5 73282', b'6 5360', b'7 35188', b'8 19933', b'82 7118',·······b'100 2329', b'101 36325', b'102 28107', b'103 28090', b'104 29170', b'105 28088']
984
cmd 'QUIT'
3. POP3讀取最新的一封普通文本郵件
我們使用上一節(jié)中的發(fā)送郵件的代碼發(fā)送一份純文本的或者帶了HTML標(biāo)簽的郵件颤枪,然后在下面的代碼中接收一下這份郵件
# 引入需要的模塊
import email, poplib
from email.parser import Parser
from email.utils import parseaddr
from email.header import decode_header
# 服務(wù)器連接信息
pop_server = "pop.qq.com"
pop_user = "xxxxxxxx@qq.com"
pop_pass = "此處請(qǐng)使用授權(quán)碼"
# 連接pop服務(wù)器
server = pop.POP3_SSL(pop_server)
# 登錄pop服務(wù)器,進(jìn)行身份驗(yàn)證
server.user(pop_user)
server.pass_(pop_pass)
# 獲取郵件服務(wù)器上的郵件的信息
email_msg = server.stat()
# 獲取最新的一份郵件
# 注意:接收的郵件是按照索引進(jìn)行排序的兔乞,這里的索引是1開始的
resp, lines, octets = server.retr(email_msg[0])
# 拼接完整郵件
email_content = b"\r\n".join(lines).decode("UTF-8")
# 解析郵件標(biāo)題
title = email_content.get("Subject")
if title :
value, charset = decode_header(title)[0]
if charset:
title = value.decode(charset)
# 解析發(fā)件人信息
sender = email_content.get("From")
if sender:
value, addr = parseaddr(sender)
name, charset = decode_header(value)
if charset:
name = ame.decode(charset)
sender = u"%s <%s>" % (name, addr)
# 解析收件人信息
receiver = email_content.get("To")
if receiver:
value, addr = parseaddr(receiver)
name, charset = decode_header(value)
if charset:
name = name.decode(charset)
receiver = u"%s <%s>" % (name, addr)
# 解析郵件內(nèi)容
content = email_content.get_payload(decode=True)
content = content.decode("UTF-8")
# 打印郵件內(nèi)容
print("郵件標(biāo)題:%s" % title)
print("發(fā)件人:%s" % sender)
print("收件人:%s" % receiver)
print("郵件內(nèi)容:%s" % content)
# 退出郵件服務(wù)器
server.quit()
執(zhí)行上述代碼汇鞭,運(yùn)行結(jié)果如下:
郵件標(biāo)題:來自大牧莫邪的問候
發(fā)件人: 大牧莫邪 xxxxxxxx@qq.com
收件人:木木 xxxxxxxxx@qq.com
郵件內(nèi)容:Hello 你好,這是一封自動(dòng)發(fā)送的測(cè)試郵件
我們針對(duì)上面的代碼最一下簡(jiǎn)單的了解
郵件的標(biāo)題凉唐、發(fā)件人、收件人霍骄,對(duì)應(yīng)的是郵件內(nèi)容中的Subject,From,To台囱,這三個(gè)數(shù)據(jù)我們?cè)趯W(xué)習(xí)完發(fā)送郵件部分之后已經(jīng)了解到,是通過編碼進(jìn)行處理過的读整,所以我們要對(duì)這樣的編碼進(jìn)行解碼簿训,解碼的過程比較簡(jiǎn)單,通過如下的代碼就可以進(jìn)行解碼的處理:
# 引入解碼需要的模塊
>from email.header import decode_header
from email.utils import parseaddr
> # 定義一個(gè)函數(shù)米间,用于解析郵件內(nèi)容
>def decode_msg(msg)
# 解析郵件標(biāo)題强品、發(fā)件人、收件人
> for info in ["Subject", "From", "To"]:
value = msg.get(info)
# 解析郵件標(biāo)題
if info == "Subject":
# 標(biāo)題不含特殊格式屈糊,直接解碼
name, charset = decode_header(value)[0]
value = name.decode(charset)
else:
# 發(fā)件人的榛、收件人格式特殊,使用parseaddr解析之后再進(jìn)行解碼
value, addr = parseaddr(msg)
name, charset = decode_header(value)[0]
value = name.decode_header(charset)
>```
> 接下來就是內(nèi)容的解析了逻锐,關(guān)于郵件內(nèi)容的處理夫晌,我們從前面的發(fā)送郵件就知道,郵件內(nèi)容主要是普通文本郵件包裝的服務(wù)類MIMEText或者是帶了附件的混合服務(wù)類MIMEMultipart昧诱,針對(duì)郵件的處理晓淀,只需要將郵件內(nèi)容解析為Message對(duì)象,在后續(xù)處理過程中就可以方便的進(jìn)行格式化盏档,解析非常簡(jiǎn)單
引入解析需要的模塊
from email.parser import Parser
解析郵件內(nèi)容
content = Parse().parsestr(email_content)
### 4. POP3讀取最新的帶附件的郵件
某些情況下凶掰,我們的郵件內(nèi)容是帶附件的,是通過MIMEMultipart對(duì)象包含的郵件內(nèi)容和附件蜈亩,我們通常情況下懦窘,需要對(duì)MIMEMultipart對(duì)象進(jìn)行遍歷,對(duì)其中的MIMEText對(duì)象表示的郵件內(nèi)容和MIMEBase對(duì)象表示的附件內(nèi)容進(jìn)行分別解析勺拣。
廢話不多說奶赠,上干貨:
第一步:分清楚什么是郵件標(biāo)題、發(fā)件人药有、收件人毅戈;什么是郵件內(nèi)容;什么是郵件附件
通過`is_multipart()`函數(shù)來區(qū)分郵件是否是混合郵件
通過`get_content_type()`函數(shù)來區(qū)分郵件是否是內(nèi)容/附件
引入需要的模塊
import email, poplib
from email.parser import Parser
from email.utils import parseaddr
from email.header import decode_header
定義解析郵件內(nèi)容的函數(shù)
def decode_mail(msg):
# 解析郵件標(biāo)題愤惰、發(fā)件人苇经、收件人信息
for info in ["Subject", "From", "To"]:
value = msg.get(info)
if info == "Subject":# 解析郵件標(biāo)題
title = decode_info(value)
else:# 解析發(fā)件人、收件人信息
name, addr = parseaddr(value)
sender = decode_info(name)
sender = "%s <%s>" % (name, addr)
# 如果郵件是MIMEMultipart混合內(nèi)容宦言,執(zhí)行遞歸處理
if(msg.is_multipart()):
parts = msg.get_payload()
for n, part in enumerate(parts):
print(n, part)
# 遞歸解析郵件
decode_mail(part)
else:
# 獲取郵件編碼格式
content_type = msg.get_content_type();
# 判斷編碼并解碼
if content_type == "text/plain" or content_type == "text/html":
content = "這是郵件內(nèi)容"
else:
content = "這是郵件附件"
decode_header解碼操作函數(shù)
def decode_info(info):
name, charset = decode_header(info)
if charset:
name = name.decode(charset)
return name
> 上面的代碼中扇单,我們定義了函數(shù)`decode_mail(msg)`來進(jìn)行郵件內(nèi)容的解析處理
主要包含三部分內(nèi)容
> 1.首先解析郵件標(biāo)題、發(fā)件人奠旺、收件人這樣的特殊的信息
> 2.根據(jù)`is_multipart()`函數(shù)區(qū)分是否混合郵件
> 3.根據(jù)`msg.get_content_type()`函數(shù)進(jìn)行郵件內(nèi)容和附件的區(qū)分處理
---
未完待續(xù)蜘澜,敬請(qǐng)期待~~
![大牧莫邪.png](http://upload-images.jianshu.io/upload_images/5988045-cc086acf5134c20e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)