Socket是網(wǎng)絡(luò)編程的一個(gè)抽象概念杜跷。通常我們用一個(gè)Socket表示“打開(kāi)了一個(gè)網(wǎng)絡(luò)鏈接”,而打開(kāi)一個(gè)Socket需要知道目標(biāo)計(jì)算機(jī)的IP地址和端口號(hào)苏潜,再指定協(xié)議類(lèi)型即可步责。
客戶端
大多數(shù)連接都是可靠的TCP連接挺尾。創(chuàng)建TCP連接時(shí)鹅搪,主動(dòng)發(fā)起連接的叫客戶端,被動(dòng)響應(yīng)連接的叫服務(wù)器遭铺。
舉個(gè)例子丽柿,當(dāng)我們?cè)跒g覽器中訪問(wèn)新浪時(shí),我們自己的計(jì)算機(jī)就是客戶端魂挂,瀏覽器會(huì)主動(dòng)向新浪的服務(wù)器發(fā)起連接甫题。如果一切順利,新浪的服務(wù)器接受了我們的連接涂召,一個(gè)TCP連接就建立起來(lái)的坠非,后面的通信就是發(fā)送網(wǎng)頁(yè)內(nèi)容了。
所以果正,我們要?jiǎng)?chuàng)建一個(gè)基于TCP連接的Socket炎码,可以這樣做:
# 導(dǎo)入socket庫(kù):
import socket
# 創(chuàng)建一個(gè)socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立連接:
s.connect(('www.sina.com.cn', 80))```
創(chuàng)建Socket時(shí)盟迟,AF_INET指定使用IPv4協(xié)議,如果要用更先進(jìn)的IPv6潦闲,就指定為AF_INET6攒菠。SOCK_STREAM指定使用面向流的TCP協(xié)議,這樣歉闰,一個(gè)Socket對(duì)象就創(chuàng)建成功辖众,但是還沒(méi)有建立連接。
客戶端要主動(dòng)發(fā)起TCP連接和敬,必須知道服務(wù)器的IP地址和端口號(hào)凹炸。新浪網(wǎng)站的IP地址可以用域名www.sina.com.cn自動(dòng)轉(zhuǎn)換到IP地址,但是怎么知道新浪服務(wù)器的端口號(hào)呢昼弟?
答案是作為服務(wù)器还惠,提供什么樣的服務(wù),端口號(hào)就必須固定下來(lái)私杜。由于我們想要訪問(wèn)網(wǎng)頁(yè),因此新浪提供網(wǎng)頁(yè)服務(wù)的服務(wù)器必須把端口號(hào)固定在80端口救欧,因?yàn)?0端口是Web服務(wù)的標(biāo)準(zhǔn)端口衰粹。其他服務(wù)都有對(duì)應(yīng)的標(biāo)準(zhǔn)端口號(hào),例如SMTP服務(wù)是25端口笆怠,F(xiàn)TP服務(wù)是21端口铝耻,等等。端口號(hào)小于1024的是Internet標(biāo)準(zhǔn)服務(wù)的端口蹬刷,端口號(hào)大于1024的瓢捉,可以任意使用。
因此办成,我們連接新浪服務(wù)器的代碼如下:
`s.connect(('www.sina.com.cn', 80))`
注意參數(shù)是一個(gè)tuple泡态,包含地址和端口號(hào)。
建立TCP連接后迂卢,我們就可以向新浪服務(wù)器發(fā)送請(qǐng)求某弦,要求返回首頁(yè)的內(nèi)容:
發(fā)送數(shù)據(jù):
s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')```
TCP連接創(chuàng)建的是雙向通道,雙方都可以同時(shí)給對(duì)方發(fā)數(shù)據(jù)而克。但是誰(shuí)先發(fā)誰(shuí)后發(fā)靶壮,怎么協(xié)調(diào),要根據(jù)具體的協(xié)議來(lái)決定员萍。例如腾降,HTTP協(xié)議規(guī)定客戶端必須先發(fā)請(qǐng)求給服務(wù)器,服務(wù)器收到后才發(fā)數(shù)據(jù)給客戶端碎绎。
發(fā)送的文本格式必須符合HTTP標(biāo)準(zhǔn)螃壤,如果格式?jīng)]問(wèn)題抗果,接下來(lái)就可以接收新浪服務(wù)器返回的數(shù)據(jù)了:
# 接收數(shù)據(jù):
buffer = []
while True:
# 每次最多接收1k字節(jié):
d = s.recv(1024)
if d:
buffer.append(d)
else:
break
data = b''.join(buffer)```
接收數(shù)據(jù)時(shí),調(diào)用recv(max)方法映穗,一次最多接收指定的字節(jié)數(shù)窖张,因此,在一個(gè)while循環(huán)中反復(fù)接收蚁滋,直到recv()返回空數(shù)據(jù)宿接,表示接收完畢,退出循環(huán)辕录。
當(dāng)我們接收完數(shù)據(jù)后睦霎,調(diào)用close()方法關(guān)閉Socket,這樣走诞,一次完整的網(wǎng)絡(luò)通信就結(jié)束了:
關(guān)閉連接:
s.close()```
接收到的數(shù)據(jù)包括HTTP頭和網(wǎng)頁(yè)本身副女,我們只需要把HTTP頭和網(wǎng)頁(yè)分離一下,把HTTP頭打印出來(lái)蚣旱,網(wǎng)頁(yè)內(nèi)容保存到文件:
header, html = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
# 把接收的數(shù)據(jù)寫(xiě)入文件:
with open('sina.html', 'wb') as f:
f.write(html)```
現(xiàn)在碑幅,只需要在瀏覽器中打開(kāi)這個(gè)sina.html文件,就可以看到新浪的首頁(yè)了塞绿。
>服務(wù)器
和客戶端編程相比沟涨,服務(wù)器編程就要復(fù)雜一些。
服務(wù)器進(jìn)程首先要綁定一個(gè)端口并監(jiān)聽(tīng)來(lái)自其他客戶端的連接异吻。如果某個(gè)客戶端連接過(guò)來(lái)了裹赴,服務(wù)器就與該客戶端建立Socket連接,隨后的通信就靠這個(gè)Socket連接了诀浪。
所以棋返,服務(wù)器會(huì)打開(kāi)固定端口(比如80)監(jiān)聽(tīng),每來(lái)一個(gè)客戶端連接雷猪,就創(chuàng)建該Socket連接睛竣。由于服務(wù)器會(huì)有大量來(lái)自客戶端的連接,所以求摇,服務(wù)器要能夠區(qū)分一個(gè)Socket連接是和哪個(gè)客戶端綁定的酵颁。一個(gè)Socket依賴4項(xiàng):服務(wù)器地址、服務(wù)器端口月帝、客戶端地址躏惋、客戶端端口來(lái)唯一確定一個(gè)Socket。
但是服務(wù)器還需要同時(shí)響應(yīng)多個(gè)客戶端的請(qǐng)求嚷辅,所以簿姨,每個(gè)連接都需要一個(gè)新的進(jìn)程或者新的線程來(lái)處理,否則,服務(wù)器一次就只能服務(wù)一個(gè)客戶端了扁位。
我們來(lái)編寫(xiě)一個(gè)簡(jiǎn)單的服務(wù)器程序准潭,它接收客戶端連接,把客戶端發(fā)過(guò)來(lái)的字符串加上Hello再發(fā)回去域仇。
首先刑然,創(chuàng)建一個(gè)基于IPv4和TCP協(xié)議的Socket:
`s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)`
然后,我們要綁定監(jiān)聽(tīng)的地址和端口暇务。服務(wù)器可能有多塊網(wǎng)卡泼掠,可以綁定到某一塊網(wǎng)卡的IP地址上,也可以用0.0.0.0綁定到所有的網(wǎng)絡(luò)地址垦细,還可以用127.0.0.1綁定到本機(jī)地址择镇。127.0.0.1是一個(gè)特殊的IP地址,表示本機(jī)地址括改,如果綁定到這個(gè)地址腻豌,客戶端必須同時(shí)在本機(jī)運(yùn)行才能連接,也就是說(shuō)嘱能,外部的計(jì)算機(jī)無(wú)法連接進(jìn)來(lái)吝梅。
端口號(hào)需要預(yù)先指定。因?yàn)槲覀儗?xiě)的這個(gè)服務(wù)不是標(biāo)準(zhǔn)服務(wù)惹骂,所以用9999這個(gè)端口號(hào)苏携。請(qǐng)注意,小于1024的端口號(hào)必須要有管理員權(quán)限才能綁定:
監(jiān)聽(tīng)端口:
s.bind(('127.0.0.1', 9999))```
緊接著析苫,調(diào)用listen()方法開(kāi)始監(jiān)聽(tīng)端口,傳入的參數(shù)指定等待連接的最大數(shù)量:
s.listen(5)
print('Waiting for connection...')```
接下來(lái)穿扳,服務(wù)器程序通過(guò)一個(gè)永久循環(huán)來(lái)接受來(lái)自客戶端的連接衩侥,accept()會(huì)等待并返回一個(gè)客戶端的連接:
while True:
# 接受一個(gè)新連接:
sock, addr = s.accept()
# 創(chuàng)建新線程來(lái)處理TCP連接:
t = threading.Thread(target=tcplink, args=(sock, addr))
t.start()```
每個(gè)連接都必須創(chuàng)建新線程(或進(jìn)程)來(lái)處理,否則矛物,單線程在處理連接的過(guò)程中茫死,無(wú)法接受其他客戶端的連接:
def tcplink(sock, addr):
print('Accept new connection from %s:%s...' % addr)
sock.send(b'Welcome!')
while True:
data = sock.recv(1024)
time.sleep(1)
if not data or data.decode('utf-8') == 'exit':
break
sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
sock.close()
print('Connection from %s:%s closed.' % addr)```
連接建立后,服務(wù)器首先發(fā)一條歡迎消息履羞,然后等待客戶端數(shù)據(jù)峦萎,并加上Hello再發(fā)送給客戶端。如果客戶端發(fā)送了exit字符串忆首,就直接關(guān)閉連接爱榔。
要測(cè)試這個(gè)服務(wù)器程序,我們還需要編寫(xiě)一個(gè)客戶端程序:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
建立連接:
s.connect(('127.0.0.1', 9999))
接收歡迎消息:
print(s.recv(1024).decode('utf-8'))
for data in [b'Michael', b'Tracy', b'Sarah']:
# 發(fā)送數(shù)據(jù):
s.send(data)
print(s.recv(1024).decode('utf-8'))
s.send(b'exit')
s.close()```
我們需要打開(kāi)兩個(gè)命令行窗口糙及,一個(gè)運(yùn)行服務(wù)器程序详幽,另一個(gè)運(yùn)行客戶端程序,就可以看到效果了:
需要注意的是,客戶端程序運(yùn)行完畢就退出了唇聘,而服務(wù)器程序會(huì)永遠(yuǎn)運(yùn)行下去版姑,必須按Ctrl+C退出程序。