RPC是指遠(yuǎn)程過程調(diào)用锌蓄,也就是說兩臺服務(wù)器A,B撑柔,一個應(yīng)用部署在A服務(wù)器上瘸爽,想要調(diào)用B服務(wù)器上應(yīng)用提供的函數(shù)/方法,由于不在一個內(nèi)存空間铅忿,不能直接調(diào)用蝶糯,需要通過網(wǎng)絡(luò)來表達(dá)調(diào)用的語義和傳達(dá)調(diào)用的數(shù)據(jù)。
為什么要用RPC呢辆沦?就是無法在一個進(jìn)程內(nèi)昼捍,甚至一個計(jì)算機(jī)內(nèi)通過本地調(diào)用的方式完成的需求,比如不同的系統(tǒng)間的通訊肢扯,甚至不同的組織間的通訊妒茬,由于計(jì)算能力需要橫向擴(kuò)展,需要在多臺機(jī)器組成的集群上部署應(yīng)用蔚晨。
RPC就是要像調(diào)用本地的函數(shù)一樣去調(diào)遠(yuǎn)程函數(shù)乍钻。在研究RPC前,我們先看看本地調(diào)用是怎么調(diào)的铭腕。假設(shè)我們要調(diào)用函數(shù)Multiply來計(jì)算lvalue * rvalue的結(jié)果:
1 int Multiply(int l, int r) {
2 int y = l * r;
3 return y;
4 }
5
6 int lvalue = 10;
7 int rvalue = 20;
8 int l_times_r = Multiply(lvalue, rvalue);
那么在第8行時银择,我們實(shí)際上執(zhí)行了以下操作:
將 lvalue 和 rvalue 的值壓棧
進(jìn)入Multiply函數(shù),取出棧中的值10 和 20累舷,將其賦予 l 和 r
執(zhí)行第2行代碼浩考,計(jì)算 l * r ,并將結(jié)果存在 y
將 y 的值壓棧被盈,然后從Multiply返回
第8行析孽,從棧中取出返回值 200 搭伤,并賦值給 l_times_r
以上5步就是執(zhí)行本地調(diào)用的過程。
在遠(yuǎn)程調(diào)用時袜瞬,我們需要執(zhí)行的函數(shù)體是在遠(yuǎn)程的機(jī)器上的怜俐,也就是說,Multiply是在另一個進(jìn)程中執(zhí)行的邓尤。這就帶來了幾個新問題:
Call ID映射拍鲤。我們怎么告訴遠(yuǎn)程機(jī)器我們要調(diào)用Multiply,而不是Add或者FooBar呢汞扎?在本地調(diào)用中殿漠,函數(shù)體是直接通過函數(shù)指針來指定的,我們調(diào)用Multiply佩捞,編譯器就自動幫我們調(diào)用它相應(yīng)的函數(shù)指針绞幌。但是在遠(yuǎn)程調(diào)用中,函數(shù)指針是不行的一忱,因?yàn)閮蓚€進(jìn)程的地址空間是完全不一樣的莲蜘。所以,在RPC中帘营,所有的函數(shù)都必須有自己的一個ID票渠。這個ID在所有進(jìn)程中都是唯一確定的》移客戶端在做遠(yuǎn)程過程調(diào)用時问顷,必須附上這個ID。然后我們還需要在客戶端和服務(wù)端分別維護(hù)一個 {函數(shù) <--> Call ID} 的對應(yīng)表禀梳。兩者的表不一定需要完全相同杜窄,但相同的函數(shù)對應(yīng)的Call ID必須相同。當(dāng)客戶端需要進(jìn)行遠(yuǎn)程調(diào)用時算途,它就查一下這個表塞耕,找出相應(yīng)的Call ID,然后把它傳給服務(wù)端嘴瓤,服務(wù)端也通過查表扫外,來確定客戶端需要調(diào)用的函數(shù),然后執(zhí)行相應(yīng)函數(shù)的代碼廓脆。序列化和反序列化筛谚。客戶端怎么把參數(shù)值傳給遠(yuǎn)程的函數(shù)呢停忿?在本地調(diào)用中驾讲,我們只需要把參數(shù)壓到棧里,然后讓函數(shù)自己去棧里讀就行。但是在遠(yuǎn)程過程調(diào)用時蝎毡,客戶端跟服務(wù)端是不同的進(jìn)程厚柳,不能通過內(nèi)存來傳遞參數(shù)氧枣。甚至有時候客戶端和服務(wù)端使用的都不是同一種語言(比如服務(wù)端用C++沐兵,客戶端用Java或者Python)。這時候就需要客戶端把參數(shù)先轉(zhuǎn)成一個字節(jié)流便监,傳給服務(wù)端后扎谎,再把字節(jié)流轉(zhuǎn)成自己能讀取的格式。這個過程叫序列化和反序列化烧董。同理毁靶,從服務(wù)端返回的值也需要序列化反序列化的過程。網(wǎng)絡(luò)傳輸逊移。遠(yuǎn)程調(diào)用往往用在網(wǎng)絡(luò)上预吆,客戶端和服務(wù)端是通過網(wǎng)絡(luò)連接的。所有的數(shù)據(jù)都需要通過網(wǎng)絡(luò)傳輸胳泉,因此就需要有一個網(wǎng)絡(luò)傳輸層拐叉。網(wǎng)絡(luò)傳輸層需要把Call ID和序列化后的參數(shù)字節(jié)流傳給服務(wù)端,然后再把序列化后的調(diào)用結(jié)果傳回客戶端扇商。只要能完成這兩者的凤瘦,都可以作為傳輸層使用。因此案铺,它所使用的協(xié)議其實(shí)是不限的蔬芥,能完成傳輸就行。盡管大部分RPC框架都使用TCP協(xié)議控汉,但其實(shí)UDP也可以笔诵,而gRPC干脆就用了HTTP2。Java的Netty也屬于這層的東西姑子。
所以嗤放,要實(shí)現(xiàn)一個RPC框架,其實(shí)只需要把以上三點(diǎn)實(shí)現(xiàn)了就基本完成了壁酬。Call ID映射可以直接使用函數(shù)字符串次酌,也可以使用整數(shù)ID。映射表一般就是一個哈希表舆乔。序列化反序列化可以自己寫岳服,也可以使用Protobuf或者FlatBuffers之類的。網(wǎng)絡(luò)傳輸庫可以自己寫socket希俩,或者用asio吊宋,ZeroMQ,Netty之類颜武。
作者:洪春濤
鏈接:https://www.zhihu.com/question/25536695/answer/221638079
來源:知乎
著作權(quán)歸作者所有璃搜。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán)拖吼,非商業(yè)轉(zhuǎn)載請注明出處。