DNS解析是一種非常常見的解析方式岂傲,來看一下百度百科的說明:
DNS(Domain Name System,域名系統(tǒng))子檀,因特網(wǎng)上作為域名和IP地址相互映射的一個分布式數(shù)據(jù)庫镊掖,能夠使用戶更方便的訪問互聯(lián)網(wǎng),而不用去記住能夠被機(jī)器直接讀取的IP數(shù)串褂痰。通過主機(jī)名亩进,最終得到該主機(jī)名對應(yīng)的IP地址的過程叫做域名解析(或主機(jī)名解析)。DNS協(xié)議運(yùn)行在UDP協(xié)議之上缩歪,使用端口號53归薛。在RFC文檔中RFC 2181對DNS有規(guī)范說明,RFC 2136對DNS的動態(tài)更新進(jìn)行說明,RFC 2308對DNS查詢的反向緩存進(jìn)行說明主籍。
簡單點(diǎn)說就是我們想登陸某一個網(wǎng)頁习贫,只需要記住有主觀意義的域名,比如說www.bytedance.com, www.baidu.com, www.sina.cn 等等千元,甚至可以簡單地把dns理解為一個key-value的分布式數(shù)據(jù)庫苫昌,其中key值就是域名,而value就是域名對應(yīng)的ip地址幸海,這里并不是一一對應(yīng)的關(guān)系祟身,一個域名可以對應(yīng)多個ip地址,這樣做是為了防止當(dāng)一個ip地址不可用時涕烧,可以切換到另一個ip地址月而,從而不會影響用戶的業(yè)務(wù)。
關(guān)于dns的原理我們就簡單介紹到這里议纯,今天我們要講的是chromium是如何實(shí)現(xiàn)dns解析的父款。大家可能對chromiun有點(diǎn)陌生,但我相信很多人一定都用過chrome瀏覽器瞻凤,實(shí)際上chromiun就是chrome的項(xiàng)目源碼名稱憨攒,可不要小瞧chrome瀏覽器,其復(fù)雜程度不亞于一個操作系統(tǒng)阀参,甚至你可以直接把chrome瀏覽器看成一個web操作系統(tǒng)肝集,關(guān)于這個項(xiàng)目有很多值得學(xué)習(xí)的地方,比如說它的多進(jìn)程調(diào)度蛛壳,渲染器的使用杏瞻,瀏覽器加速算法等等,在這里我們只關(guān)注它對于網(wǎng)絡(luò)部分的實(shí)現(xiàn).
Chromium中關(guān)于網(wǎng)絡(luò)方面的實(shí)現(xiàn)均在net庫中衙荐,實(shí)現(xiàn)了包括dns捞挥、http、udp忧吟、ftp砌函、quic等等大家熟知的協(xié)議,大家感興趣的話可以去網(wǎng)上下載chromium的源代碼溜族。
dns的代碼路徑是 src/net/dns, 通過下圖可以看到文件有很多個讹俊,如果一個個點(diǎn)進(jìn)去看,既浪費(fèi)時間又很難真正理解dns的精髓煌抒。
下面我就帶大家看一看chrome對于dns解析的實(shí)現(xiàn):
第一步首先關(guān)注核心函數(shù)仍劈,這里的核心函數(shù)是指dns整個模塊對外的一個接口,簡單點(diǎn)說就是當(dāng)用戶在瀏覽器中輸入網(wǎng)址時摧玫,主進(jìn)程便會調(diào)用dns模塊中的這個文件來獲取相應(yīng)的ip地址耳奕,而這里的核心函數(shù)就位于 host_resolver_impl.cc 中绑青,其核心函數(shù)為:
int HostResolverImpl::Resolve(const RequestInfo& info,
RequestPriority priority,
AddressList* addresses,
const CompletionCallback& callback,
RequestHandle* out_req,
const BoundNetLog& source_net_log) ;
Key key = GetEffectiveKeyForRequest(info, source_net_log);
這里的key值時根據(jù)info得出的一組可以唯一標(biāo)志dns中一種主機(jī)解析job屋群,關(guān)于job的概念等會就會提到闸婴。
int rv = ResolveHelper(key, info, addresses, source_net_log);
可以看到在這里又新引入了一個ResolveHelper函數(shù),這個函數(shù)的作用時根據(jù)計算得到的key值以及info值芍躏,依次判斷是否為ip邪乍,能否從cache中得到,能否從host中得到对竣,這個函數(shù)可以理解為一個輔助的解析函數(shù)庇楞。
JobMap::iterator jobit = jobs_.find(key);
Job* job;
加入輔助解析函數(shù)并未找到需要的ip地址,并且之前未啟動相同的job(這里通過find函數(shù)來查找指定key值的job是否存在)否纬,則需要啟動一個job來進(jìn)行相應(yīng)的dns解析吕晌,關(guān)于dns解析,這里有兩種方式:
一種是要提到一個函數(shù)getaddrinfo(), 這個函數(shù)可以根據(jù)域名得到相應(yīng)的ip地址临燃,并且既可以用在ipv4上睛驳,也可以用在ipv6上,但由于其是一個系統(tǒng)級別的調(diào)用膜廊,因此是一個阻塞調(diào)用乏沸,chrome將這種方式稱之為ProcTask方式:
而另外一種調(diào)用方式則是chromium按照dns協(xié)議規(guī)范,通過異步非阻塞的調(diào)用方式爪瓜,實(shí)現(xiàn)了getaddrinfo()函數(shù)蹬跃,這種方式被稱之為DnsTask。
那究竟如何選擇使用哪種方式來進(jìn)行dns解析呢铆铆?還是要看代碼蝶缀,下面這些代碼時job類中start()方法的實(shí)現(xiàn):
void Start() override {
DCHECK_LE(num_occupied_job_slots_, 1u);
…
// Caution: Job::Start must not complete synchronously.
if (!system_only && had_dns_config_ &&
!ResemblesMulticastDNSName(key_.hostname)) {
StartDnsTask(); //滿足上述條件后才使用DnsTask
} else {
StartProcTask(); //其余情況均使用ProcTask
}
}
當(dāng)滿足系統(tǒng)未指定解析方式、dns已經(jīng)配置完成主機(jī)名滿足一定條件才可以使用DnsTask薄货,其余情況均使用ProcTask扼劈。
先來說一下ProcTask,這種方式較為簡單菲驴,其最終回調(diào)用到函數(shù)SystemHostResolverCall() 中去, 而這個函數(shù)只是對 getaddrinfo() 做了一層封裝而已,邏輯相對簡單一些骑冗,感興趣的同學(xué)可以去看一下源碼赊瞬,位置是在host_resolver.cc這個文件里。
DnsTask相對來說就復(fù)雜一些贼涩,簡單點(diǎn)說就是通過調(diào)用StartA()巧涧,緊接著再調(diào)用
dns_query.cc、dns_transaction.cc遥倦,同時調(diào)用udp協(xié)議獲取fd谤绳,然后將這個fd注冊到網(wǎng)絡(luò)庫的io線程事件循環(huán)中占锯,從而使得dns解析流程統(tǒng)一寫到了異步回調(diào)的編程框架中。
好了缩筛,關(guān)于chromium中dns的解析暫時先說到這里消略,后續(xù)如果有更進(jìn)一步的解析,我會及時更新并分享出來的瞎抛。