讓 CPU 告訴你硬盤和網(wǎng)絡(luò)到底有多慢
簡介
經(jīng)常聽到有人說磁盤很慢裹粤、網(wǎng)絡(luò)很卡终蒂,這都是站在人類的感知維度去表述的,比如拷貝一個文件到硬盤需要幾分鐘到幾十分鐘遥诉,夠我去吃個飯啦拇泣;而從網(wǎng)絡(luò)下載一部電影,有時候需要幾個小時矮锈,我都可以睡一覺了霉翔。
最為我們熟知的關(guān)于計算機不同組件速度差異的圖表,是下面這種金字塔形式:越往上速度越快苞笨,容量越小债朵,而價格越高。這張圖只是給了我們一個直觀地感覺瀑凝,并沒有對各個速度和性能做出量化的說明和解釋序芦。而實際上,不同層級之間的差異要比這張圖大的多粤咪。這篇文章就讓你站在 CPU 的角度看這個世界谚中,說說到底它們有多慢。
希望你看到看完這篇文章能明白兩件事情:磁盤和網(wǎng)絡(luò)真的很慢囊拜,性能優(yōu)化是個復(fù)雜的系統(tǒng)性的活某筐。
注:所有的數(shù)據(jù)都是來自這個地址。所有的數(shù)據(jù)會因為機器配置不同冠跷,或者硬件的更新而有出入来吩,但是不影響我們直覺的感受。如果對這些數(shù)據(jù)比較感興趣蔽莱,各個計算機硬件運行速度統(tǒng)計網(wǎng)站 給出了不同年份一些指標(biāo)的數(shù)值弟疆。
數(shù)據(jù)
- 先來看看 CPU 的速度,就拿我的電腦來說盗冷,主頻是 2.6G怠苔,也就是說每秒可以執(zhí)行
2.6*10^9
個指令,每個指令只需要0.38ns
(現(xiàn)在很多個人計算機的主頻要比這個高仪糖,配置比較高的能達到 3.0G+)柑司。我們把這個時間當(dāng)做基本單位1s
迫肖,因為1s
大概是人類能感知的最小時間單位。
一級緩存讀取時間為
0.5ns
玻粪,換算成人類時間大約是1.3s
隅津,大約一次或者兩次心跳的時間。這里能看出緩存的重要性劲室,因為它的速度可以趕上 CPU伦仍,程序本身的 locality 特性加上指令層級上的優(yōu)化,cache 訪問的命中率很高很洋,這最終能極大提高效率充蓝。分支預(yù)測錯誤需要耗時
5ns
,換算成人類時間大約是13s
喉磁,這個就有點久了谓苟,所以你會看到很多文章分析如何優(yōu)化代碼來降低分支預(yù)測的幾率,比如這個得分非常高的 stackoverflow 問題协怒。二級緩存時間就比較久了娜谊,大約在
7ns
,換算成人類時間大約是18.2s
斤讥,可以看到的是如果一級緩存沒有命中纱皆,然后去二級緩存讀取數(shù)據(jù),時間差了一個數(shù)量級芭商。
小知識:為什么需要多層的 CPU 緩存呢派草?這篇文章通過一個通俗易懂的例子給出了講解。
我們繼續(xù)铛楣,互斥鎖的加鎖和解鎖時間需要
25ns
近迁,換算成人類時間大約是65s
,首次達到了一分鐘簸州。并發(fā)編程中鉴竭,我們經(jīng)常聽說鎖是一個很耗時的東西,因為在微波爐里加熱一個東西需要一分鐘的話岸浑,你要在那傻傻地等蠻久了搏存。然后就到了內(nèi)存,每次內(nèi)存尋址需要
100ns
矢洲,換算成人類時間是260s
璧眠,也就是4分多鐘
,如果讀一些不需要太多思考的文章,這么久能讀完2-3千字(這個快閱讀的時代责静,很少人在手機上能靜心多這么字了)袁滥。看起來還不算壞灾螃,不多要從內(nèi)存中讀取一段數(shù)據(jù)需要的時間會更多题翻。到了內(nèi)存之后,時間就變了一個量級腰鬼,CPU 和內(nèi)存之間的速度瓶頸被稱為馮諾依曼瓶頸嵌赠。一次 CPU 上下文切換(系統(tǒng)調(diào)用)需要大約
1500ns
,也就是1.5us
(這個數(shù)字參考了這篇文章垃喊,采用的是單核 CPU 線程平均時間),換算成人類時間大約是65分鐘
袜炕,嗯本谜,也就是一個小時。我們也知道上下文切換是很耗時的行為偎窘,畢竟每次浪費一個小時乌助,也很讓人有罪惡感的。上下文切換更恐怖的事情在于陌知,這段時間里 CPU 沒有做任何有用的計算他托,只是切換了兩個不同進程的寄存器和內(nèi)存狀態(tài);而且這個過程還破壞了緩存仆葡,讓后續(xù)的計算更加耗時赏参。在 1Gbps 的網(wǎng)絡(luò)上傳輸 2K 的數(shù)據(jù)需要
20us
,換算成人類時間是14.4小時
沿盅,這么久都能把《星球大戰(zhàn)》六部曲看完了(甚至還加上吃飯撒尿的時間)把篓!可以看到網(wǎng)絡(luò)上非常少數(shù)據(jù)傳輸對于 CPU 來說,已經(jīng)很漫長腰涧。而且這里的時間還是理論最大值韧掩,實際過程還要更慢一些。SSD 隨機讀取耗時為
150us
窖铡,換算成人類時間大約是4.5天
疗锐。換句話說,SSD 讀點數(shù)據(jù)费彼,CPU 都能休假滑臊,報團參加周邊游了。雖然我們知道 SSD 要比機械硬盤快很多箍铲,但是這個速度對于 CPU 來說也是像烏龜一樣简珠。I/O 設(shè)備
從硬盤開始速度開始變得漫長,這個時候我們就想起內(nèi)存的好處了。盡量減少 IO 設(shè)備的讀寫聋庵,把最常用的數(shù)據(jù)放到內(nèi)存中作為緩存是所有程序的通識膘融。像memcached
和redis
這樣的高速緩存系統(tǒng)近幾年的異軍突起,就是解決了這里的問題祭玉。從內(nèi)存中讀取
1MB
的連續(xù)數(shù)據(jù)氧映,耗時大約為250us
,換算成人類時間是7.5天
脱货,這次假期升級到國慶七天國外游了岛都。同一個數(shù)據(jù)中心網(wǎng)絡(luò)上跑一個來回需要
0.5ms
,換算成人類時間大約是15天
振峻,也就是半個月的時間臼疫。如果你的程序有段代碼需要和數(shù)據(jù)中心的其他服務(wù)器交互,在這段時間里 CPU 都已經(jīng)狂做了半個月的運算扣孟。減少不同服務(wù)組件的網(wǎng)絡(luò)請求烫堤,是性能優(yōu)化的一大課題。從 SSD 讀取 1MB 的順序數(shù)據(jù)凤价,大約需要
1ms
鸽斟,換算成人類時間是1個月
。也就是說 SSD 讀一個普通的文件利诺,如果要等你做完富蓄,CPU 一個月時間就荒廢了。盡管如此慢逾,SSD 已經(jīng)很快啦立倍,不信你看下面機械磁盤的表現(xiàn)。磁盤尋址時間為
10ms
侣滩,換算成人類時間是10個月
帐萎,剛好夠人類創(chuàng)造一個新的生命了。如果 CPU 需要讓磁盤泡杯咖啡胜卤,在它眼里疆导,磁盤去生了個孩子,回來告訴它你讓我泡的咖啡好了葛躏。機械硬盤使用RPM(Revolutions Per Minute/每分鐘轉(zhuǎn)速)
來評估磁盤的性能:RPM 越大澈段,平均尋址時間更短,磁盤性能越好舰攒。尋址只是把磁頭移動到正確的磁道上败富,然后才能讀取指定扇區(qū)的內(nèi)容。換句話說摩窃,尋址雖然很浪費時間兽叮,但其實它并沒有辦任何的正事(讀取磁盤內(nèi)容)芬骄。從磁盤讀取 1MB 連續(xù)數(shù)據(jù)需要
20ms
,換算成人類時間是20個月
鹦聪。IO 設(shè)備是計算機系統(tǒng)的瓶頸账阻,希望讀到這里你能更深切地理解這句話!如果還不理解泽本,不妨想想你在網(wǎng)上買的東西淘太,快遞送了將近兩年,你的心情是怎么樣的规丽。而從世界上不同城市網(wǎng)絡(luò)上走一個來回蒲牧,平均需要
150ms
(參考世界各地 ping 報文的時間),換算成人類時間是12.5年
赌莺。不難理解冰抢,所有的程序和架構(gòu)都會盡量避免不同城市甚至是跨國家的網(wǎng)絡(luò)訪問,CDN就是這個問題的一個解決方案:讓用戶和最接近自己的服務(wù)器交互艘狭,從而減少網(wǎng)絡(luò)上報文的傳輸時間挎扰。虛擬機重啟一次大約要
4s
時間,換算成人類的時間是3百多年
缓升。對于此鼓鲁,我想到了喬布斯要死命優(yōu)化 Mac 系統(tǒng)開機啟動時間的故事蕴轨。如果機器能少重啟而且每次啟動能快一點港谊,不僅能救人命,也能救 CPU 的命橙弱。物理服務(wù)器重啟一次需要
5min
歧寺,換算成人類時間是2萬5千年
,快趕上人類的文明史了棘脐。5 分鐘人類都要等一會了斜筐,更別提 CPU 了,所以沒事不要亂重啟服務(wù)器啊蛀缝,分分鐘終結(jié)一個文明的節(jié)奏顷链。