ps-lite

編譯測(cè)試

make
clear
cd tests
PID="`ps -ef|grep test_|grep -v 'grep'|awk '{print $2}' ORS=","`"
echo $PID | awk '{split($0,arr,",");cmd="kill -9 "; for(i in arr) system(cmd arr[i])}'
find test_* -type f -executable -exec ./repeat.sh 1 ./local.sh 1 1   ./{} \;

mxnet & kvstore & ps-lite

postoffice

  • postoffice.cc創(chuàng)建van_ = Van::Create("zmq");
    • void Postoffice::Start()啟動(dòng)Van::Start(),調(diào)用ZMQVanConnect,建立socket

KVWorker & KVServer

  • 3rdparty/ps-lite/include/ps/kv_app.h加上KVBorker
  • 更改從launch.py開(kāi)始的host笨鸡、role解析,調(diào)用KVBroker作為管理萍膛,更改VAN調(diào)用的ZMQVANKAFKAVAN

zmq api

https://www.cnblogs.com/fengbohello/p/4230135.html

git clone git@github.com:zeromq/libzmq.git
cd libzmq/builds
cmake .. && make && sudo make install 

protobuf

cd ps-lite
make
wget https://github.com/google/protobuf/releases/download/v3.5.1/protobuf-cpp-3.5.1.tar.gz
tar -zxvf protobuf-cpp-3.5.1.tar.gz
cd protobuf-cpp-3.5.1
./configure && make && sudo make install

ps-lite 重要的類(lèi)

ps-lite.png

Postoffice(郵局):

叫郵局的原因是敞贡,worker授滓、server將data打包成message后,交給郵局,郵局自動(dòng)的去發(fā)給需要的機(jī)器揩抡。

  • 單例創(chuàng)建,

  • 管理本node的一些信息:role镀琉、id等

  • rank到id的轉(zhuǎn)換:

    • scheduler:1
    • servergroup:2
    • workergroup:4

    相加為group相加(postoffice::start())

    • worker_id:9, 11, 13, …
    • server_id:8, 10, 12, …

    Van:負(fù)責(zé)通信峦嗤,Postoffice的成員

  • 其成員std::unordered_map senders_保存了node_id到連接的映射

  • Van只定義接口,具體實(shí)現(xiàn)是依賴(lài)ZMQVan(源碼只允許使用zmqvan)

  • Van類(lèi)負(fù)責(zé)建立鏈接滚粟、使用receiving thread監(jiān)聽(tīng)收到的message

Customer(顧客):

  • 代表各個(gè)結(jié)點(diǎn)(Worker寻仗、Server)
  • 分布式實(shí)測(cè)各個(gè)role(node)上只有一個(gè)實(shí)例
  • 也有一個(gè)receiving thread

ps-lite啟動(dòng)流程:

_home_gbxu_Downloads_RDMA_ps-lite.html (2).png

van::receiving線程接受消息流程

_home_gbxu_Downloads_RDMA_ps-lite.html (1).png

customer::receiving 線程

customer 有一個(gè)線程安全的隊(duì)列 recv_queue_,不斷從其中pop消息出來(lái)凡壤,并調(diào)用上層傳入的recv_handle_對(duì)其進(jìn)行處理

消息收發(fā)流程

發(fā):

van::send

? 調(diào)用zmq_van::sengmsg

?

? 先使用zmq單獨(dú)發(fā)送用protobuf打包的meta包署尤,消息中加上一個(gè)flag:是否有該msg的后續(xù)包

? 依次發(fā)送data向量中的各個(gè)值,僅最后一條消息的flag為0

? 返回發(fā)送總字節(jié)數(shù)

收:

zmq_van::recvmsg

? 將收到的包依次放入一個(gè)msg內(nèi)

Barrier

實(shí)現(xiàn)sync的方式亚侠。async即在Postoffice啟動(dòng)時(shí)傳入一個(gè)false參數(shù)關(guān)閉barrier

barrier工作流程


_home_gbxu_Downloads_RDMA_ps-lite.html.png

上層 push/pull 到 ps-lite send/recv

在KVWorker::Send()中對(duì)傳入的kvpairs進(jìn)行slice曹体,分別發(fā)向不同server

在KVServer::Response()中將傳入的回復(fù)參數(shù)發(fā)向發(fā)起request的worker


  • 全部讀了兩遍,發(fā)現(xiàn)src/postoffice.cc
    CHECK_EQ(customers_[app_id].count(customer_id), (size_t) 0) << "customer_id " \
        << customer_id << " already exists\n";
    
    應(yīng)為
    CHECK_EQ(customers_[app_id].count(customer_id), (size_t) 1) <<  "customer_id " \
        << customer_id << " already exists\n";
    
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末硝烂,一起剝皮案震驚了整個(gè)濱河市箕别,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌滞谢,老刑警劉巖串稀,帶你破解...
    沈念sama閱讀 221,820評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異狮杨,居然都是意外死亡母截,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)橄教,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)清寇,“玉大人喘漏,你說(shuō)我怎么就攤上這事』蹋” “怎么了翩迈?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,324評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)盔夜。 經(jīng)常有香客問(wèn)我负饲,道長(zhǎng),這世上最難降的妖魔是什么比吭? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,714評(píng)論 1 297
  • 正文 為了忘掉前任绽族,我火速辦了婚禮,結(jié)果婚禮上衩藤,老公的妹妹穿的比我還像新娘吧慢。我一直安慰自己,他們只是感情好赏表,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,724評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布检诗。 她就那樣靜靜地躺著,像睡著了一般瓢剿。 火紅的嫁衣襯著肌膚如雪逢慌。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,328評(píng)論 1 310
  • 那天间狂,我揣著相機(jī)與錄音攻泼,去河邊找鬼。 笑死鉴象,一個(gè)胖子當(dāng)著我的面吹牛忙菠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播纺弊,決...
    沈念sama閱讀 40,897評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼牛欢,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了淆游?” 一聲冷哼從身側(cè)響起傍睹,我...
    開(kāi)封第一講書(shū)人閱讀 39,804評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎犹菱,沒(méi)想到半個(gè)月后拾稳,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,345評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡腊脱,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,431評(píng)論 3 340
  • 正文 我和宋清朗相戀三年熊赖,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片虑椎。...
    茶點(diǎn)故事閱讀 40,561評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出朵纷,到底是詐尸還是另有隱情识啦,我是刑警寧澤,帶...
    沈念sama閱讀 36,238評(píng)論 5 350
  • 正文 年R本政府宣布泥技,位于F島的核電站浆兰,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏珊豹。R本人自食惡果不足惜簸呈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,928評(píng)論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望店茶。 院中可真熱鬧蜕便,春花似錦、人聲如沸贩幻。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,417評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)丛楚。三九已至族壳,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間趣些,已是汗流浹背仿荆。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,528評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留坏平,地道東北人拢操。 一個(gè)月前我還...
    沈念sama閱讀 48,983評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像功茴,于是被迫代替她去往敵國(guó)和親庐冯。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,573評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • Paramter Server ? ...
    raincoffee閱讀 5,696評(píng)論 0 4
  • ps-lite是一個(gè)參數(shù)服務(wù)器(ps)的實(shí)現(xiàn)坎穿。在有參數(shù)服務(wù)器之前展父,其實(shí)也就5年前,大部分分布式機(jī)器學(xué)習(xí)算法都是靠定...
    xlvector閱讀 3,402評(píng)論 1 3
  • mxnet分布式2 ps-lite論文閱讀 https://www.usenix.org/system/files...
    迷途的Go閱讀 1,573評(píng)論 0 2
  • ZeroMQ API Reference 創(chuàng)建一個(gè)ZMQ的上下文環(huán)境玲昧,是ZMQ一切的開(kāi)始栖茉。 線程安全,不需要自己加...
    分享放大價(jià)值閱讀 3,185評(píng)論 0 3
  • Spring Cloud為開(kāi)發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見(jiàn)模式的工具(例如配置管理孵延,服務(wù)發(fā)現(xiàn)吕漂,斷路器,智...
    卡卡羅2017閱讀 134,702評(píng)論 18 139