240 發(fā)簡(jiǎn)信
IP屬地:上海
  • Docker鏡像瘦身方法

    1.使用smaller鏡像作為基礎(chǔ)鏡像2.清理無(wú)用的yum apt pip緩存 使用多階段構(gòu)建 多個(gè)RUN指令合并為一個(gè)

  • 120
    海量數(shù)據(jù)處理問題之MapReduce

    什么是MapReduce? MapReduce是Google提出的一個(gè)的軟件架構(gòu), 用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算。Map Reduce的思想很簡(jiǎn)單寥假,就是 通過(guò)Map步驟使用多臺(tái)...

  • 社招阿里,字節(jié)霞扬,拼多多糕韧,滴滴面掛經(jīng)歷總結(jié)

    阿里: 投遞部門:阿里云智能事業(yè)群投遞崗位:Java開發(fā)專家面試結(jié)果: 二面掛 一面(電面): 面試官因?yàn)槭俏彝碌呐笥眩f(shuō)那就給你一點(diǎn)建議:(1) 面試和面試官闡述的...

  • 爬蟲線程開的多了應(yīng)該是喻圃。

    爬取搜狐幾十萬(wàn)新聞數(shù)據(jù)——一些見解與感悟

    因?yàn)樨?fù)責(zé)一個(gè)新聞推薦系統(tǒng)的項(xiàng)目萤彩,需要采集大量的新聞數(shù)據(jù)作為文本分類的材料,通過(guò)自己的不斷摸索斧拍,以知乎上某位大牛的框架為基礎(chǔ)雀扶,完成了一個(gè)能采集幾十萬(wàn)新聞數(shù)據(jù)的爬蟲,并且健壯性非...

  • @像一塊滾石_e941 這個(gè)應(yīng)該是提取了錯(cuò)誤的url肆汹,你改了代碼嗎愚墓?

    爬取搜狐幾十萬(wàn)新聞數(shù)據(jù)——一些見解與感悟

    因?yàn)樨?fù)責(zé)一個(gè)新聞推薦系統(tǒng)的項(xiàng)目,需要采集大量的新聞數(shù)據(jù)作為文本分類的材料昂勉,通過(guò)自己的不斷摸索浪册,以知乎上某位大牛的框架為基礎(chǔ),完成了一個(gè)能采集幾十萬(wàn)新聞數(shù)據(jù)的爬蟲岗照,并且健壯性非...

  • @像一塊滾石_e941 這個(gè)線程本身就是一直運(yùn)行的习绢,不斷獲得url然后爬取網(wǎng)頁(yè)內(nèi)容,除非遇到被封異常退出的情況線程才會(huì)結(jié)束蝙昙。

    爬取搜狐幾十萬(wàn)新聞數(shù)據(jù)——一些見解與感悟

    因?yàn)樨?fù)責(zé)一個(gè)新聞推薦系統(tǒng)的項(xiàng)目闪萄,需要采集大量的新聞數(shù)據(jù)作為文本分類的材料,通過(guò)自己的不斷摸索奇颠,以知乎上某位大牛的框架為基礎(chǔ)败去,完成了一個(gè)能采集幾十萬(wàn)新聞數(shù)據(jù)的爬蟲,并且健壯性非...

  • 對(duì)于機(jī)器學(xué)習(xí)中訓(xùn)練集(train set)烈拒、驗(yàn)證集(cross vaildation set)和測(cè)試集(test set)的理解

    機(jī)器學(xué)習(xí)中為什么要把數(shù)據(jù)集劃分成這么三個(gè)部分圆裕?我們可以這么做個(gè)比喻來(lái)幫助我們理解。我們?cè)跀?shù)據(jù)集上訓(xùn)練模型的過(guò)程就相當(dāng)于我們?yōu)榱丝荚嚳汲龊贸煽?jī)刷題的過(guò)程荆几,我們的最終...

  • 120
    爬取搜狐幾十萬(wàn)新聞數(shù)據(jù)——一些見解與感悟

    因?yàn)樨?fù)責(zé)一個(gè)新聞推薦系統(tǒng)的項(xiàng)目,需要采集大量的新聞數(shù)據(jù)作為文本分類的材料胜榔,通過(guò)自己的不斷摸索胳喷,以知乎上某位大牛的框架為基礎(chǔ),完成了一個(gè)能采集幾十萬(wàn)新聞數(shù)據(jù)的爬蟲夭织,并且健壯性非...

個(gè)人介紹
在杭程序員吭露,曾在華為云數(shù)據(jù)庫(kù)團(tuán)隊(duì),360企業(yè)云盤團(tuán)隊(duì)工作尊惰,任職運(yùn)維開發(fā)相關(guān)崗位讲竿,技術(shù)棧:python,golang, kubernetes,prometheus云原生相關(guān)套件泥兰,在這里記錄一些工作面試遇到的問題。
亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品