240 發(fā)簡信
IP屬地:上海
  • Spark2.1和2.2 SQL物理執(zhí)行策略之Join源碼分析以及不同類型Join區(qū)分

    1. object ExtractEquiJoinKeys 一個模式匹配芬位,官方注釋是: A pattern that finds joins w...

  • Spark2.1和2.2 SQL物理執(zhí)行策略關(guān)鍵源碼分析

    1. 文章開始之前 先附上一句SQL,使用tpc-ds的表結(jié)構(gòu)带到,我們圍繞這句SQL講昧碉。 SQL: SQL> selectavg(cs_ext_d...

  • Storm的可靠性與ack機制

    無論是實時處理還是離線處理,都會遇到一個不可避免的問題是揽惹,失敗任務(wù)如何重做被饿?Storm提供了一個ack機制。首先來看一下ISpout接口的方法搪搏。...

  • Python爬蟲簡單筆記之BeautifulSoup4的簡單用法

    本文首發(fā):http://blog.orisonchan.cc/2018/08/16/44 記錄一下Python爬蟲常用庫BeautifulSou...

  • 常見“樹”概念解析(1)

    樹是許多成熟的項目所使用的基本數(shù)據(jù)結(jié)構(gòu)狭握,也是面試常考慕嚷、程序員必備的重中之重哥牍。 1 底層基礎(chǔ)概念 1.1 平衡樹 所謂平衡樹的平衡,就是樹上某節(jié)點...

  • Spark聚合下推思路以及demo

    Spark原本預(yù)計在2.3版本實現(xiàn)聚合下推喝检,雖然不知道是何原因最終沒有能夠在2.3版本最終實現(xiàn)嗅辣,但是因為工作需要,必須要從聚合函數(shù)下手優(yōu)化Spa...

    0.4 2136 2 11
  • Hadoop 集中式的緩存管理demo

    參考文獻(xiàn): http://www.infoq.com/cn/articles/hdfs-centralized-cache https://bl...

  • 關(guān)于Kafka遠(yuǎn)程生產(chǎn)和消費的額外說明

    網(wǎng)上有太多此類帖子挠说,然而本帖比他們?nèi)妗?背景 有一臺阿里云服務(wù)器A澡谭,用作測試服務(wù)器,一臺華為服務(wù)器B,用作生產(chǎn)服務(wù)器蛙奖。均搭建相同配置和版本Ap...

  • 記一次阿里云磁盤掛載

    其實本來磁盤掛載這件事情已經(jīng)做過很多次了潘酗,但是從來沒有一個詳細(xì)的記錄。借有次機會雁仲,做個記錄仔夺。 背景 因為做一些自己的項目對服務(wù)器的依賴越來越大,...

個人介紹
大數(shù)據(jù)碩士碼農(nóng)一枚攒砖。兼小公關(guān)狗缸兔。干過學(xué)生會,做過社長吹艇,掛過科惰蜜,也拿過國獎。目前就職于五十強某企業(yè)的大數(shù)據(jù)部門受神。
亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品