240 發(fā)簡(jiǎn)信
IP屬地:北京
  • Hive的坑

    概述 我們的Hive是HortonWorks提供的1.2.1汽抚, 本文檔記錄下我們?cè)谑褂眠^程中遇到的問題和解決方法浙值。 問題 高并發(fā)請(qǐng)求時(shí)厕吉,請(qǐng)求報(bào)錯(cuò):Timed out wait...

  • 120
    計(jì)算資源調(diào)度

    數(shù)據(jù)平臺(tái)會(huì)用很多計(jì)算資源, 一臺(tái)算不了就要分布式, 因此需要一個(gè)計(jì)算資源調(diào)度的服務(wù). "江河日下"的 Yarn 作為一個(gè)經(jīng)常跟 Hadoop 生態(tài)打交道的數(shù)據(jù)工程師, 首先逃...

  • 如何實(shí)現(xiàn)AutoML--讓機(jī)器先做出Baseline

    前言 我之前寫過一篇如何實(shí)現(xiàn)AutoML -- 先Auto每個(gè)環(huán)節(jié),大致思路是讓機(jī)器先自動(dòng)化每一個(gè)小環(huán)節(jié),每個(gè)環(huán)節(jié)輸出唯一一個(gè)結(jié)果鹊杖,這樣可以極大的簡(jiǎn)化搜索空間悴灵。比如我們有三個(gè)...

  • 120
    如何用MLSQL快速調(diào)試Structured Streaming程序

    前言 早上對(duì)Structured Streaming 的window函數(shù), Output Mode 以及Watermark有些疑惑的地方骂蓖。Structured Streami...

  • 為什么需要效率督查團(tuán)隊(duì)

    前言 上周和杭州某司同學(xué)面基积瞒,發(fā)現(xiàn)我們兩同一年畢業(yè),同一年出生登下,還是老鄉(xiāng)茫孔,真是頗感意外叮喳。本來約好了是聊技術(shù)的,結(jié)果硬生生的聊成了如何提高團(tuán)隊(duì)效率的心得交流會(huì)缰贝。 最后得到的結(jié)論...

  • 120
    Hive Metastore部署方式

    Metastore 有三種部署方式 embedded mode (Metastore 和 db 都運(yùn)行在 Hive Service進(jìn)程中) local mode (Metas...

  • 120
    Spark基本概念快速入門

    Spark集群 一組計(jì)算機(jī)的集合,每個(gè)計(jì)算機(jī)節(jié)點(diǎn)作為獨(dú)立的計(jì)算資源拼窥,又可以虛擬出多個(gè)具備計(jì)算能力的虛擬機(jī)戏蔑,這些虛擬機(jī)是集群中的計(jì)算單元。Spark的核心模塊專注于調(diào)度和管理虛...

  • 120
    ChartDirector + python

    下載 官網(wǎng)下載 安裝 查看python site-packages位置 將解壓后的文件 放入site-packages位置 添加chartdirector.pth 文件 測(cè)試...

  • 谷歌BigQuery ML VS StreamingPro MLSQL

    前言 今天看到了一篇 AI前線的文章谷歌BigQuery ML正式上崗鲁纠,只會(huì)用SQL也能玩轉(zhuǎn)機(jī)器學(xué)習(xí)辛臊!。正好自己也在力推 StreamingPro的MLSQL房交。今天就來對(duì)比下...

  • 120
    DAGScheduler之Job的提交劃分Stage

    整體流程圖 源碼分析 spark 2.3 getOrCreateParentStages 創(chuàng)建所有祖先Stage getShuffleDependencies 獲取RDD的第...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品