百度天算大數(shù)據(jù)平臺初體驗(yàn)

曾經(jīng)試用過主流大廠提供的大數(shù)據(jù)平臺服務(wù)鹿寨,僅從用戶體驗(yàn)角度上來說庐氮,各有千秋。

  • 百度天算控制臺 功能分類明確漆弄,使用簡單睦裳,組件版本較新,客服響應(yīng)及時
百度天算控制臺
  • 騰訊大數(shù)據(jù)處理套件TBDS 沒有完全開放服務(wù)撼唾,使用前需要申請廉邑,申請周期較長。我通過聯(lián)系客服倒谷,獲得了一個臨時體驗(yàn)賬號蛛蒙,見第二張圖
騰訊大數(shù)據(jù)處理套件TBDS

通過客服提供的臨時賬號登陸TBDS
  • 華為企業(yè)云控制臺 提供開發(fā)、測試管理流程(果然是以軟件著稱)渤愁,Spark版本較低(1.5.1)牵祟,退還押金讓人蛋疼(走各類審批流程、客服多次騷擾抖格、周期長)
華為企業(yè)云控制臺
  • 阿里云數(shù)加控制臺 阿里的云平臺種類較多诺苹,云梯(貌似已下線)、飛天(自研)雹拄、數(shù)加收奔,有點(diǎn)眼花繚亂。因?yàn)槭亲匝邪旖埃褂幂^繁雜(可能是因?yàn)椴皇煜ぃ┏镆褂们耙徺IMaxCompute服務(wù),性能較好(個人體驗(yàn))
阿里云數(shù)加控制臺
  • Amazon EMR控制臺 各組件基本是當(dāng)前最新版本呢撞!申請賬號時需要綁定信用卡损姜,萬一集群忘記銷毀。殊霞。摧阅。
Amazon EMR控制臺

各產(chǎn)品的收費(fèi)情況和其能提供的服務(wù)器性能、服務(wù)功能相關(guān)绷蹲,收費(fèi)方式多樣化棒卷,可年顾孽、月、時比规。4臺規(guī)模集群的Hadoop+Spark服務(wù)若厚,大概3-5元/小時不等。

因?yàn)槎际谴髲S的大數(shù)據(jù)平臺產(chǎn)品蜒什,所以肯定都是功底深厚测秸、面向廣泛。上述描述灾常,僅僅是個人體驗(yàn)霎冯,不具有通用性、不帶有批判性钞瀑、沒有代表性沈撞。

本文僅簡單介紹一下我比較喜歡的百度天算這個產(chǎn)品:
使用過程如下:執(zhí)行WordCount應(yīng)用程序,統(tǒng)計(jì)文本中單詞詞頻雕什。

  • 需要使用對象存儲BOS和百度MapReduce BMR功能


    使用對象存儲BOS和百度MapReduce BMR功能
  • 進(jìn)入對象存儲BOS后缠俺,用戶通過新建bucket,建立存放在 BOS上的文件夾


    新建Bucket
  • 將需要執(zhí)行的Spark應(yīng)用程序及被測數(shù)據(jù)上傳到剛才建立的文件夾中


    上傳文件
  • 通過導(dǎo)航欄進(jìn)入百度MapReduce功能监徘,準(zhǔn)備創(chuàng)建集群


    創(chuàng)建集群
  • 配置集群名稱晋修、登錄用戶名、密碼(用來進(jìn)入Web UI和SSH連接)凰盔、BOS路徑墓卦、選擇組件版本


    集群配置頁面
  • 我選擇使用Hadoop 2.7、Spark 1.6.0户敬、Hue 3.10.0落剪、HBase 1.1.2,創(chuàng)建4個節(jié)點(diǎn)

集群配置頁面
  • 付費(fèi)


    付費(fèi)
  • 支付成功后尿庐,集群就開通了


    集群成功開通
  • 4臺規(guī)模的集群忠怖,初始化了10分鐘,時間較長抄瑟,應(yīng)該是啟動虛機(jī)后凡泣,根據(jù)用戶的選擇,下載相應(yīng)的組件包皮假,修改配置鞋拟,啟動服務(wù)。


    集群正在初始化
  • 集群服務(wù)啟動成功


    集群服務(wù)啟動成功
  • 通過集群的實(shí)例詳情惹资,可以鏈接Yarn Web UI和Hue Web UI


    集群詳情頁面
  • 通過導(dǎo)航欄選擇作業(yè)贺纲,創(chuàng)建作業(yè)


    創(chuàng)建作業(yè)
  • 選擇Spark作業(yè),指定Spark-submit命令參數(shù)及應(yīng)用程序參數(shù)(位置在BOS)


    配置作業(yè)參數(shù)
  • 作業(yè)創(chuàng)建成功后褪测,等待執(zhí)行


    作業(yè)等待執(zhí)行
  • 作業(yè)執(zhí)行過程中可以查看作業(yè)詳情


    作業(yè)執(zhí)行過程中可以查看作業(yè)詳情
  • 一段時間后猴誊,作業(yè)完成


    作業(yè)成功的執(zhí)行完畢
  • 通過查看作業(yè)日志潦刃,觀察輸出結(jié)果


    通過查看作業(yè)日志,觀察輸出結(jié)果
  • 通過集群界面中的Hadoop Yarn Web UI鏈接懈叹,查看應(yīng)用程序的具體執(zhí)行情況

選擇Hadoop Yarn Web UI鏈接

Hadoop Yarn Web UI界面

Hadoop Yarn Web UI界面
  • 可用在集群的監(jiān)控頁面乖杠,觀察集群狀態(tài)和各大數(shù)據(jù)組件信息


    集群的監(jiān)控頁面

    集群的監(jiān)控頁面
  • 可以在導(dǎo)航欄選擇多用戶訪問控制,對多用戶權(quán)限進(jìn)行管理和控制


    多用戶訪問控制頁面

    多用戶訪問控制頁面
  • 百度云提供詳盡的產(chǎn)品手冊澄成,對用戶進(jìn)行指導(dǎo)


    百度云產(chǎn)品手冊

使用過程中一些小坑:

  • 集群環(huán)境默認(rèn)使用JDK 1.7版本滑黔,所以用戶編譯應(yīng)用程序時,請使用JDK 1.7环揽,否則會出現(xiàn)類似:Unsupported major.minor.version 51.0的錯誤
  • 集群環(huán)境默認(rèn)使用Scala 2.10版本,所以用戶編譯應(yīng)用程序時庵佣,請使用Scala 2.10.x歉胶,否則會出現(xiàn)類似: java.lang.AbstractMethodError: bdsparkwc$1.call(Ljava/lang/Object;)Ljava/lang/Iterable;的錯誤
  • 當(dāng)應(yīng)用程序執(zhí)行完畢后,無法使用Yarn Web UI來登陸應(yīng)用程序的Driver Web UI 4040界面巴粪,估計(jì)是Spark History Server服務(wù)沒有開啟
  • 其提供IP用來SSH連接通今,經(jīng)常出現(xiàn)超時

總結(jié):
目前來看,主流大廠都是通過這種SaaS方式來提供大數(shù)據(jù)平臺全托管的服務(wù)肛根,面向一些沒有數(shù)據(jù)中心辫塌、沒有運(yùn)維能力的中小型企業(yè),按需部署和使用派哲,非常的快捷。通過其詳盡的產(chǎn)品使用指南,用戶再具備一些大數(shù)據(jù)組件相關(guān)使用的知識集乔,就可以快速的進(jìn)行大數(shù)據(jù)的清洗锌云、挖掘、分析和報(bào)告褂乍,無需為集群節(jié)點(diǎn)分配持隧、部署、優(yōu)化逃片、維護(hù)投入時間屡拨。

相關(guān)鏈接:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市褥实,隨后出現(xiàn)的幾起案子呀狼,更是在濱河造成了極大的恐慌,老刑警劉巖性锭,帶你破解...
    沈念sama閱讀 206,311評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件赠潦,死亡現(xiàn)場離奇詭異,居然都是意外死亡草冈,警方通過查閱死者的電腦和手機(jī)她奥,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評論 2 382
  • 文/潘曉璐 我一進(jìn)店門瓮增,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人哩俭,你說我怎么就攤上這事绷跑。” “怎么了凡资?”我有些...
    開封第一講書人閱讀 152,671評論 0 342
  • 文/不壞的土叔 我叫張陵砸捏,是天一觀的道長。 經(jīng)常有香客問我隙赁,道長垦藏,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,252評論 1 279
  • 正文 為了忘掉前任伞访,我火速辦了婚禮掂骏,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘厚掷。我一直安慰自己弟灼,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,253評論 5 371
  • 文/花漫 我一把揭開白布冒黑。 她就那樣靜靜地躺著田绑,像睡著了一般。 火紅的嫁衣襯著肌膚如雪抡爹。 梳的紋絲不亂的頭發(fā)上掩驱,一...
    開封第一講書人閱讀 49,031評論 1 285
  • 那天,我揣著相機(jī)與錄音冬竟,去河邊找鬼昙篙。 笑死,一個胖子當(dāng)著我的面吹牛诱咏,可吹牛的內(nèi)容都是我干的苔可。 我是一名探鬼主播,決...
    沈念sama閱讀 38,340評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼袋狞,長吁一口氣:“原來是場噩夢啊……” “哼焚辅!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起苟鸯,我...
    開封第一講書人閱讀 36,973評論 0 259
  • 序言:老撾萬榮一對情侶失蹤同蜻,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后早处,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體湾蔓,經(jīng)...
    沈念sama閱讀 43,466評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,937評論 2 323
  • 正文 我和宋清朗相戀三年砌梆,在試婚紗的時候發(fā)現(xiàn)自己被綠了默责。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贬循。...
    茶點(diǎn)故事閱讀 38,039評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖桃序,靈堂內(nèi)的尸體忽然破棺而出杖虾,到底是詐尸還是另有隱情,我是刑警寧澤媒熊,帶...
    沈念sama閱讀 33,701評論 4 323
  • 正文 年R本政府宣布奇适,位于F島的核電站,受9級特大地震影響芦鳍,放射性物質(zhì)發(fā)生泄漏嚷往。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,254評論 3 307
  • 文/蒙蒙 一柠衅、第九天 我趴在偏房一處隱蔽的房頂上張望间影。 院中可真熱鬧,春花似錦茄茁、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至宣谈,卻和暖如春愈犹,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背闻丑。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工漩怎, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人嗦嗡。 一個月前我還...
    沈念sama閱讀 45,497評論 2 354
  • 正文 我出身青樓勋锤,卻偏偏與公主長得像,于是被迫代替她去往敵國和親侥祭。 傳聞我的和親對象是個殘疾皇子叁执,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,786評論 2 345

推薦閱讀更多精彩內(nèi)容