
本文從概念和理論上進(jìn)行整理學(xué)習(xí) 數(shù)據(jù)中臺(tái)是什么 主流概念上講 數(shù)據(jù)中臺(tái)是指通過數(shù)據(jù)技術(shù)赖条,對(duì)海量數(shù)據(jù)進(jìn)行采集甘耿、計(jì)算砾赔、存儲(chǔ)旦事、加工忧便,同時(shí)統(tǒng)一標(biāo)準(zhǔn)和口徑族吻。數(shù)據(jù)中臺(tái)把數(shù)據(jù)統(tǒng)一之后,會(huì)形...
Mybatis批量插入時(shí)會(huì)遇到丟失Decimal小數(shù)位的問題珠增,在一個(gè)插入批次中超歌,Decimal字段的精度是由第一條插入數(shù)據(jù)的精度決定的,如果后面的數(shù)據(jù)精度大于第一條的精度切平,就...
在虛擬機(jī)上啟動(dòng)Flume時(shí)報(bào)內(nèi)存不足的錯(cuò)誤: 第一反應(yīng)以為是虛擬機(jī)的內(nèi)存太小握础,但每個(gè)虛擬機(jī)至少都有2G的內(nèi)存,而且僅僅只啟動(dòng)了flume悴品,所以光啟動(dòng)flume就報(bào)錯(cuò)禀综,應(yīng)該不是...
一行拆多行結(jié)合使用了lateral view和explode。多行拼一行結(jié)合使用了concat_ws與collect_set定枷,某些hive版本支持group_concat可以...
一孤澎、算法效率的度量方法 1.事后統(tǒng)計(jì)方法 這種方法主要是通過設(shè)計(jì)好的測(cè)試程序和數(shù)據(jù),利用計(jì)算機(jī)計(jì)時(shí)器對(duì)不同算法編制的程序的運(yùn)行時(shí)間進(jìn)行比較欠窒,從而確定算法效率的高低覆旭。 2.事前...
什么是DynamoDB Amazon DynamoDB 是一種完全托管的 NoSQL 數(shù)據(jù)庫服務(wù),提供快速而可預(yù)測(cè)的性能岖妄,能夠?qū)崿F(xiàn)無縫擴(kuò)展型将。DynamoDB 可以從表中自動(dòng)刪...
數(shù)據(jù)倉庫與Kimball維度建模概覽 操作型系統(tǒng)與數(shù)據(jù)倉庫 操作型系統(tǒng):保存、更新荐虐、刪除數(shù)據(jù)一般一次處理一個(gè)事物不必維護(hù)歷史數(shù)據(jù)七兜,只需要修改數(shù)據(jù)以反映最新的狀態(tài)優(yōu)化目標(biāo)是更快...
hive性能優(yōu)化 一、Map階段的優(yōu)化: (控制hive任務(wù)中的map數(shù)福扬,確定合適的map數(shù)腕铸,以及每個(gè)map處理合適的數(shù)據(jù)量)。 map個(gè)數(shù)影響因子: input目錄中文件總...
一铛碑、人際關(guān)系的構(gòu)成 親密關(guān)系和泛泛之交至少在六個(gè)方面存在程度差異:了解(knowledge)狠裹、關(guān)心(care)、相互依賴性(interdependence)汽烦、相互一致性(mu...
一涛菠、總述 1.1 對(duì)大數(shù)據(jù)的理解 大、快撇吞、多樣性只是表象碗暗,大數(shù)據(jù)的真正價(jià)值在于生命性和生態(tài)性。阿里巴巴稱之為“活數(shù)據(jù)”梢夯。活數(shù)據(jù)是全本記錄晴圾、實(shí)時(shí)驅(qū)動(dòng)決策和迭代颂砸,其價(jià)值是隨著使用...