小李_同學 - 簡書

小李_同學

1
關(guān)注
0
粉絲
17
文章
20035

字數(shù)
4

收獲喜歡

IP屬地：遼寧

小李_同學

數(shù)據(jù)漂移的處理
數(shù)據(jù)漂移的處理通常我們把從源系統(tǒng)同步進人數(shù)據(jù)倉庫的第一層數(shù)據(jù)稱為 ODS stag ing 層數(shù)據(jù)鸯绿，阿里巴巴統(tǒng)稱為 ODS 洲愤。數(shù)據(jù)漂移是 ODS 數(shù)據(jù)的一個頑疾猎物，通常是...

883 0 4
小李_同學

hive之存儲格式
今天給大家分享一個主題：Storage Format, 也就是存儲格式我們先在 hive 里建張表，打開 hive 的控制臺，創(chuàng)建一個表create table t(id ...

820 0 0

小李_同學

hive調(diào)優(yōu)
hive調(diào)優(yōu) 一、fetch策略 hive.fetch.task.conversion現(xiàn)在版本默認值是morenone：表示禁用顿痪，任何查詢都會走mr（count好像不走）mi...

431 0 0
小李_同學

hive元數(shù)據(jù)
Hive元數(shù)據(jù)是什么？元數(shù)據(jù)油够，即解釋數(shù)據(jù)的數(shù)據(jù)蚁袭。在Hive架構(gòu)中，數(shù)據(jù)庫/表內(nèi)實際數(shù)據(jù)存放在HDFS之類的分布式存儲系統(tǒng)中石咬，但這些數(shù)據(jù)并不帶有數(shù)據(jù)庫/表/字段之類的描述信息...

4552 0 0
小李_同學

Hive如何處理大量小文件
Hive如何處理大量小文件小文件是如何產(chǎn)生的 1.動態(tài)分區(qū)插入數(shù)據(jù)的時候揩悄，會產(chǎn)生大量的小文件，從而導致map數(shù)量的暴增2.數(shù)據(jù)源本身就包含有大量的小文件3.reduce個數(shù)...

814 0 0
小李_同學

liuzx32
寫了 319758 字鬼悠，被 156 人關(guān)注删性，獲得了 283 個喜歡
小李_同學

常見sql種 lateral view用法：
常見sql種 lateral view用法： 1.question_option_id是數(shù)組存儲格式是字符串類型 2.question_option_id是數(shù)組，存儲格式是數(shù)...

3136 0 0

小李_同學

spark常見錯誤：
spark常見錯誤：一：·21/07/22 18:34:48 ERROR MetricsSystem: Sink class org.apache.spark.metrics...

1090 0 0
小李_同學

阿里云常見錯誤：
阿里云常見錯誤： 2021-07-19 20:21:27 INFO Current task status:RUNNING 2021-07-19 20:21:27 INFO ...

2826 0 0
小李_同學

kafka
Kafka官網(wǎng) kafka.apache.org 1.官網(wǎng)的介紹消息中間件承上啟下緩沖穩(wěn)穩(wěn)的消費flume-->kafka-->ss/flink distribu...

612 0 0
小李_同學

2021-03-11
Spark初識 spark幾種模式 local 下載下來后焕窝，不做什么配置 StandLone 了解即可·····Spark集群： 1個節(jié)點 N個節(jié)點 VS Had...

259 0 0
小李_同學

2021-03-10
HDFS常用API 在前面獲取文件系統(tǒng)的客戶端對象（里面都是配置文件）在后面關(guān)閉流將hdfs文件下載到本地用流來實現(xiàn) //將hdfs文件下載到本地刪除文件讀取文件...

237 0 0

小李_同學

2021-03-07
spark初識 1.MapReduce map + reduce 開發(fā)easy?一般情況下：map ==》（寫入）磁盤 reduce ==>（寫入） hdfs特殊;...

222 0 0
小李_同學

spark之RDD詳解----五大特性
spark Github: https://github.com/apache/spark/[https://github.com/apache/spark/]RDD：讓開...

2824 0 0
小李_同學

安裝mysql5.7
可以參考視頻鏈接：視頻鏈接[https://www.bilibili.com/video/BV12b411N7Lv]視頻鏈接[https://www.bilibili.co...

311 0 0
小李_同學

Hadoop SecondNameNode工作機制蹬挺、常用命令與常用設置
1. SNN****（****secondNamenode****） 1.1****secondNamenode****工作機制 1.secondNamenode執(zhí)行chec...

961 0 0
小李_同學

linux生產(chǎn)常用筆記（二）
LInux筆記 1. 磁盤 1.1****df -h 它報告文件系統(tǒng)磁盤空間的使用情況。真實的數(shù)據(jù)盤 2. 內(nèi)存 free -m：查看內(nèi)存使用情況 5058/7823 =6...

242 0 0

小李_同學

linux生產(chǎn)常用命令（一）
linux生產(chǎn)常用命令企業(yè)生產(chǎn)常用命令（一） 1.~ 家目錄 root用戶袜啃，管理員，最大的權(quán)限~ :當前該用戶的家目錄 [root@bigdata01 ~]# cd /o...

615 0 0
小李_同學

個人介紹

學習IT,大家一起努力幸缕，一起學習

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品