1.oracle數(shù)據(jù)庫中查字段名稱痹换、類型及comment 2.查詢owner 3.數(shù)據(jù)導出將txt轉(zhuǎn)成csv 4.數(shù)倉建設的一些資料

1.oracle數(shù)據(jù)庫中查字段名稱痹换、類型及comment 2.查詢owner 3.數(shù)據(jù)導出將txt轉(zhuǎn)成csv 4.數(shù)倉建設的一些資料
在hive中使用not in 子查詢時筏养,一定要去掉null值;否則滿足條件的數(shù)據(jù)會返回null值哮翘,而不是true,如下圖所示是個例子
第二周的作業(yè)是熟悉Python基礎毛秘,了解pandas數(shù)據(jù)結構饭寺,這些資料網(wǎng)上很全阻课,所以本文打算總結一些"長得很像"的函數(shù),關于概率分布將繼續(xù)在下一篇文章描述艰匙。 1.1 map函...
統(tǒng)計學包括描述性統(tǒng)計和推論統(tǒng)計限煞。 描述性統(tǒng)計的含義——"A descriptive statistic is a summary statistic that quantit...
這是python數(shù)據(jù)分析系列文章署驻,從統(tǒng)計學基礎知識到機器學習,將跟隨居士的學習教程持續(xù)更新健霹。這一篇主要描述數(shù)據(jù)集中趨勢旺上,離散程度以及分布形態(tài)等知識點,下一篇將講述概率分布糖埋。 ...
??說起pandas這個是python數(shù)據(jù)清洗的利器抚官,它可以讓你像sql一樣操作數(shù)據(jù),同時可以對數(shù)據(jù)進行各種計算阶捆,轉(zhuǎn)換完成后還可以方便的存儲到excel凌节,轉(zhuǎn)化為array、M...
??正則是做數(shù)據(jù)分析和挖掘必須要會的一種方法洒试,會了它很多問題其實就可以高效的解決了倍奢。說一個最常用的應用場景,在文本識別中垒棋,使用正則可以快速識別出類似于qq號卒煞、廣告、聯(lián)系方式等...
??xgboost是各種比賽中最常使用的方法叼架,網(wǎng)上介紹非常多畔裕,但是大部分看起來都比較費勁,這篇文章我將通俗的講一下xgboost是在干什么乖订,是怎么實現(xiàn)的扮饶,每一步的細節(jié)中要注意...
1.RNN基礎概念和結構 ??RNN(Recurrent Neural Network)即循環(huán)神經(jīng)網(wǎng)絡,用于解決訓練樣本輸入是連續(xù)的序列,且序列的長短不一的問題乍构,比如基于時間...
1.日期格式轉(zhuǎn)換(將yyyymmdd轉(zhuǎn)換為yyyy-mm-dd) 2.hive修改庫名仪召、表名注釋寨蹋、表屬性 3..hive去掉字段中除字母和數(shù)字外的其它字符 4.hive解析j...
1.hive并行執(zhí)行 **2.增大hive memory--java heep space ** 3.mr讀取遞歸目錄設置hive執(zhí)行引擎為mr時牲距,默認不支持讀取遞歸目錄,如...
談一下使用hive udtf 函數(shù)lateral view explode(array()) array為空時遇到的坑钥庇,這個UDTF轉(zhuǎn)換的Array為空的記錄牍鞠,自動被過濾掉...
大家平時可能有需要批量下載pdf的場景,小編會分享一下第一次嘗試批量下載上交所公告的嘗試歷程评姨。 1.導入爬蟲必備的常用包 2.構建list分別存放pdf的鏈接地址和pdf名稱...