240 發(fā)簡(jiǎn)信
IP屬地:陜西
  • 解決Flume采集數(shù)據(jù)時(shí)在HDFS上產(chǎn)生大量小文件的問題

    https://blog.csdn.net/whdxjbw/article/details/80606917[https://blog.csdn...

  • HIve 配置LZO壓縮

    1.下載lzo源碼包杏头,然后進(jìn)行編譯贮懈,下載lzo的源碼包地址https://github.com/twitter/hadoop-lzo/tree/...

  • 操作符&模式匹配和樣例類

    1、操作符通常用來構(gòu)建領(lǐng)域特定語言-內(nèi)嵌在scala的迷你語言断部。隱試轉(zhuǎn)換是另一個(gè)我們?cè)趧?chuàng)建領(lǐng)域特定語言時(shí)的工具猎贴。2、中置操作符是二元的-它有兩個(gè)...

  • PCA 主成分分析

    主成分根據(jù)蝴光,多維字段分析降維成幾個(gè)成分 多維數(shù)組降維 幾個(gè)特征向量對(duì)應(yīng)幾個(gè)特征空間

  • 數(shù)據(jù)特征分析

    ①分布分析:基本分析她渴、數(shù)據(jù)分析、統(tǒng)計(jì)量蔑祟、結(jié)構(gòu)分析② 絕對(duì)數(shù)比較-差趁耗、相對(duì)數(shù)比較-相除 空間結(jié)構(gòu)比較:時(shí)間相同的情況下,橫向?qū)Ρ确治鼋椤?dòng)態(tài)分析對(duì)比...

  • ROC曲線和AUC面積

    AUC 是一個(gè)模型評(píng)價(jià)指標(biāo):只能用于二分類模型的評(píng)價(jià)苛败。AUC的計(jì)算同時(shí)考慮了正比例和負(fù)比例的满葛,在樣本不均衡的情況下,依然能夠?qū)Ψ诸惼髯龀龊侠淼脑u(píng)...

  • dataframe 設(shè)置 DF() schema

    val colName = Array("a","b","c")resultDF.toDF(colName:_*)

  • Python中的TfidfVectorizer解析

    vectorizer = CountVectorizer() #構(gòu)建一個(gè)計(jì)算詞頻(TF)的玩意兒嘀韧,當(dāng)然這里面不足是可以做這些transforme...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品