240 發(fā)簡(jiǎn)信
IP屬地:陜西
  • 解決Flume采集數(shù)據(jù)時(shí)在HDFS上產(chǎn)生大量小文件的問(wèn)題

    https://blog.csdn.net/whdxjbw/article/details/80606917[https://blog.csdn...

  • HIve 配置LZO壓縮

    1.下載lzo源碼包,然后進(jìn)行編譯良价,下載lzo的源碼包地址https://github.com/twitter/hadoop-lzo/tree/...

  • 操作符&模式匹配和樣例類

    1寝殴、操作符通常用來(lái)構(gòu)建領(lǐng)域特定語(yǔ)言-內(nèi)嵌在scala的迷你語(yǔ)言。隱試轉(zhuǎn)換是另一個(gè)我們?cè)趧?chuàng)建領(lǐng)域特定語(yǔ)言時(shí)的工具明垢。2蚣常、中置操作符是二元的-它有兩個(gè)...

  • PCA 主成分分析

    主成分根據(jù),多維字段分析降維成幾個(gè)成分 多維數(shù)組降維 幾個(gè)特征向量對(duì)應(yīng)幾個(gè)特征空間

  • 數(shù)據(jù)特征分析

    ①分布分析:基本分析痊银、數(shù)據(jù)分析抵蚊、統(tǒng)計(jì)量、結(jié)構(gòu)分析② 絕對(duì)數(shù)比較-差溯革、相對(duì)數(shù)比較-相除 空間結(jié)構(gòu)比較:時(shí)間相同的情況下贞绳,橫向?qū)Ρ确治觥?dòng)態(tài)分析對(duì)比...

  • ROC曲線和AUC面積

    AUC 是一個(gè)模型評(píng)價(jià)指標(biāo):只能用于二分類模型的評(píng)價(jià)致稀。AUC的計(jì)算同時(shí)考慮了正比例和負(fù)比例的冈闭,在樣本不均衡的情況下,依然能夠?qū)Ψ诸惼髯龀龊侠淼脑u(píng)...

  • dataframe 設(shè)置 DF() schema

    val colName = Array("a","b","c")resultDF.toDF(colName:_*)

  • Python中的TfidfVectorizer解析

    vectorizer = CountVectorizer() #構(gòu)建一個(gè)計(jì)算詞頻(TF)的玩意兒萎攒,當(dāng)然這里面不足是可以做這些transforme...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品