240 發(fā)簡信
IP屬地:廣東
  • 【召回】swing 算法

    基于圖結(jié)構(gòu)的實(shí)時(shí)推薦算法 Swing碗暗,能夠計(jì)算 item-item 之間的相似性戒洼。Swing 指的是秋千敲才,用戶和物品的二部圖中會(huì)存在很多這種秋千,例如 (u1,u2,i1),...

  • Shell

    時(shí)間命令 循環(huán)作業(yè)

  • Python

    General 源表解析 文件讀寫 General findall 返回列表 https://blog.csdn.net/Cashey1991/article/detai...

  • Pyspark-報(bào)錯(cuò)與解決

    in show UnicodeEncodeError: 'ascii' codec can't encode characters in position 572-573: ...

  • HiveSql-常用語句

    get_json_object(page_attr,'$.goods_id') (1) 獲取當(dāng)前時(shí)間: from_unixtime(unix_timestamp(),'yyy...

  • Pyspark-常用語句

    dataframe字段操作 打印權(quán)重 解析概率 模型調(diào)參 初始化spark 常用缺失值填充 StringIndexer 多字段處理 dataframe字段操作 打印權(quán)重 解析...

  • Sklearn-常用語句

    按user_id分組取click_times最大值對(duì)應(yīng)的行(只有一條記錄) 創(chuàng)建空同類型dataframe 訓(xùn)練表 預(yù)測結(jié)果寫csv pyhive k折目標(biāo)編碼

  • 如何解決樣本不均衡的問題

    機(jī)器學(xué)習(xí)面試題中有這么一道題:如果正樣本有10000哩牍,負(fù)樣本有1000,該怎么訓(xùn)練? 這個(gè)問題屬于機(jī)器學(xué)習(xí)樣本訓(xùn)練中的樣本不均衡問題萍倡。經(jīng)過資料的查找,大概分為如下幾類: 1....

  • 類目相關(guān)性Apriori-問題記錄

    問題1: 支持度與置信度閥值(取前50%)定得太低, 導(dǎo)致規(guī)則不是很相關(guān)(連衣裙->阿拉伯服飾 lift最高), 會(huì)出現(xiàn)在美國站下首推阿拉伯服飾. 解決方法: 將支持度與置信...

  • HiveSql-常用語法

    # 拼接排序 select category_id, regexp_replace( concat_ws(',', -- 對(duì)排序后array拼接 ...

  • 接入es數(shù)據(jù)到hdfs

    最近接到一個(gè)需求辟汰,需要接入es日志數(shù)據(jù)到hdfs列敲,進(jìn)行分析阱佛,網(wǎng)上查找了一下資料,總結(jié)一下方法大致有如下幾種 hive本身直接支持連接es可直接參考鏈接 http://lxw1...

  • 很好, 寫得很真誠.

    接入es數(shù)據(jù)到hdfs

    最近接到一個(gè)需求戴而,需要接入es日志數(shù)據(jù)到hdfs凑术,進(jìn)行分析,網(wǎng)上查找了一下資料所意,總結(jié)一下方法大致有如下幾種 hive本身直接支持連接es可直接參考鏈接 http://lxw1...

  • 接入es數(shù)據(jù)到hdfs

    最近接到一個(gè)需求淮逊,需要接入es日志數(shù)據(jù)到hdfs,進(jìn)行分析扁眯,網(wǎng)上查找了一下資料壮莹,總結(jié)一下方法大致有如下幾種 hive本身直接支持連接es可直接參考鏈接 http://lxw1...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品