1识窿、淺談數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘 2贯底、Hadoop/MapReduce購物籃分析:關(guān)聯(lián)規(guī)則挖掘 3画侣、Spark購物籃分析 過程分析:
一 馬爾科夫模型 ? 每個狀態(tài)只依賴之前有限個狀態(tài)– N階馬爾科夫:依賴之前n個狀態(tài)– 1階馬爾科夫(即《中文分詞基礎(chǔ)》中的二元模型):僅僅依賴...
準備數(shù)據(jù) 建表: 導入數(shù)據(jù): 實驗: inner join left join right join full outer join left ...
查詢?nèi)w學生的學號與姓名 查詢選修了課程的學生姓名 ----hive的group by 和集合函數(shù) 查詢學生的總?cè)藬?shù) 計算1號課程的學生平均成績...
測試數(shù)據(jù) 創(chuàng)建分桶表 設(shè)置變量,設(shè)置分桶為true, 設(shè)置reduce數(shù)量是分桶的數(shù)量個數(shù) 加載數(shù)據(jù) 檢查剛剛加載的數(shù)據(jù) 創(chuàng)建測試數(shù)據(jù)表 //結(jié)...
創(chuàng)建表 查看剛剛創(chuàng)建的表 造測試數(shù)據(jù) 加載測試數(shù)據(jù) 由于是內(nèi)部表上圖紅色路徑中的元數(shù)據(jù)在drop表的同時也會被清除 第一步缰趋,先求個用戶的月總金額...
參考文章:https://blog.csdn.net/ForgetThatNight/article/details/80009698https...
YARN:資源(linux資源隔離機制:運算資源---運算程序jar/配置文件/CPU/內(nèi)存/IO--從linux中開辟出諸如內(nèi)存嘴拢、處理器的co...
1滤港、mapTask調(diào)用InputFormat再調(diào)用RecourReader的read()方法來讀取數(shù)據(jù)曲饱,獲得key、value防症,mapreduc...