啟動(dòng)Hive
啟動(dòng)hive
2.建表
建表
3.導(dǎo)入數(shù)據(jù)
導(dǎo)入數(shù)據(jù)
4.查詢:
查看wordcount 表
至此吗冤,數(shù)據(jù)導(dǎo)入完成缓艳。我原先以為做單詞統(tǒng)計(jì)槽奕,這一張表就可以嘴纺,但是我發(fā)現(xiàn)非常的困難败晴,到這個(gè)地步就不能在用Hadoop里的MR來思維了,應(yīng)該用RMDS的思維來解決這個(gè)問題栽渴,所以我又新建了一張表尖坤,叫words,用來存儲(chǔ)分割字符串后的單詞熔萧。
6.新建words表
建表
7對words表進(jìn)行格式上的處理執(zhí)行下列語句
insert overwrite table wordsselect explode(split(word,'[ \t]+')) wordfrom wordcount;???????? explode是hive的函數(shù)糖驴,在以后的深入學(xué)會(huì)了解到。
對表行一個(gè)處理佛致,即遇到一個(gè)“\t”自動(dòng)切分
words表中的格式
8.使用HQL語句查詢words表
select word ,count(*) from?? words group by word