IP屬地:上海
你好 嗯嗯 好的 然后了
包括表過濾录煤、列標(biāo)簽過濾脏毯、值過濾
輸出MySQL的表 需要向MySQLstats_visitor_basic表和stats_visitor_browser表中插入數(shù)據(jù)改执,插入數(shù)據(jù)的...
多個Reducer操作同一張表可能出現(xiàn)的錯誤 假設(shè)有兩個Reducer浪蹂,R1和R2毡泻,都需要操作MySQL的Dimension表(封裝成getDi...
Flume監(jiān)聽Nginx日志 要求:1. 日志文件每十分鐘生成一次访锻,日志內(nèi)容達(dá)到 1M 時也生成一次2. HDFS上的日志文件名稱為:nginx...
Nginx配置 修改${nginx_home}/conf/nginx.conf配置文件 找到http節(jié)點垢揩,添加日志格式# 定義日志格式# log...
日志格式 數(shù)據(jù)清洗 對日志進(jìn)行解析,得到ip信息(所在國家亏推、省份和城市)学赛、事件類型等,并且過濾無效日志吞杭。將解析后的結(jié)果存入HBase罢屈,為后續(xù)任務(wù)...
本地運行 解壓Hadoop安裝包hadoop-2.5.0-cdh5.3.6.tar.gz 設(shè)置HADOOP_HOME環(huán)境變量(最好在用戶變量和系...