Pinot Realtime And ETL

Tracking:

  1. 安裝schema register:

    該服務用來注冊pinot需要的scheme吮螺,這樣所有需要schema的地方調用該服務即可.
    
    http://docs.confluent.io/1.0/installation.html#installation
    
    修改兼容性:
    curl -X PUT -i -H "Content-Type: application/vnd.schemaregistry.v1+json" --data '{"compatibility": "FORWARD"}' http://localhost:8801{"compatibility": "FORWARD"}
    
    如何啟動:
     schema-registrybin/schema-registry-start config/schema-registry.properties &
    
    在 schema-registry 服務中創(chuàng)建AvroSchema
    
    1. Register a new version of a schema under the subject "WechatActiveUsersV3"
    $ curl -X POST -i -H "Content-Type: application/vnd.schemaregistry.v1+json" --data '{"schema": "{\"type\": \"string\"}"}' http://localhost:8081/subjects/Kafka-key/versions
    
    2. List all subjects
    $ curl -X GET -i http://localhost:8081/subjects
    
    3. List all schema versions registered under the subject "WechatActiveUsersV3"
    $ curl -X GET -i http://localhost:8081/subjects/WechatActiveUsersV3/versions
    
    4. Fetch the most recently registered schema under subject "Kafka-value"
    $ curl -X GET -i http://localhost:8081/subjects/Kafka-value/versions/latest
    
    5. Update compatibility requirements globally
    $ curl -X PUT -i -H "Content-Type: application/vnd.schemaregistry.v1+json" --data '{"compatibility": "NONE"}' http://localhost:8081/config
    
    6. Update compatibility requirements under the subject "Kafka-value"$ curl -X PUT -i -H "Content-Type: application/vnd.schemaregistry.v1+json" --data '{"compatibility": "BACKWARD"}' http://localhost:8081/config/Kafka-value
    
    執(zhí)行Pinot索引創(chuàng)建
    
    $ gobblin-mapreduce.sh --conf job-conf/WechaActiveUserV3.pull --jars target/parllay-pipeline-gobblin-1.0.0.jar
    
    $ hadoop jar /opt/pinot-0.016-pkg/lib/pinot-hadoop-0.016.jar SegmentCreation /path/jobs/WechatActiveUsersV3-Job.properties
    
    $ hadoop jar /opt/pinot-0.016-pkg/lib/pinot-hadoop-0.016.jar SegmentTarPush /path/*-Job.properties 
    
    創(chuàng)建Pinot對應的Avro元數(shù)據(jù) 
    $ curl -X POST -i -H "Content-Type: application/vnd.schemaregistry.v1+json" --data '{"schema":"{\"namespace\":\"com.parllay.wechat\",\"type\":\"record\",\"name\":\"wechatActiveUserMetrics\",\"fields\":[{\"name\":\"platId\",\"type\":\"string\"},{\"name\":\"openId\",\"type\":\"string\"},{\"name\":\"year\",\"type\":\"int\"},{\"name\":\"month\",\"type\":\"int\"},{\"name\":\"week\",\"type\":\"int\"},{\"name\":\"day\",\"type\":\"int\"},{\"name\":\"hour\",\"type\":\"int\"},{\"name\":\"counter\",\"type\":\"int\"},{\"name\":\"eventTime\",\"type\":\"long\"}]}"}' http://schema.registry:8801/subjects/wechatActiveUserMetrics/versions  $ curl -X POST -i -H "Content-Type: application/vnd.schemaregistry.v1+json" --data '{"schema":"{\"namespace\":\"com.parllay.wechat\",\"type\":\"record\",\"name\":\"wechatEventMetrics\",\"fields\":[{\"name\":\"platId\",\"type\":\"string\"},{\"name\":\"event\",\"type\":\"string\"},{\"name\":\"eventKey\",\"type\":\"string\"},{\"name\":\"eventValue\",\"type\":\"string\"},{\"name\":\"eventKey1\",\"type\":\"string\"},{\"name\":\"eventValue1\",\"type\":\"string\"},{\"name\":\"eventKey2\",\"type\":\"string\"},{\"name\":\"eventValue2\",\"type\":\"string\"},{\"name\":\"countryId\",\"type\":\"int\"},{\"name\":\"provinceId\",\"type\":\"int\"},{\"name\":\"cityId\",\"type\":\"int\"},{\"name\":\"realTimeCountryId\",\"type\":\"int\"},{\"name\":\"realTimeProvinceId\",\"type\":\"int\"},{\"name\":\"realTimeCityId\",\"type\":\"int\"},{\"name\":\"gender\",\"type\":\"int\"},{\"name\":\"groupId\",\"type\":\"int\"},{\"name\":\"languageId\",\"type\":\"int\"},{\"name\":\"tags\",\"type\":{\"type\":\"array\",\"items\":\"int\"}},{\"name\":\"year\",\"type\":\"int\"},{\"name\":\"month\",\"type\":\"int\"},{\"name\":\"week\",\"type\":\"int\"},{\"name\":\"day\",\"type\":\"int\"},{\"name\":\"hour\",\"type\":\"int\"},{\"name\":\"counter\",\"type\":\"int\"},{\"name\":\"eventTime\",\"type\":\"long\"}]}"}' http://schema.registry:8801/subjects/wechatEventMetrics/versions   $ curl -X POST -i -H "Content-Type: application/vnd.schemaregistry.v1+json" --data '{"schema":"{\"namespace\":\"com.parllay.wechat\",\"type\":\"record\",\"name\":\"wechatUserMetrics\",\"fields\":[{\"name\":\"platId\",\"type\":\"string\"},{\"name\":\"openId\",\"type\":\"string\"},{\"name\":\"event\",\"type\":\"string\"},{\"name\":\"eventKey\",\"type\":\"string\"},{\"name\":\"eventValue\",\"type\":\"string\"},{\"name\":\"eventKey1\",\"type\":\"string\"},{\"name\":\"eventValue1\",\"type\":\"string\"},{\"name\":\"eventKey2\",\"type\":\"string\"},{\"name\":\"eventValue2\",\"type\":\"string\"},{\"name\":\"countryId\",\"type\":\"int\"},{\"name\":\"provinceId\",\"type\":\"int\"},{\"name\":\"cityId\",\"type\":\"int\"},{\"name\":\"realTimeCountryId\",\"type\":\"int\"},{\"name\":\"realTimeProvinceId\",\"type\":\"int\"},{\"name\":\"realTimeCityId\",\"type\":\"int\"},{\"name\":\"gender\",\"type\":\"int\"},{\"name\":\"groupId\",\"type\":\"int\"},{\"name\":\"languageId\",\"type\":\"int\"},{\"name\":\"tags\",\"type\":{\"type\":\"array\",\"items\":\"int\"}},{\"name\":\"year\",\"type\":\"int\"},{\"name\":\"month\",\"type\":\"int\"},{\"name\":\"week\",\"type\":\"int\"},{\"name\":\"day\",\"type\":\"int\"},{\"name\":\"hour\",\"type\":\"int\"},{\"name\":\"counter\",\"type\":\"int\"},{\"name\":\"eventTime\",\"type\":\"long\"}]}"}' http://schema.registry:8801/subjects/wechatUserMetrics/versions
    
  2. 安裝hadoop集群:

     啟動該服務hadoop-2.7.1
    
  3. 安裝spark集群:

     啟動該服務spark2.0.1
    
  4. 安裝azkaban:
     
    啟動該服務,詳細安裝過程參見我的上一篇文章
    http://www.reibang.com/p/fd187cb15674

  5. 編譯pinot:

     啟動controller, broker, server
    
     bin/start-server.sh -zkAddress=master:2181 -clusterName=pinot-fht-cluster-v2 -serverHost=slave1 -serverPort=8098 -dataDir=/opt/pinot-0.016-pkg/data -segmentDir=/opt/pinot-0.016-pkg/segment &
    
     bin/start-broker.sh -zkAddress=master:2181 -clusterName=pinot-fht-cluster-v2 -brokerHost=slave1 -brokerPort=8099 &
    
     bin/start-controller.sh -zkAddress=master:2181 -clusterName=pinot-fht-cluster-v2 -controllerHost=slave1 -controllerPort=9001 -dataDir=/pinot-0.016-pkg/controller &
    
  6. 編譯gobblin:

    從kafka導出數(shù)據(jù)到hdfs, 每次導出都會在zookeeper記錄其offset及其wartermark. 每次執(zhí)行的數(shù)據(jù)段為上次offset到gobblin啟動任務的時間段.
    
  7. 安裝kafka集群

     啟動集群kafka_2.11-0.9.0.1旷赖,創(chuàng)建topic
    
  1. 創(chuàng)建tracking schema, table等

  2. 提交schema到schema register服務.

  3. produce數(shù)據(jù)到kafka集群

  4. 測試pinot 數(shù)據(jù)接收情況. 根據(jù)web控制臺

  5. 生成離線數(shù)據(jù).

  6. 測試整個數(shù)據(jù)流程.

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末雇锡,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子青柄,更是在濱河造成了極大的恐慌衅枫,老刑警劉巖嗦枢,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異附鸽,居然都是意外死亡脱拼,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進店門拒炎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人挨务,你說我怎么就攤上這事击你。” “怎么了谎柄?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵丁侄,是天一觀的道長。 經(jīng)常有香客問我朝巫,道長鸿摇,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任劈猿,我火速辦了婚禮拙吉,結果婚禮上,老公的妹妹穿的比我還像新娘揪荣。我一直安慰自己筷黔,他們只是感情好,可當我...
    茶點故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布仗颈。 她就那樣靜靜地躺著佛舱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪挨决。 梳的紋絲不亂的頭發(fā)上请祖,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天,我揣著相機與錄音脖祈,去河邊找鬼肆捕。 笑死,一個胖子當著我的面吹牛盖高,可吹牛的內容都是我干的福压。 我是一名探鬼主播,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼或舞,長吁一口氣:“原來是場噩夢啊……” “哼荆姆!你這毒婦竟也來了?” 一聲冷哼從身側響起映凳,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤胆筒,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體仆救,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡抒和,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了彤蔽。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片摧莽。...
    茶點故事閱讀 39,981評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖顿痪,靈堂內的尸體忽然破棺而出镊辕,到底是詐尸還是另有隱情,我是刑警寧澤蚁袭,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布征懈,位于F島的核電站,受9級特大地震影響揩悄,放射性物質發(fā)生泄漏卖哎。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一删性、第九天 我趴在偏房一處隱蔽的房頂上張望亏娜。 院中可真熱鬧,春花似錦蹬挺、人聲如沸照藻。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽台夺。三九已至昆箕,卻和暖如春宰睡,著一層夾襖步出監(jiān)牢的瞬間拆魏,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工雪猪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留栏尚,地道東北人。 一個月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓只恨,卻偏偏與公主長得像译仗,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子官觅,可洞房花燭夜當晚...
    茶點故事閱讀 44,933評論 2 355

推薦閱讀更多精彩內容