presto 的安裝與使用

相關(guān)說明:

Presto官網(wǎng): Presto | Distributed SQL Query Engine for Big Data (prestodb.io)

DeltaLake官網(wǎng): Delta Lake - Reliable Data Lakes at Scale

安裝Presto:

  1. 安裝文檔鏈接如下:
    Deploying Presto — Presto 0.252 Documentation (prestodb.io)

  2. 中文描述:
    a. 下載presto-server-0.252.tar.gz棋弥,上傳到Linux 服務(wù)器并重命名為presto
    b. 進入到presto目錄桌肴,創(chuàng)建etc目錄棍苹,命令如下:

cd presto
mkdir etc
mkdir etc/catalog
touch etc/node.properties
touch etc/jvm.config
touch etc/config.properties

c. 添加屬性

  1. node.properties添加以下屬性敬飒,當(dāng)然也可以根據(jù)官網(wǎng)的提示進行修改:
node.environment=production  #節(jié)點名字,集群中這個名字要一樣
node.id=ffffffff-ffff-ffff-ffff-ffffffffffff #唯一標(biāo)識读拆,可以為其他的數(shù)字
node.data-dir=/var/presto/data #數(shù)據(jù)目錄
  1. jvm.config添加以下屬性:
-server
-Xmx16G
-XX:+UseG1GC
-XX:G1HeapRegionSize=32M
-XX:+UseGCOverheadLimit
-XX:+ExplicitGCInvokesConcurrent
-XX:+HeapDumpOnOutOfMemoryError
-XX:+ExitOnOutOfMemoryError
  1. config.properties添加以下屬性(這個是單機版的屬性供汛,如果是集群請參考官網(wǎng)):
coordinator=true
node-scheduler.include-coordinator=true
http-server.http.port=8080
query.max-memory=5GB
query.max-memory-per-node=1GB
query.max-total-memory-per-node=2GB
discovery-server.enabled=true
discovery.uri=http://example.net:8080
  1. catalog目錄下是放置的連接器配置,需要根據(jù)自己的需要進行配置悉尾,連接器配置鏈接如下:
    Connectors — Presto 0.252 Documentation (prestodb.io)

d. 下載 presto-cli-0.252-executable.jar 客戶端jar包,上傳到Linux服務(wù)器挫酿,并將jar包變?yōu)榭蓤?zhí)行環(huán)境构眯,命令如下:

chmod +x  presto-cli-0.252-executable.jar

啟動Presto

  1. 進入到presto/bin目錄下,執(zhí)行以下命令:
bin/launcher start
  1. 客戶端登錄服務(wù)器早龟,執(zhí)行
presto --server localhost:8080 --catalog hive --schema default
# catalog 是catalog目錄的連接器文件名惫霸,而非配置名稱,很重要葱弟。
# schema 相當(dāng)于數(shù)據(jù)庫壹店,但并非是真正的數(shù)據(jù)庫
# 8080 是config.properties中配置的端口,自己根據(jù)需要改

Presto整合Deltalake

詳細整合的步驟鏈接:Presto and Athena to Delta Lake integration — Delta Lake Documentation

中文簡化版Presto與DeltaLake整合過程如下:
Step1. 通過SQL, Scala, Java, Python 其中之一生成Mainfest文件芝加,具體如下:

#SQL 生成方式
GENERATE symlink_format_manifest FOR TABLE delta.`<path-to-delta-table>`

 #Scala 生成方式
val deltaTable = DeltaTable.forPath(<path-to-delta-table>)
deltaTable.generate("symlink_format_manifest")

#Java生成方式
DeltaTable deltaTable = DeltaTable.forPath(<path-to-delta-table>);
deltaTable.generate("symlink_format_manifest");

#Python生成方式
deltaTable = DeltaTable.forPath(<path-to-delta-table>)
deltaTable.generate("symlink_format_manifest")

#注意:forPath 是要整合的數(shù)據(jù)路徑硅卢,"symlink_format_manifest" 是固定的,不可更改

Step2. 生成Presto表

CREATE EXTERNAL TABLE mytable ([(col_name1 col_datatype1, ...)])
[PARTITIONED BY (col_name2 col_datatype2, ...)]
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.SymlinkTextInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION '<path-to-delta-table>/_symlink_format_manifest/'  -- location of the generated manifest

注意1:Presto是無法生成外部表的妖混,需要在Hive或者Spark中進行生成老赤,生成的語句就是上面的語句,但是Athena 是可以直接生成外部表的

注意2:在通過以上語句在Hive或者Spark中生成的表制市,可以直接在Presto直接使用抬旺,但在Hive中查出來的是為Null

===============================================================
2021-06-16 更新

通過以下命令進入到presto

./prestocli --server IP:Port --catalog hive
# ip:安裝有presto的地址
# port:/etc/config.properties 中 http-server.http.port=port 的端口配置
# catalog: /etc/catalog 下的hive.properties的文件名

進入之后進行相關(guān)的操作需要指定schema,查看有多少個schema,使用以下命令

show schemas;

#顯示結(jié)果如下:
default            
information_schema 
test               
(3 rows)
Query 20210616_023139_00010_prehn, FINISHED, 3 nodes
Splits: 36 total, 36 done (100.00%)
0:00 [3 rows, 68B] [12 rows/s, 170B/s]
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末祥楣,一起剝皮案震驚了整個濱河市开财,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌误褪,老刑警劉巖责鳍,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異兽间,居然都是意外死亡历葛,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進店門嘀略,熙熙樓的掌柜王于貴愁眉苦臉地迎上來恤溶,“玉大人,你說我怎么就攤上這事帜羊≈涑蹋” “怎么了?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵讼育,是天一觀的道長帐姻。 經(jīng)常有香客問我稠集,道長,這世上最難降的妖魔是什么饥瓷? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任剥纷,我火速辦了婚禮,結(jié)果婚禮上扛伍,老公的妹妹穿的比我還像新娘筷畦。我一直安慰自己,他們只是感情好刺洒,可當(dāng)我...
    茶點故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布鳖宾。 她就那樣靜靜地躺著,像睡著了一般逆航。 火紅的嫁衣襯著肌膚如雪鼎文。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天因俐,我揣著相機與錄音拇惋,去河邊找鬼。 笑死抹剩,一個胖子當(dāng)著我的面吹牛撑帖,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播澳眷,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼胡嘿,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了钳踊?” 一聲冷哼從身側(cè)響起衷敌,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎拓瞪,沒想到半個月后缴罗,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡祭埂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年面氓,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蛆橡。...
    茶點故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡舌界,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出航罗,到底是詐尸還是另有隱情禀横,我是刑警寧澤屁药,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布粥血,位于F島的核電站柏锄,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏复亏。R本人自食惡果不足惜趾娃,卻給世界環(huán)境...
    茶點故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望缔御。 院中可真熱鬧抬闷,春花似錦、人聲如沸耕突。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽眷茁。三九已至炕泳,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間上祈,已是汗流浹背培遵。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留登刺,地道東北人籽腕。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像纸俭,于是被迫代替她去往敵國和親皇耗。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,627評論 2 350

推薦閱讀更多精彩內(nèi)容