焰火青春 - 簡書

焰火青春

IP屬地：廣東

【大數(shù)據(jù)】PySpark 使用 FileSystem 操作 HDFS
需求：spark 可以直接使用 textFile 讀取 HDFS，但是不能判斷 hdfs 文件是否存在，不過 pyspark 可以調(diào)用 java...

0.2 1032 0 1
【Python】插入記錄并獲取其自增ID（PyMysql）
需求：一次插入多條，獲取每條記錄的自增 ID 注意：獲取 ID 必須在 commit 之前，否則獲取為 0

0.2 3971 0 1

【Linux】根據(jù)進程?ID?查找進程文件地址
需求：服務(wù)器近幾日多次因為運存不足導(dǎo)致重啟族壳，找到相應(yīng)程序運行地址

0.2 477 0 1
【大數(shù)據(jù)】使用隊列復(fù)制 Hadoop 文件
使用隊列資源拷貝 HDFS 文件：

0.2 111 0 1
【大數(shù)據(jù)】Spark 遞歸讀取 HDFS
HDFS 若有子目錄，Spark 是不能遞歸讀取子目錄趣些，需要在 spark-submit 中配置以下參數(shù)：

0.2 909 0 1
【Python】遍歷字典的同時刪除某個 key
需求：遍歷字典時仿荆，刪除某個 key 正常情況下是不能直接刪除的，需要借助其他方式：優(yōu)化后：

0.2 1173 0 1
基于某種規(guī)則對一個list-dict進行排序|Python
需求：有數(shù)據(jù) urls、data_list拢操，現(xiàn)在需要根據(jù) urls 的順序來排序锦亦，最終輸出的結(jié)果 html_list、url_list 是相對應(yīng)...

0.2 169 0 1

es 寫入 refresh 導(dǎo)致集群全局索引刷新
es_client.indices.refresh(index=index_name)令境，若不指定 index會導(dǎo)致全局刷新

0.2 529 0 1
spark 讀取 ES（es.resource配置）
es.resource 可配置為： ES 別名單個索引名/doc_type 索引1,索引2,索引3

0.2 976 0 1