first python script

  • 背景:剛好公司有一個刷數(shù)據(jù)的任務(wù)温艇,就上手了python,早該開始了幔戏。
  • 小結(jié)知識點如下:
  • 1 python的默認編碼是unicode啼器,如果在程序中輸入中文就會有亂碼旬渠,如果文件中中文是utf-8編碼的,就可以用以下這種方式解碼端壳。
import os
import codecs
path = os.getcwd();
print(path);
os.chdir('/Users/liuchaoqun01/Desktop')
print(os.getcwd());
with codecs.open('to see you', encoding='utf-8') as f:
    print(f.read()) 
  • 2 cc助攻的解碼問題:文本文件是latin1編碼的中文告丢,120w行。甚至蛋疼损谦,一直不知道應(yīng)該怎么轉(zhuǎn)為utf-8岖免。經(jīng)cc點化:
with open('d:/res.txt','wb') as w:
    with open(r'd:/entity.list.all.txt','rb') as f:
        for x in f:
            try:
                w.write(x.decode('gb2312').encode('utf8'))
            except Exception:
                w.write(b'\n')

還是一知半解,等待cc指正照捡!

  • 3 這是最后成形的代碼颅湘,本質(zhì)上就是一個數(shù)據(jù)腳本,總共跑了1hour栗精,120w數(shù)據(jù)闯参,其實最后發(fā)現(xiàn)120w的數(shù)據(jù)查詢太耗時了,一開始就應(yīng)該用批量查詢1ⅰ鹿寨!
import sys,re,os
import datetime
import MySQLdb
begin = datetime.datetime.now()
reload(sys)
sys.setdefaultencoding("utf-8")
path = os.getcwd();
os.chdir('/Users/liuchaoqun01/Documents/cloud/input')
predictFile = open('predict.trade2.entity.list.all', 'r')
count = 0
businessList = []
emptyList = []
predictFileList = []
resultList = []
emptyList = []
with open('res.txt','r') as w:
     for business in w:
          line = business.replace('\n', '')
          businessList.append(line)
for predict in predictFile:
     p = re.compile(r'\s|__')
     ss = p.split(predict)
     if len(ss) < 3:
          count = count + 1
          line = '-1'
     else:
          line = "select industryname from aodfeed.industry where industryid = " + (ss[2])
     predictFileList.append(line)
     line = ''
predictFile.close()
print 'The count of blank line is:' + str(count)

# mysql
outputResult = open('/Users/liuchaoqun01/Documents/cloud/output/result', 'w+')
outputEmpty = open('/Users/liuchaoqun01/Documents/cloud/output/empty', 'w+')
conn = MySQLdb.connect(host='10.99.196.227', port=8306, user='test', passwd='xxx', db='xxx', charset='utf8')
cursor = conn.cursor()
for i in range(len(predictFileList)):
     predict = predictFileList[i]
     business = businessList[i]
     if predict == '-1':
          emptyList.append(business + '\t' + '-1')
     else:
          sql = predict
          cursor.execute(sql)
          r = cursor.fetchall()
         # print (business + '\t' + r[0][0].decode('utf-8'))
          resultList.append(business + '\t' + r[0][0])

# write
for out in resultList:
     outputResult.write(out + '\n')
outputResult.close()

for out in emptyList:
     outputEmpty.write(out + '\n')
outputEmpty.close()
print 'process end!'
end = datetime.datetime.now()
print (end - begin)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市薪夕,隨后出現(xiàn)的幾起案子脚草,更是在濱河造成了極大的恐慌,老刑警劉巖原献,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件馏慨,死亡現(xiàn)場離奇詭異,居然都是意外死亡嚼贡,警方通過查閱死者的電腦和手機熏纯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來粤策,“玉大人樟澜,你說我怎么就攤上這事《E蹋” “怎么了秩贰?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長柔吼。 經(jīng)常有香客問我毒费,道長,這世上最難降的妖魔是什么愈魏? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任觅玻,我火速辦了婚禮想际,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘溪厘。我一直安慰自己胡本,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布畸悬。 她就那樣靜靜地躺著侧甫,像睡著了一般。 火紅的嫁衣襯著肌膚如雪蹋宦。 梳的紋絲不亂的頭發(fā)上披粟,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天,我揣著相機與錄音冷冗,去河邊找鬼守屉。 笑死,一個胖子當(dāng)著我的面吹牛蒿辙,可吹牛的內(nèi)容都是我干的胸梆。 我是一名探鬼主播,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼须板,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了兢卵?” 一聲冷哼從身側(cè)響起习瑰,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎秽荤,沒想到半個月后甜奄,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡窃款,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年课兄,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片晨继。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡烟阐,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出紊扬,到底是詐尸還是另有隱情蜒茄,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布餐屎,位于F島的核電站檀葛,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏腹缩。R本人自食惡果不足惜屿聋,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一空扎、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧润讥,春花似錦转锈、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至勒魔,卻和暖如春甫煞,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背冠绢。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工抚吠, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人弟胀。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓楷力,卻偏偏與公主長得像,于是被迫代替她去往敵國和親孵户。 傳聞我的和親對象是個殘疾皇子萧朝,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容