說(shuō)明:提交做題時(shí)的錄屏視頻二鳄。
1奥溺、爬蟲(chóng)類(選1題)
(1)爬深交所2019-03-26這一天上市公司公告,結(jié)果保存為dataframe格式愉镰。地址:http://www.szse.cn/disclosure/listed/notice/index.html
(2)爬中國(guó)貨幣網(wǎng)機(jī)構(gòu)信息米罚,結(jié)果保存為dataframe格式。地址: http://www.chinamoney.com.cn/chinese/qwjsn/?searchValue=
2丈探、抓取豆瓣新片榜的前10個(gè)電影录择,要求利用lxml抓取html頁(yè)面、xpath定位電影,并且按順序排成一個(gè)list隘竭。
3塘秦、利用re抽取以下數(shù)據(jù),并利用json庫(kù)解析成dict數(shù)據(jù)动看。
a_str = ' jsonpCallback92685{"areaName":"","csrcCode":"","downloadFileName":null,"execlStream":null,"jsonCallBack":"jsonpCallback92685","pageHelp":{"beginPage":1,"cacheSize":1,"data":1,"stockCode":"","stockType":"1"}}'
4尊剔、
aa1 = [['高速1',56656],['高速2(備注)',5662],['高速3[1]',545],['高速4',775],['高速6',78]]
aa2 = [['高速1',78798],['高速2',6524445],['高速3',343],['高速4',21215],['高速5',21215]]
將上面兩個(gè)列表轉(zhuǎn)為dataframe格式,
將aa2的轉(zhuǎn)為2016的日均收入菱皆。
并且按照外聯(lián)結(jié)的方式合并成一個(gè)dataframe
5须误、
df_list = [['','干擾列1','營(yíng)業(yè)收入','干擾列2'],['高速1',23434,45454,5454],['高速2',6756,24,5465454],['高速3',3435,45454,5656],['其他項(xiàng)目',3435,45454,8989]]
將該列表轉(zhuǎn)化為dataframe格式后,從中抽取出營(yíng)業(yè)收入列和高速x所在的行數(shù)據(jù)仇轻,并保存為excel格式(顯示列表頭京痢,但不顯示行表頭)。