對四川大學公共管理學院新聞數據爬取的實驗報告

首先生成項目結構

定義要抓取的數據為：新聞標題乔宿、新聞發(fā)生時間窑业、新聞具體內容和uil

找到item文件并進行修改

但是修改失敗了（不知道原因）把修改的url=scrapy.Field()這句刪掉后表示修改成功坑鱼，后面發(fā)現這不是主要原因枷遂。修改失敗主要是權限問題湿蛔，使用root來修改時表現為成功。

進入所在項目子文件

編寫提取item數據的Spider

整個實驗過程最困難的就是這段代碼過程抵知，定位方法選擇的是xpath墙基，感覺它對于非熟練者較為友好。我選擇只爬取了官網主頁的12條新聞刷喜。

在代碼編寫過程中出現了兩個類似問題（感覺都是xpath定位不準導致的語法錯誤）：1残制、在詳情頁爬取的過程中，對時間的爬取出現了一定方面的理解誤差掖疮，導致最后沒能實現對時間的爬取2初茶、在嘗試對新聞具體列表頁進行爬取時出現了類似的問題，但報錯的內容集中在類似于SyntaxError: Non-ASCII character '\xce' in file

/home/lc/venv/news/news/spiders/newsscrapy.py on lin這種浊闪，應該還是語法錯誤恼布。

選取正確代碼執(zhí)行并生成xml文件

最后形成的xml文件

最后編輯于：2017.12.07 06:34:31

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市搁宾，隨后出現的幾起案子折汞，更是在濱河造成了極大的恐慌，老刑警劉巖盖腿，帶你破解...
沈念sama閱讀 218,755評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件爽待，死亡現場離奇詭異，居然都是意外死亡奸忽，警方通過查閱死者的電腦和手機堕伪，發(fā)現死者居然都...
沈念sama閱讀 93,305評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來栗菜，“玉大人欠雌，你說我怎么就攤上這事「沓铮” “怎么了富俄？”我有些...
開封第一講書人閱讀 165,138評論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵禁炒，是天一觀的道長。經常有香客問我霍比，道長幕袱，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,791評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任悠瞬，我火速辦了婚禮们豌，結果婚禮上，老公的妹妹穿的比我還像新娘浅妆。我一直安慰自己望迎，他們只是感情好，可當我...
茶點故事閱讀 67,794評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布凌外。她就那樣靜靜地躺著辩尊，像睡著了一般。火紅的嫁衣襯著肌膚如雪康辑。梳的紋絲不亂的頭發(fā)上摄欲，一...
開封第一講書人閱讀 51,631評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音疮薇，去河邊找鬼胸墙。笑死，一個胖子當著我的面吹牛惦辛，可吹牛的內容都是我干的胖齐。我是一名探鬼主播呀伙，決...
沈念sama閱讀 40,362評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼雨女，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了讼稚？” 一聲冷哼從身側響起锐想，我...
開封第一講書人閱讀 39,264評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發(fā)現了一具尸體饿这，經...
沈念sama閱讀 45,724評論 1贊 315
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡串结，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,900評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年把敞，在試婚紗的時候發(fā)現自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片耽装。...
茶點故事閱讀 40,040評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡期揪，死狀恐怖掉奄，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情横侦，我是刑警寧澤挥萌，帶...
沈念sama閱讀 35,742評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布绰姻，位于F島的核電站，受9級特大地震影響引瀑，放射性物質發(fā)生泄漏狂芋。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,364評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一憨栽、第九天我趴在偏房一處隱蔽的房頂上張望帜矾。院中可真熱鬧，春花似錦屑柔、人聲如沸屡萤。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,944評論 0贊 22
一樁弒父案掸宛，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽死陆。三九已至，卻和暖如春唧瘾，著一層夾襖步出監(jiān)牢的瞬間措译，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,060評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工饰序，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留领虹，地道東北人。一個月前我還...
沈念sama閱讀 48,247評論 3贊 371
代替公主和親
正文我出身青樓求豫，卻偏偏與公主長得像塌衰，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子蝠嘉，可洞房花燭夜當晚...
茶點故事閱讀 44,979評論 2贊 355