2.20-2.22號(hào)童本,參加了《目標(biāo)達(dá)成術(shù)》的三次課程,具體的總結(jié)和周目標(biāo)的實(shí)施過(guò)程躁锁,查看文章:《01期『目標(biāo)達(dá)成術(shù)』訓(xùn)練營(yíng)總結(jié)——人生總有些目標(biāo)要全力以赴》
我學(xué)習(xí)到了什么
我達(dá)成了什么樣的目標(biāo),目標(biāo)的是否成功了?
最終目標(biāo)沒(méi)有成功绿饵,沒(méi)有爬取將學(xué)習(xí)了《用Python寫網(wǎng)絡(luò)爬蟲(chóng)》《Python網(wǎng)絡(luò)數(shù)據(jù)采集》和查找了很多技術(shù)網(wǎng)站上的資料,實(shí)現(xiàn)了“將廖雪峰的Git教程轉(zhuǎn)換成PDF文檔”瓶颠。
答疑課上的問(wèn)答
在3.1日的“答疑課”上拟赊,我問(wèn)了這樣的問(wèn)題:
【姓名】我是MiracleWong,學(xué)號(hào):048
【目標(biāo)】使用Python爬取『永澄老師』(YCMentor)微信公眾號(hào)的文章并進(jìn)行前端展示
【問(wèn)題】我遇到的問(wèn)題/ 困惑是:
【1】過(guò)程中發(fā)現(xiàn)初始目標(biāo)完不成粹淋,重新修整目標(biāo)算不算沒(méi)有完成吸祟?
【2】目標(biāo)太難,微信沒(méi)有提供可調(diào)用的接口桃移,找了很多技術(shù)文章屋匕,沒(méi)有成型的方法。爬取下來(lái)的內(nèi)容都是松散的借杰,不成段过吻,有的因?yàn)楦袷降膯?wèn)題都連不成句。
【3】但是在爬取其他的網(wǎng)站,比如『廖雪峰的Git教程』纤虽,可以爬取下來(lái)乳绕,并制成PDF文檔
@永澄老師給出的回答是:
【1】完成目標(biāo)是關(guān)鍵,更關(guān)鍵的是你要判斷:為什么一開(kāi)始你覺(jué)得自己可以完成目標(biāo)逼纸?而實(shí)際上不能了洋措?你的假設(shè)哪里出錯(cuò)了,以后要怎么改進(jìn)杰刽,如何避免這種錯(cuò)誤再發(fā)生菠发。
【2】后面兩點(diǎn),是你的描述性文字贺嫂,不做反饋滓鸠。你比較廖雪峰的網(wǎng)站這個(gè)思路不對(duì)吧?你應(yīng)該爬其他的公眾號(hào)暗谠糜俗?如果其他公眾號(hào)能爬下來(lái),再考慮我的啊墩弯。
我的觸動(dòng):
【1】定目標(biāo)的時(shí)候吩跋,總是不能明確自己的假設(shè),經(jīng)常高估自己的能力渔工,自己做的時(shí)候锌钮,往往希望去死磕一下,但是闖不過(guò)去的話引矩,就會(huì)沮喪梁丘,然后就會(huì)拖延。這種情緒經(jīng)常產(chǎn)生旺韭,現(xiàn)在的話可以進(jìn)行控制氛谜。
【2】練習(xí)PORT和RSQC模型次數(shù)較少,還需要刻意練習(xí)区端。
我的復(fù)盤
以下內(nèi)容值漫,采用的是《管理復(fù)盤》中的復(fù)盤的格式:
目標(biāo)是什么?
通過(guò)Python+網(wǎng)絡(luò)爬蟲(chóng)爬取“永澄老師”(YCMentor)微信公眾號(hào)的文章织盼,并進(jìn)行前端的展示
背后的假設(shè)是什么杨何?
- 微信文章的文章是可以被爬取的。
- 自己有通過(guò)Python+網(wǎng)絡(luò)爬蟲(chóng)的能力沥邻。
- 可以根據(jù)原文排版危虱,在前端對(duì)數(shù)據(jù)進(jìn)行還原。
為什么沒(méi)有完成唐全,有哪些假設(shè)是錯(cuò)誤的埃跷?
- 高估了自己的能力。其實(shí)自己并沒(méi)有完全的掌握網(wǎng)絡(luò)爬蟲(chóng)的技術(shù),但是希望通過(guò)這個(gè)周目標(biāo)計(jì)劃進(jìn)行達(dá)成弥雹。
- 低估了問(wèn)題的難度垃帅。在查找解決方案的過(guò)程中,微信并沒(méi)有給出相應(yīng)的API接口缅糟,因此通過(guò)微信公眾平臺(tái)獲取相應(yīng)的數(shù)據(jù)挺智。很多人只是給出了假象解決的方案祷愉,沒(méi)有成熟的解決方法窗宦。
- 爬去數(shù)據(jù)過(guò)程中的問(wèn)題。數(shù)據(jù)是可以爬取出來(lái)二鳄,但是因?yàn)榕虐娓袷降脑蚋昂芏嗟臄?shù)據(jù)都不是一整段的,而是根據(jù)加粗和顏色的不同订讼,分成了一句句或者是幾個(gè)字髓窜,這樣的數(shù)據(jù)不能夠進(jìn)行前端還原。
- 微信的統(tǒng)一性欺殿。因?yàn)槲⑿诺墓娞?hào)是統(tǒng)一的寄纵,因?yàn)椤坝莱卫蠋煛蔽⑿殴娞?hào)的文章爬去不成功,其他的也就爬去不成功脖苏,這樣就回答了永澄老師的問(wèn)題程拭。至于比較“廖雪峰的網(wǎng)站”,是因?yàn)樗木W(wǎng)站適合爬取棍潘。
以后怎么進(jìn)行改進(jìn)恃鞋,避免這種錯(cuò)誤的發(fā)生?
- 降低自己的目標(biāo)亦歉,不要高估恤浪,同時(shí)在制定目標(biāo)的時(shí)候,要進(jìn)行全方位的考慮肴楷,目標(biāo)的難度超過(guò)自己一點(diǎn)點(diǎn)就可以了水由。要牢記“量小、短期赛蔫、有能量”的原則砂客。比如如果當(dāng)時(shí),將目標(biāo)定為“爬取廖雪峰網(wǎng)站Git的教程濒募,并導(dǎo)出為PDF文檔”就可以進(jìn)行實(shí)現(xiàn)了鞭盟。
- 可以遇見(jiàn)的將來(lái),可能還會(huì)有幾次發(fā)生類似的事情瑰剃,只能是將錯(cuò)誤的概率和影響降低齿诉,隨著練習(xí)的逐步增多,才可以完全地避免發(fā)生。
- 刻意練習(xí)PORT模型和RSQC模型粤剧。需要至少練習(xí)很多次歇竟,先曾周目標(biāo)開(kāi)始,在逐步的擴(kuò)展到月計(jì)劃等抵恋。
我的擴(kuò)展
后來(lái)找到的類似的網(wǎng)站——傳送門焕议,通過(guò)爬蟲(chóng)的技術(shù),將微信上的文章弧关,爬取下來(lái)再組合成自己的網(wǎng)站盅安,但是他的實(shí)現(xiàn)形式和別人的不一樣,很值得自己分析學(xué)習(xí)世囊,但是現(xiàn)在自己的能力還實(shí)現(xiàn)不了别瞭。