這兩天一直想做的客棧市場以及競品消息搜集工具開始成型了经磅。作為只在10年前學過一點C語言皮毛的我预厌,這次學習python來實現自己的需求苗沧,領悟到了一些道理,和大家分享甥角。
1.機器不會錯嗤无,如果錯了当犯,一定是人的問題
2.思維定勢,讓人對錯誤視若無睹驰凛,比如:
1.page = request.GET.get('page',1)
寫成get, Get,尤其是Get ,還完全意識不到自己的錯誤。
2.在使用爬蟲時胚宦, 把 soup = Beautiful( *.text, 'lxml') 寫成 *.txt,意識不到自己的錯誤枢劝。
把 web_data, 寫成 wb_data, 意識不到自己的錯誤。
眼睜睜的看著實例都能寫錯鹤盒,可見思維定勢的強大侦锯。
那日常生活中,工作中亲桥,學習中皂甘,有多少是因為思維定勢,而讓你錯失了了解真相的機會呢?
下圖是一個很明顯的例子嗤锉。
為什么會這樣触菜?
在心理學上哲泊,定勢又稱心向,是指主體對一定活動的預先的特殊準備狀態(tài)。具體地說槽袄,人們當前的活動常受前面從事的活動的影響烙无,傾向于帶有前面活動的特點遍尺。當這種影響發(fā)生在知覺過程中時截酷,產生的就是知覺定勢。
因此乾戏,你對現有事物的認知和反應,依據于你過往對類似事務的認知和經驗三幻。
當你去認知新事物的時候,是無法知道自己錯在哪里了的首妖。正如你不能提著自己的衣領把自己舉起來温亲。
怎么破?
結識和你有不同背景,具有高度自知之明的人头镊,通過和他們的互相探討坛芽,來逐步拼湊出事情更完整的面貌。
3-對于高門檻的新技能帅矗,付錢學習是最便宜高效的入門方法
Python 其實我15年初九嚷嚷在學偎肃,學到年底,也不過可以編一些計算類的(比如漢諾塔什么的)小程序自娛自樂浑此。
11月份報了實戰(zhàn)計劃的爬蟲入門班累颂,包括過年,產品更新迭代上新版等等凛俱,到目前4個多月時間紊馏,我已經能夠用Django搭建自己的簡單網站,展示自己爬取的簡單數據(搜狗數據還是不行最冰,js控制的數據有部分不行)瘦棋,并從中受益稀火。
如果早知道暖哨,我會早去花錢學習。而不是自己茫然地在網上導出尋找免費資料凰狞,浪費了近1年的時間篇裁。
為什么呢?
在入門的時候赡若,我們其實還沒有掌握尋找問題的方法达布,更不用說怎么去解決。而高門檻的新技能一般有復雜的初始要求逾冬,比如說配置電腦環(huán)境:python3.X升級黍聂, pip的安裝,pycharm的安裝身腻,mongdo的安裝产还,這些問題,隨便一個都能讓尚未入門的小白折騰一天嘀趟,然后發(fā)現自己連生產工作都搞不定脐区,更不要說學習生產了,只好絕望放棄她按。
所謂師傅領入門牛隅,是讓你在碰到這些問題的時候,指導你該如何去尋找解決的辦法酌泰。
然后媒佣,才有可能自學。
4. 剛需陵刹,是戰(zhàn)勝任何困難的第一推動力
學習爬蟲有個很關鍵的目標默伍,是想做一個自己的信息搜集器。
把和客棧相關的所有信息,能夠搜集到一個地方巡验,自己每天可以閱讀际插。
這是我作為產品的剛需:了解市場,了解競品显设。
因此每次遇到困難的時候框弛,也只能咬咬牙,然后到處查資料問人捕捂,知道最后完成瑟枫。
如果只是玩玩而已的話,早放棄了指攒。
5. 先整理思路框架慷妙,再開干
寫程序的時候,先想清楚要干什么允悦,比馬上開始干重要膝擂。
比如我寫36氪的爬蟲的時候,第一次只想爬文章標題隙弛,鏈接架馋。
爬完之后發(fā)現不夠,于是改數據庫全闷,加上了品類叉寂;之后發(fā)現需要時間否則排序有問題,又改數據庫总珠,加上了時間屏鳍。而在寫知乎的時候,吸取之前的經驗局服,一開始把所有需要的內容都整理列出來钓瞭,然后再寫,效率明顯提高腌逢。
寫完36氪一個品類的爬蟲之后降淮,寫第二個品類的爬蟲寫到一半才意識到自己可以把品類作為參數每次輸入,爬蟲本身是一樣的搏讶。
于是標準化了爬蟲佳鳖,增加了參數輸入。
當然媒惕,這些問題其實都很菜鳥系吩,通過這些菜鳥的步驟,我們才能慢慢學習成長妒蔚。
6. 集中地長時間的反復練習穿挨,才有可能前進
年后因為要準備3.0新版的事情月弛,忙到經常一周才學習一次,每次有60%的時間都在回顧之前學到哪里了科盛,怎么做的帽衙。40%的時間來往前走一小步。對于學習而言贞绵,是效率很低的方式厉萝。
315這周,3.0上線了榨崩,于是恢復了早上學習1個小時谴垫,周末花半天學習的習慣。速度明顯加快母蛛,第一版半成品的客棧輿情網也做出來了翩剪。
一般的編程(不涉及到高級的算法什么的),其實是門手藝活彩郊,熟能生巧前弯。因此,手熟很重要焦辅。