爬蟲蚤霞,不是真正的蟲子镣煮,而是一個能夠通過網(wǎng)絡(luò)自動搜索并抓取特定信息的程序奈搜。我們要通過網(wǎng)絡(luò)搜索資料悉盆,一般都是打開搜索引擎,在搜索框內(nèi)輸入想要搜索的關(guān)鍵詞馋吗,然后還要一個一個的篩選過濾掉無用信息焕盟。爬蟲,不需要人工繁瑣的勞動宏粤,只需要簡單的幾步脚翘,信息就會精準(zhǔn)地擺在面前灼卢。
爬蟲技術(shù)本身是中性的,關(guān)鍵在于能否合規(guī)使用爬蟲技術(shù)来农。一家資產(chǎn)上億鞋真,凈利潤上億的公司,因為不當(dāng)使用爬蟲獲取個人求職信息沃于,被警方立案調(diào)查涩咖。公司所有員工被警方帶走,36名員工被依法批捕繁莹,公司目前已處于停業(yè)狀態(tài)檩互。一個資產(chǎn)過億的公司,幾千萬的民事風(fēng)險在其眼中可能都不值一提咨演,但卻被一段小小的爬蟲代碼徹底摧毀盾似。其過程令人唏噓,其結(jié)果叫人心疼雪标。
公司使用爬蟲技術(shù)應(yīng)當(dāng)如何避免觸碰刑事紅線零院?
01?不是所有信息都可以爬
刑法規(guī)定了非法獲取公民個人信息罪,該罪的表現(xiàn)形式就包含“竊取或者以其他方法非法獲取公民個人信息”的行為村刨。如果通過技術(shù)手段用爬蟲技術(shù)獲取他人未公開的商業(yè)信息告抄,則很有可能構(gòu)成侵犯商業(yè)秘密罪。所以嵌牺,公司在設(shè)定抓取信息內(nèi)容時應(yīng)當(dāng)慎重決定打洼。
02?非公開的信息不要爬
非公開的信息一般都有保護(hù)措施,利用技術(shù)手段突破逆粹、繞開保護(hù)措施而獲取計算機(jī)信息系統(tǒng)中存儲的數(shù)據(jù)的募疮,可能構(gòu)成非法獲取計算機(jī)信息系統(tǒng)數(shù)據(jù)罪。而提供或者編寫侵入他人計算機(jī)信息系統(tǒng)程序或代碼的人僻弹,可能構(gòu)成提供侵入阿浓、非法控制計算機(jī)信息系統(tǒng)程序、工具罪蹋绽。所以芭毙,公司在使用爬蟲程序時不要加入破解保護(hù)措施的代碼。
03?爬蟲速度要控
獲得數(shù)據(jù)當(dāng)然希望越快越好卸耘,越多越好退敦,越全越好。為了保證數(shù)據(jù)獲取的及時性蚣抗,很多爬蟲程序?qū)ε老x獲取頻次侈百、獲取數(shù)據(jù)大小等條件并不設(shè)限。這可能導(dǎo)致他人服務(wù)器的性能降低,如果對方服務(wù)器無法承載就會被爬蟲弄掛钝域,造成計算機(jī)信息系統(tǒng)不能正常運(yùn)行讽坏。這時候,就可能構(gòu)成破壞計算機(jī)信息系統(tǒng)罪网梢。所以,公司在運(yùn)用爬蟲技術(shù)時要明白欲速則不達(dá)的道理赂毯。
04?爬到的信息使用要慎
雖然爬到的內(nèi)容是網(wǎng)絡(luò)公開信息战虏,也不涉及個人信息或他人商業(yè)秘密,但在使用中仍應(yīng)當(dāng)慎重党涕。刑法中有一個罪名叫侵犯著作權(quán)罪烦感,所以,公司在使用爬到的信息時膛堤,應(yīng)當(dāng)著重判斷一下有無侵犯著作權(quán)的行為手趣。
互聯(lián)網(wǎng)時代,數(shù)據(jù)具有巨大的價值肥荔。合法獲取并合理使用才能將價值轉(zhuǎn)化為財富绿渣,稍有不慎,則失去的不僅僅是財富燕耿,還有自由中符。