01
今天就是一年一度的七夕節(jié)梆砸,又會(huì)有無(wú)數(shù)單身汪在這一天飽受狗糧的折磨悬而,這段時(shí)間社交軟件的活躍度相比也有大幅增長(zhǎng)的現(xiàn)象临庇,想必這一定是單身汪們?cè)谧鲋顾罀暝憬兀谕谶@一周中收獲另一半麸塞。
對(duì)于社交平臺(tái)來(lái)說(shuō),“機(jī)遇與挑戰(zhàn)”并存涧衙,日活躍用戶大幅增加帶來(lái)變現(xiàn)和盈利的可能性也增加哪工,同時(shí),垃圾用戶及惡意營(yíng)銷(xiāo)也有機(jī)會(huì)乘虛而入弧哎。
02
一直以來(lái)雁比,經(jīng)常會(huì)有平臺(tái)被強(qiáng)制下架,其中社交軟件或者帶有社交屬性的軟件占了很大一部分份額撤嫩,下架原因無(wú)外乎是涉黃偎捎。
盡管社交軟件或者帶社交屬性的軟件本身合規(guī)合法,但是一旦被扣上涉黃的帽子序攘,就會(huì)被勒令下架或者整改茴她。
03
為什么社交軟件總是容易充斥涉黃信息呢?
因?yàn)樯缃卉浖?nèi)容發(fā)布的門(mén)檻是最低的程奠。事實(shí)上只需要手機(jī)號(hào)败京,任何人都可以進(jìn)入到社交平臺(tái)發(fā)布信息,而且正因?yàn)樯缃黄脚_(tái)特有的包容性梦染,例如不強(qiáng)制實(shí)名赡麦、不要求對(duì)身份驗(yàn)證等,無(wú)疑給垃圾用戶提供了便利帕识,內(nèi)容失控也成為了足以“潰千里之堤的蟻穴”泛粹。社交平臺(tái)中,包括頭像肮疗、用戶昵稱(chēng)晶姊、評(píng)論區(qū)、私聊伪货,只要是有文字和圖像的地方们衙,都必須嚴(yán)加防控。
04
4個(gè)月前碱呼,國(guó)家網(wǎng)信辦宣布啟動(dòng)針對(duì)即時(shí)通信工具專(zhuān)項(xiàng)整治行動(dòng)蒙挑,針對(duì)后者傳播違法違規(guī)信息、匿名注冊(cè)愚臀、欺詐誘騙忆蚀、為線下違法違規(guī)活動(dòng)提供平臺(tái)服務(wù)等行業(yè)亂象,進(jìn)行深入巡查和測(cè)試。
根據(jù)網(wǎng)信辦公開(kāi)的信息馋袜,首批清理關(guān)湍衅欤“比鄰”“聊聊”“密語(yǔ)”等9款傳播淫穢色情信息,或?yàn)檎墟钨u(mài)淫欣鳖、售賣(mài)淫穢色情音視頻等提供推廣和平臺(tái)服務(wù)的即時(shí)通信工具察皇。
05
社交平臺(tái)已經(jīng)成為因涉黃涉騙被下架的重災(zāi)區(qū),那么有什么方法可以遏制這股“下架潮”泽台?
社交平臺(tái)必備的內(nèi)容輸出屬性让网,決定了平臺(tái)在內(nèi)容管控這方面不可撼動(dòng)的地位。
那么無(wú)論是UGC社交內(nèi)容運(yùn)營(yíng) APP還是陌生人交友婚戀平臺(tái) APP师痕,都亟需內(nèi)容管控的加持。
內(nèi)容管控相對(duì)來(lái)說(shuō)而账,最完備的一個(gè)思路就是:“賬號(hào)準(zhǔn)入+敏感詞策略+決策引擎+舉報(bào)機(jī)制”胰坟。
06
賬號(hào)準(zhǔn)入體系:用戶在注冊(cè)階段攔截黑產(chǎn)用戶。
基本上微商泞辐、博彩引流笔横、以及涉黃涉政內(nèi)容發(fā)布的這些賬號(hào),都是通過(guò)卡商和接碼平臺(tái)批量注冊(cè)使用咐吼,獲取數(shù)百萬(wàn)的驗(yàn)證碼吹缔。這就表明這些手機(jī)號(hào)本身,就有足夠的特征和維度锯茄∠崽粒卡商或者黑產(chǎn)獲取手機(jī)號(hào)都是多次利用,所以這些手機(jī)號(hào)一般都是被標(biāo)記過(guò)的肌幽。
因此晚碾,在注冊(cè)的時(shí)候,建議對(duì)手機(jī)號(hào)加一層準(zhǔn)入規(guī)則喂急,常規(guī)的手段是禁止小號(hào)和虛擬號(hào)格嘁,進(jìn)一步的話就需要采購(gòu)第三方賬號(hào)側(cè)反作弊套件,大多就是輸入手機(jī)號(hào)+IP廊移,可以返回一個(gè)標(biāo)簽糕簿,關(guān)于手機(jī)號(hào)的畫(huà)像,也會(huì)有風(fēng)險(xiǎn)分狡孔。
業(yè)務(wù)可以根據(jù)返回的值判斷風(fēng)險(xiǎn)懂诗,現(xiàn)在阿里有的是電商黑庫(kù),騰訊有社交黑庫(kù)苗膝,網(wǎng)易有游戲黑庫(kù)响禽,雷木數(shù)據(jù)數(shù)據(jù)有運(yùn)營(yíng)商維度黑庫(kù),都是T+0實(shí)時(shí)更新。
同時(shí)黑產(chǎn)獲取手機(jī)號(hào)成本較高芋类,黑產(chǎn)的手機(jī)號(hào)做不到實(shí)時(shí)更新隆嗅,所有基本通過(guò)手機(jī)號(hào)就可以識(shí)別98%以上的黑產(chǎn),企業(yè)只需要拿著手機(jī)號(hào)去測(cè)各家的數(shù)據(jù)的準(zhǔn)確率和誤殺率即可侯繁。
在用戶注冊(cè)的階段添加一個(gè)護(hù)城墻胖喳,基本上黑產(chǎn)是沒(méi)有越過(guò)的,因?yàn)榻^大多數(shù)黑產(chǎn)沒(méi)有這樣的技術(shù)實(shí)力贮竟。
07
敏感側(cè)策略:現(xiàn)階段企業(yè)主要使用的是外采詞庫(kù)和內(nèi)部自己維護(hù)的動(dòng)態(tài)詞庫(kù)丽焊。
外采一般是通過(guò)第三方的安全廠商API接口使用的,可以嵌入用戶錄入的文本咕别,這樣就可以快速識(shí)別違禁詞語(yǔ)技健。
不過(guò)建議企業(yè)還是自己組建詞庫(kù),需要一套應(yīng)用策略惰拱,包含敏感詞收集策略雌贱、敏感詞應(yīng)用策略、敏感詞處置策略偿短。
圖片違規(guī)主要分為兩種欣孤,第一種是黃恐暴類(lèi)圖片,圖片本身就有問(wèn)題昔逗,第二種是圖片本身沒(méi)問(wèn)題降传,但是圖片里面水印或者信息會(huì)有加微信引流的信息。
08
決策引擎:基礎(chǔ)邏輯就是通過(guò)算法和策略提取用戶的特征勾怒,在用這些特征計(jì)算獨(dú)有的風(fēng)險(xiǎn)分婆排。
例如如何判斷一個(gè)人是美女,我們就需要對(duì)注冊(cè)進(jìn)來(lái)的女孩子提取特征笔链,可提取的特征維度有很多泽论,最簡(jiǎn)單的就是身高、體重卡乾、三圍等等翼悴,一般的算法工程師通過(guò)這個(gè)三個(gè)維度來(lái)計(jì)算個(gè)分值,就用這分值來(lái)判斷是否是美女幔妨。當(dāng)然也會(huì)有算法工程師提取更多維度鹦赎,比如容貌、身高误堡、年齡古话、三圍等等,再通過(guò)這些維度計(jì)算一個(gè)分值锁施,用來(lái)計(jì)算是否美女陪踩。
理論上杖们,企業(yè)提取的維度越多就判斷的越準(zhǔn)確。一般企業(yè)的風(fēng)控分析師會(huì)提取數(shù)十萬(wàn)個(gè)特征肩狂,再通過(guò)這些特征判斷用戶是否違禁摘完。
09
舉報(bào)機(jī)制:企業(yè)需要一個(gè)有效的舉報(bào)機(jī)制,通過(guò)忠實(shí)用戶的舉報(bào)來(lái)防范這些違禁用戶傻谁。忠實(shí)的用戶看到違規(guī)內(nèi)容都是會(huì)去舉報(bào)的孝治,然后再轉(zhuǎn)到人工審核機(jī)制,就可以及時(shí)地封禁這些用戶和內(nèi)容审磁。
10
說(shuō)起來(lái)簡(jiǎn)單但是做起來(lái)卻是很難谈飒,這也是為什么持續(xù)會(huì)有企業(yè)被“安排”。小微企業(yè)一般外采賬號(hào)準(zhǔn)入體系和文字圖片識(shí)別就足夠企業(yè)使用态蒂,中型企業(yè)和小微企業(yè)比較類(lèi)似杭措,只不過(guò)需要賬戶準(zhǔn)入體系的維度加大,就可以足夠去攻防钾恢,大型企業(yè)就需要添加行為特征和設(shè)備的一些信息去攻防手素。
今天的夜話接近尾聲,雷木數(shù)據(jù)在此再次祝大家節(jié)日快樂(lè)赘那!