什么是UGC內(nèi)容審核
UGC即用戶產(chǎn)生內(nèi)容银锻,目前很多產(chǎn)品都是以UGC為主要產(chǎn)生內(nèi)容的方式,例如百度貼吧(社區(qū))遭京、抖音胃惜、快手、今日頭條哪雕、新浪微博等船殉。在用戶量達(dá)到一定量級(jí)后我們會(huì)發(fā)現(xiàn)用戶產(chǎn)生內(nèi)容的質(zhì)量參差不齊,甚至很多違規(guī)斯嚎、低俗內(nèi)容利虫。這些違規(guī)挨厚、低俗內(nèi)容不僅僅損害社區(qū)氛圍還會(huì)給社區(qū)其他用戶生成內(nèi)容的導(dǎo)向,也就是說很多頭部用戶產(chǎn)生的內(nèi)容(或者露出的內(nèi)容糠惫,如快手的熱門)形成了社區(qū)的內(nèi)容調(diào)性進(jìn)而影響其他用戶產(chǎn)生內(nèi)容的形式疫剃。到這里,內(nèi)容審核的概念就格外明顯硼讽。內(nèi)容審核就是通過內(nèi)部人員的審核以及產(chǎn)品方面其他手段去對(duì)用戶產(chǎn)生的內(nèi)容做限制巢价,這樣可以把以上危害降到最低。
為什么要進(jìn)行內(nèi)容審核
討論這件問題之前理郑,請(qǐng)看下面幾張圖片蹄溉。
我們可以看到,如果沒有內(nèi)容審核的話那么各大平臺(tái)每天會(huì)被大量垃圾信息攻擊您炉,廣告柒爵、違規(guī)違法內(nèi)容,不僅僅對(duì)青少年網(wǎng)民朋友造成不良影響也深深損害到產(chǎn)品自身赚爵,不僅僅造成用戶體驗(yàn)不佳棉胀,更可能造成大量用戶流失。截至17年6月冀膝,中國網(wǎng)民規(guī)模達(dá)到7.51億唁奢,占全球網(wǎng)民總數(shù)的五分之一,越來越多的人利用互聯(lián)網(wǎng)表達(dá)自己的觀點(diǎn)和看法窝剖。為維護(hù)互聯(lián)網(wǎng)環(huán)境的和諧健康以及社會(huì)環(huán)境的安定有序麻掸,需對(duì)一些傳播虛假信息、危害社會(huì)穩(wěn)定以及有傷社會(huì)風(fēng)化的信息及言論進(jìn)行監(jiān)控赐纱、過濾脊奋、刪除、屏蔽或關(guān)閉疙描。
內(nèi)容審核體現(xiàn)在哪些方面
實(shí)際上用戶所有產(chǎn)生的內(nèi)容都需要經(jīng)過審核诚隙,那么這里的內(nèi)容會(huì)根據(jù)產(chǎn)品的不同而進(jìn)行不同的分類。例如短視頻社區(qū)快手起胰,需要什么的內(nèi)容不僅僅只有用戶發(fā)布的短視頻久又,甚至還有用戶編輯的個(gè)人說明等所有露出能夠讓其他用戶看到的內(nèi)容。如百度網(wǎng)盤效五,可能在這里用戶產(chǎn)生的內(nèi)容就是上傳到網(wǎng)盤的內(nèi)容地消,這也是需要審核的。又如今日頭條畏妖,不僅僅要審核頭條號(hào)(個(gè)人犯建、團(tuán)隊(duì)類似微信公眾號(hào))發(fā)布的內(nèi)容,還要審核用戶在新聞下的跟帖瓜客,經(jīng)常會(huì)有一些人在新聞下跟帖發(fā)布一些不良言論。
我們可以看到不同的產(chǎn)品基本上都會(huì)有用戶產(chǎn)生的內(nèi)容,針對(duì)這些內(nèi)容我們都需要做審核谱仪。實(shí)際上我認(rèn)為審核的目的有二:一玻熙、更好的用戶體驗(yàn);二疯攒、良好的內(nèi)容調(diào)性嗦随。每個(gè)用戶在每個(gè)社區(qū)產(chǎn)生的內(nèi)容實(shí)際上會(huì)受到該社區(qū)很多其他用戶的影響,那么只有良好的內(nèi)容調(diào)性才能讓內(nèi)容進(jìn)入一個(gè)正向的循環(huán)敬尺。
UGC內(nèi)容審核策略及方式
目前所有平臺(tái)的內(nèi)容審核都是人工結(jié)合機(jī)器枚尼,很多人工為主機(jī)器為輔的方式進(jìn)行內(nèi)容審核。內(nèi)容審核策略分為兩種:先發(fā)后審砂吞、先審后發(fā)署恍。
審核策略
(1)先發(fā)后審
先發(fā)后審即用戶先將內(nèi)容發(fā)布出去,只需要通過機(jī)器過濾(如關(guān)鍵詞過濾)即可顯示蜻直,并對(duì)其他用戶可見盯质,然后進(jìn)入審核列表等待人工審核。這里可能會(huì)考慮到用戶發(fā)布內(nèi)容的時(shí)效性概而,對(duì)于時(shí)效性強(qiáng)的產(chǎn)品適合使用先發(fā)后審的審核策略呼巷。
(2)先審后發(fā)
先審后發(fā)及用戶將內(nèi)容發(fā)布出去,先需要通過機(jī)器過濾赎瑰,將用戶產(chǎn)生內(nèi)容根據(jù)閾值(命中關(guān)鍵詞權(quán)重值)區(qū)分到高危待審列表王悍、普通待審列表,不符合要求的將會(huì)直接置于審核不通過列表餐曼,其他內(nèi)容等待人工進(jìn)行審核压储。適合很多新聞平臺(tái),權(quán)威性較高的平臺(tái)晋辆,對(duì)內(nèi)容要求高渠脉。例如人人PM社區(qū),用戶發(fā)布的文章需要通過編輯的審核瓶佳,審核通過后才能發(fā)出芋膘。
在策略選擇上面需要考慮產(chǎn)品的特性,有針對(duì)性的選擇霸饲。對(duì)于大量數(shù)據(jù)的審核为朋,交給人工是非常浪費(fèi)人力物力的,成本很高厚脉。那么在這樣的場景之下只需要單純的機(jī)器過濾习寸,其他事情交給用戶參與(用戶舉報(bào))。這樣我們只需要維護(hù)機(jī)器過濾的關(guān)鍵詞詞庫傻工,以及過濾的其他規(guī)則霞溪。同時(shí)處理用戶舉報(bào)的小部分內(nèi)容孵滞,大大降低運(yùn)營成本。
審核方式
(1)沉貼
沉貼即用戶產(chǎn)生的內(nèi)容只對(duì)他自己可見鸯匹,其他用戶無法看到坊饶。也就是說沉貼操作是用戶感知不到的,也是被大量應(yīng)用在很多場景之下殴蓬。
(2)刪除
刪除即將用戶產(chǎn)生內(nèi)容刪除匿级,自己不可見,其他用戶也無法看見染厅。同時(shí)可能伴隨站內(nèi)消息提醒痘绎,告知用戶內(nèi)容違規(guī)等。
(3)禁言
禁言即在一個(gè)時(shí)間段內(nèi)(時(shí)間規(guī)范)讓用戶無法發(fā)布內(nèi)容肖粮,也就是經(jīng)常說到的小黑屋孤页。具體禁言的時(shí)間段是需要提前指定一個(gè)規(guī)范的,通過閾值實(shí)現(xiàn)尿赚。
(4)封號(hào)(黑名單)
封號(hào)即將用戶帳號(hào)封掉散庶,封后不能夠發(fā)布內(nèi)容,僅能瀏覽凌净,甚至有些產(chǎn)品會(huì)直接將入口對(duì)封號(hào)用戶不可見悲龟。封號(hào)實(shí)際上涉及到兩種方式:一種是封uid,另一種是封imei(設(shè)備串號(hào))冰寻,不同方式使用在不同的場景须教。在這里我們需要考慮到把用戶封號(hào)后對(duì)于用戶之前產(chǎn)生的內(nèi)容怎么操作,一般來說都是將用戶產(chǎn)生的所有內(nèi)容抹掉斩芭。
(5)內(nèi)容轉(zhuǎn)移
內(nèi)容轉(zhuǎn)移即將帖子內(nèi)容不符合所在板塊的轻腺,轉(zhuǎn)移至相應(yīng)的板塊內(nèi)。
機(jī)器過濾機(jī)制
(1)關(guān)鍵詞過濾
建立違禁詞庫划乖,詞庫可分為敏感贬养、違禁等。在用戶點(diǎn)擊發(fā)布的同時(shí)對(duì)用戶發(fā)布的內(nèi)容進(jìn)行關(guān)鍵詞過濾琴庵,如帖子標(biāo)題误算、內(nèi)容進(jìn)行關(guān)鍵詞過濾,并且根據(jù)設(shè)定的命中關(guān)鍵詞的權(quán)重值對(duì)其進(jìn)行操作迷殿。這里的詞庫是需要通過運(yùn)營維護(hù)的儿礼,人工定期的添加才能保證關(guān)鍵詞過濾的效果。
(2)重復(fù)內(nèi)容過濾
重復(fù)內(nèi)容過濾能極大的限制廣告內(nèi)容庆寺、灌水蚊夫,我們可以看到大部分廣告內(nèi)容都是CV工程師發(fā)布的。(CV即Ctrl+C Ctrl+V復(fù)制粘貼)大部分內(nèi)容都是一模一樣的可能會(huì)略微改動(dòng)一些但是相似度不會(huì)低于80%懦尝,重復(fù)內(nèi)容對(duì)比前需要對(duì)標(biāo)點(diǎn)符號(hào)等無關(guān)信息屏蔽知纷,在用戶發(fā)布前對(duì)重復(fù)內(nèi)容進(jìn)行過濾并彈出toast提示用戶不要發(fā)布重復(fù)內(nèi)容壤圃。
(3)限制發(fā)布次數(shù)
這里同樣能夠很有效的降低用戶刷帖、灌水屈扎、發(fā)布廣告等內(nèi)容埃唯。對(duì)用戶發(fā)布次數(shù)進(jìn)行限制,如每天只能發(fā)布10個(gè)帖子等鹰晨,具體次數(shù)限制需要根據(jù)后臺(tái)數(shù)據(jù),對(duì)異常用戶及普通用戶行為數(shù)據(jù)進(jìn)行分析對(duì)比進(jìn)而設(shè)定對(duì)應(yīng)的限制發(fā)布次數(shù)止毕,因?yàn)槲覀儾恢榔胀ㄓ脩裘刻炱骄l(fā)布的帖子數(shù)量模蜡。
(4)根據(jù)用戶屬性過濾
根據(jù)不同用戶人群,將用戶發(fā)布的內(nèi)容進(jìn)行過濾扁凛。例如將用戶分為新人(注冊7天內(nèi)的用戶)忍疾、KOL(Key Opinion Leader 關(guān)鍵意見領(lǐng)袖)、高危用戶(有過違禁記錄的用戶)及普通用戶等谨朝,由于他們的行為特征不同卤妒,可以采取不同的審核策略。如新人字币,大部分新人都在消費(fèi)內(nèi)容则披,極少的新人會(huì)產(chǎn)生內(nèi)容,因此對(duì)新人產(chǎn)生的內(nèi)容我們是需要進(jìn)行審核的洗出,可以采取機(jī)器過濾+人工審核的方式士复。
其他
實(shí)際上審核方式、審核策略翩活、人工審核阱洪、機(jī)器過濾等都是為了社區(qū)內(nèi)良好的內(nèi)容氛圍,進(jìn)而提升用戶體驗(yàn)菠镇,那么以提升內(nèi)容氛圍為目的的話一下還有幾種方式冗荸。
(1)通過產(chǎn)品機(jī)制提高用戶生成內(nèi)容門檻
例如用戶在綁定手機(jī)號(hào)、完善資料前不能發(fā)布內(nèi)容利耍,新用戶在注冊X小時(shí)內(nèi)不能發(fā)布內(nèi)容等蚌本。
(2)舉報(bào)/反饋機(jī)制
讓用戶參與到審核工作當(dāng)中,通過舉報(bào)給與用戶一定積分獎(jiǎng)勵(lì)等堂竟,讓用戶有動(dòng)力參與進(jìn)來魂毁,同時(shí)通過積分等將用戶引導(dǎo)到產(chǎn)品其他板塊。讓每個(gè)用戶參與到審核工作中出嘹,既能夠提升用戶的參與度席楚,還大大降低了公司的運(yùn)營成本。另外税稼,用戶每次舉報(bào)最好能夠有一個(gè)對(duì)應(yīng)的反饋烦秩,讓用戶看到他的舉報(bào)是有效的并不是無疾而終的垮斯。
(3)內(nèi)容調(diào)性
在內(nèi)容冷啟動(dòng)階段對(duì)社區(qū)內(nèi)容調(diào)性做一個(gè)規(guī)范化,通過內(nèi)容調(diào)性引導(dǎo)用戶產(chǎn)生相應(yīng)的內(nèi)容只祠。
以上則是我對(duì)UGC內(nèi)容審核的一些淺薄的觀點(diǎn)和看法兜蠕,如有紕漏歡迎指正。