淺談UGC內(nèi)容審核及過濾機(jī)制

什么是UGC內(nèi)容審核

UGC即用戶產(chǎn)生內(nèi)容银锻,目前很多產(chǎn)品都是以UGC為主要產(chǎn)生內(nèi)容的方式,例如百度貼吧(社區(qū))遭京、抖音胃惜、快手、今日頭條哪雕、新浪微博等船殉。在用戶量達(dá)到一定量級(jí)后我們會(huì)發(fā)現(xiàn)用戶產(chǎn)生內(nèi)容的質(zhì)量參差不齊,甚至很多違規(guī)斯嚎、低俗內(nèi)容利虫。這些違規(guī)挨厚、低俗內(nèi)容不僅僅損害社區(qū)氛圍還會(huì)給社區(qū)其他用戶生成內(nèi)容的導(dǎo)向,也就是說很多頭部用戶產(chǎn)生的內(nèi)容(或者露出的內(nèi)容糠惫,如快手的熱門)形成了社區(qū)的內(nèi)容調(diào)性進(jìn)而影響其他用戶產(chǎn)生內(nèi)容的形式疫剃。到這里,內(nèi)容審核的概念就格外明顯硼讽。內(nèi)容審核就是通過內(nèi)部人員的審核以及產(chǎn)品方面其他手段去對(duì)用戶產(chǎn)生的內(nèi)容做限制巢价,這樣可以把以上危害降到最低。

為什么要進(jìn)行內(nèi)容審核

討論這件問題之前理郑,請(qǐng)看下面幾張圖片蹄溉。

1
2

我們可以看到,如果沒有內(nèi)容審核的話那么各大平臺(tái)每天會(huì)被大量垃圾信息攻擊您炉,廣告柒爵、違規(guī)違法內(nèi)容,不僅僅對(duì)青少年網(wǎng)民朋友造成不良影響也深深損害到產(chǎn)品自身赚爵,不僅僅造成用戶體驗(yàn)不佳棉胀,更可能造成大量用戶流失。截至17年6月冀膝,中國網(wǎng)民規(guī)模達(dá)到7.51億唁奢,占全球網(wǎng)民總數(shù)的五分之一,越來越多的人利用互聯(lián)網(wǎng)表達(dá)自己的觀點(diǎn)和看法窝剖。為維護(hù)互聯(lián)網(wǎng)環(huán)境的和諧健康以及社會(huì)環(huán)境的安定有序麻掸,需對(duì)一些傳播虛假信息、危害社會(huì)穩(wěn)定以及有傷社會(huì)風(fēng)化的信息及言論進(jìn)行監(jiān)控赐纱、過濾脊奋、刪除、屏蔽或關(guān)閉疙描。

內(nèi)容審核體現(xiàn)在哪些方面

實(shí)際上用戶所有產(chǎn)生的內(nèi)容都需要經(jīng)過審核诚隙,那么這里的內(nèi)容會(huì)根據(jù)產(chǎn)品的不同而進(jìn)行不同的分類。例如短視頻社區(qū)快手起胰,需要什么的內(nèi)容不僅僅只有用戶發(fā)布的短視頻久又,甚至還有用戶編輯的個(gè)人說明等所有露出能夠讓其他用戶看到的內(nèi)容。如百度網(wǎng)盤效五,可能在這里用戶產(chǎn)生的內(nèi)容就是上傳到網(wǎng)盤的內(nèi)容地消,這也是需要審核的。又如今日頭條畏妖,不僅僅要審核頭條號(hào)(個(gè)人犯建、團(tuán)隊(duì)類似微信公眾號(hào))發(fā)布的內(nèi)容,還要審核用戶在新聞下的跟帖瓜客,經(jīng)常會(huì)有一些人在新聞下跟帖發(fā)布一些不良言論。

我們可以看到不同的產(chǎn)品基本上都會(huì)有用戶產(chǎn)生的內(nèi)容,針對(duì)這些內(nèi)容我們都需要做審核谱仪。實(shí)際上我認(rèn)為審核的目的有二:一玻熙、更好的用戶體驗(yàn);二疯攒、良好的內(nèi)容調(diào)性嗦随。每個(gè)用戶在每個(gè)社區(qū)產(chǎn)生的內(nèi)容實(shí)際上會(huì)受到該社區(qū)很多其他用戶的影響,那么只有良好的內(nèi)容調(diào)性才能讓內(nèi)容進(jìn)入一個(gè)正向的循環(huán)敬尺。

UGC內(nèi)容審核策略及方式

目前所有平臺(tái)的內(nèi)容審核都是人工結(jié)合機(jī)器枚尼,很多人工為主機(jī)器為輔的方式進(jìn)行內(nèi)容審核。內(nèi)容審核策略分為兩種:先發(fā)后審砂吞、先審后發(fā)署恍。

審核策略

(1)先發(fā)后審

先發(fā)后審即用戶先將內(nèi)容發(fā)布出去,只需要通過機(jī)器過濾(如關(guān)鍵詞過濾)即可顯示蜻直,并對(duì)其他用戶可見盯质,然后進(jìn)入審核列表等待人工審核。這里可能會(huì)考慮到用戶發(fā)布內(nèi)容的時(shí)效性概而,對(duì)于時(shí)效性強(qiáng)的產(chǎn)品適合使用先發(fā)后審的審核策略呼巷。

(2)先審后發(fā)

先審后發(fā)及用戶將內(nèi)容發(fā)布出去,先需要通過機(jī)器過濾赎瑰,將用戶產(chǎn)生內(nèi)容根據(jù)閾值(命中關(guān)鍵詞權(quán)重值)區(qū)分到高危待審列表王悍、普通待審列表,不符合要求的將會(huì)直接置于審核不通過列表餐曼,其他內(nèi)容等待人工進(jìn)行審核压储。適合很多新聞平臺(tái),權(quán)威性較高的平臺(tái)晋辆,對(duì)內(nèi)容要求高渠脉。例如人人PM社區(qū),用戶發(fā)布的文章需要通過編輯的審核瓶佳,審核通過后才能發(fā)出芋膘。

在策略選擇上面需要考慮產(chǎn)品的特性,有針對(duì)性的選擇霸饲。對(duì)于大量數(shù)據(jù)的審核为朋,交給人工是非常浪費(fèi)人力物力的,成本很高厚脉。那么在這樣的場景之下只需要單純的機(jī)器過濾习寸,其他事情交給用戶參與(用戶舉報(bào))。這樣我們只需要維護(hù)機(jī)器過濾的關(guān)鍵詞詞庫傻工,以及過濾的其他規(guī)則霞溪。同時(shí)處理用戶舉報(bào)的小部分內(nèi)容孵滞,大大降低運(yùn)營成本。

審核方式

(1)沉貼

沉貼即用戶產(chǎn)生的內(nèi)容只對(duì)他自己可見鸯匹,其他用戶無法看到坊饶。也就是說沉貼操作是用戶感知不到的,也是被大量應(yīng)用在很多場景之下殴蓬。

(2)刪除

刪除即將用戶產(chǎn)生內(nèi)容刪除匿级,自己不可見,其他用戶也無法看見染厅。同時(shí)可能伴隨站內(nèi)消息提醒痘绎,告知用戶內(nèi)容違規(guī)等。

(3)禁言

禁言即在一個(gè)時(shí)間段內(nèi)(時(shí)間規(guī)范)讓用戶無法發(fā)布內(nèi)容肖粮,也就是經(jīng)常說到的小黑屋孤页。具體禁言的時(shí)間段是需要提前指定一個(gè)規(guī)范的,通過閾值實(shí)現(xiàn)尿赚。

(4)封號(hào)(黑名單)

封號(hào)即將用戶帳號(hào)封掉散庶,封后不能夠發(fā)布內(nèi)容,僅能瀏覽凌净,甚至有些產(chǎn)品會(huì)直接將入口對(duì)封號(hào)用戶不可見悲龟。封號(hào)實(shí)際上涉及到兩種方式:一種是封uid,另一種是封imei(設(shè)備串號(hào))冰寻,不同方式使用在不同的場景须教。在這里我們需要考慮到把用戶封號(hào)后對(duì)于用戶之前產(chǎn)生的內(nèi)容怎么操作,一般來說都是將用戶產(chǎn)生的所有內(nèi)容抹掉斩芭。

(5)內(nèi)容轉(zhuǎn)移

內(nèi)容轉(zhuǎn)移即將帖子內(nèi)容不符合所在板塊的轻腺,轉(zhuǎn)移至相應(yīng)的板塊內(nèi)。

機(jī)器過濾機(jī)制

(1)關(guān)鍵詞過濾

建立違禁詞庫划乖,詞庫可分為敏感贬养、違禁等。在用戶點(diǎn)擊發(fā)布的同時(shí)對(duì)用戶發(fā)布的內(nèi)容進(jìn)行關(guān)鍵詞過濾琴庵,如帖子標(biāo)題误算、內(nèi)容進(jìn)行關(guān)鍵詞過濾,并且根據(jù)設(shè)定的命中關(guān)鍵詞的權(quán)重值對(duì)其進(jìn)行操作迷殿。這里的詞庫是需要通過運(yùn)營維護(hù)的儿礼,人工定期的添加才能保證關(guān)鍵詞過濾的效果。

(2)重復(fù)內(nèi)容過濾

重復(fù)內(nèi)容過濾能極大的限制廣告內(nèi)容庆寺、灌水蚊夫,我們可以看到大部分廣告內(nèi)容都是CV工程師發(fā)布的。(CV即Ctrl+C Ctrl+V復(fù)制粘貼)大部分內(nèi)容都是一模一樣的可能會(huì)略微改動(dòng)一些但是相似度不會(huì)低于80%懦尝,重復(fù)內(nèi)容對(duì)比前需要對(duì)標(biāo)點(diǎn)符號(hào)等無關(guān)信息屏蔽知纷,在用戶發(fā)布前對(duì)重復(fù)內(nèi)容進(jìn)行過濾并彈出toast提示用戶不要發(fā)布重復(fù)內(nèi)容壤圃。

(3)限制發(fā)布次數(shù)

這里同樣能夠很有效的降低用戶刷帖、灌水屈扎、發(fā)布廣告等內(nèi)容埃唯。對(duì)用戶發(fā)布次數(shù)進(jìn)行限制,如每天只能發(fā)布10個(gè)帖子等鹰晨,具體次數(shù)限制需要根據(jù)后臺(tái)數(shù)據(jù),對(duì)異常用戶及普通用戶行為數(shù)據(jù)進(jìn)行分析對(duì)比進(jìn)而設(shè)定對(duì)應(yīng)的限制發(fā)布次數(shù)止毕,因?yàn)槲覀儾恢榔胀ㄓ脩裘刻炱骄l(fā)布的帖子數(shù)量模蜡。

(4)根據(jù)用戶屬性過濾

根據(jù)不同用戶人群,將用戶發(fā)布的內(nèi)容進(jìn)行過濾扁凛。例如將用戶分為新人(注冊7天內(nèi)的用戶)忍疾、KOL(Key Opinion Leader 關(guān)鍵意見領(lǐng)袖)、高危用戶(有過違禁記錄的用戶)及普通用戶等谨朝,由于他們的行為特征不同卤妒,可以采取不同的審核策略。如新人字币,大部分新人都在消費(fèi)內(nèi)容则披,極少的新人會(huì)產(chǎn)生內(nèi)容,因此對(duì)新人產(chǎn)生的內(nèi)容我們是需要進(jìn)行審核的洗出,可以采取機(jī)器過濾+人工審核的方式士复。

其他

實(shí)際上審核方式、審核策略翩活、人工審核阱洪、機(jī)器過濾等都是為了社區(qū)內(nèi)良好的內(nèi)容氛圍,進(jìn)而提升用戶體驗(yàn)菠镇,那么以提升內(nèi)容氛圍為目的的話一下還有幾種方式冗荸。

(1)通過產(chǎn)品機(jī)制提高用戶生成內(nèi)容門檻

例如用戶在綁定手機(jī)號(hào)、完善資料前不能發(fā)布內(nèi)容利耍,新用戶在注冊X小時(shí)內(nèi)不能發(fā)布內(nèi)容等蚌本。

(2)舉報(bào)/反饋機(jī)制

讓用戶參與到審核工作當(dāng)中,通過舉報(bào)給與用戶一定積分獎(jiǎng)勵(lì)等堂竟,讓用戶有動(dòng)力參與進(jìn)來魂毁,同時(shí)通過積分等將用戶引導(dǎo)到產(chǎn)品其他板塊。讓每個(gè)用戶參與到審核工作中出嘹,既能夠提升用戶的參與度席楚,還大大降低了公司的運(yùn)營成本。另外税稼,用戶每次舉報(bào)最好能夠有一個(gè)對(duì)應(yīng)的反饋烦秩,讓用戶看到他的舉報(bào)是有效的并不是無疾而終的垮斯。

(3)內(nèi)容調(diào)性

在內(nèi)容冷啟動(dòng)階段對(duì)社區(qū)內(nèi)容調(diào)性做一個(gè)規(guī)范化,通過內(nèi)容調(diào)性引導(dǎo)用戶產(chǎn)生相應(yīng)的內(nèi)容只祠。

以上則是我對(duì)UGC內(nèi)容審核的一些淺薄的觀點(diǎn)和看法兜蠕,如有紕漏歡迎指正。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末抛寝,一起剝皮案震驚了整個(gè)濱河市熊杨,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌盗舰,老刑警劉巖晶府,帶你破解...
    沈念sama閱讀 216,470評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異钻趋,居然都是意外死亡川陆,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,393評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門蛮位,熙熙樓的掌柜王于貴愁眉苦臉地迎上來较沪,“玉大人,你說我怎么就攤上這事失仁∈” “怎么了?”我有些...
    開封第一講書人閱讀 162,577評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵陶因,是天一觀的道長骡苞。 經(jīng)常有香客問我,道長楷扬,這世上最難降的妖魔是什么解幽? 我笑而不...
    開封第一講書人閱讀 58,176評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮烘苹,結(jié)果婚禮上躲株,老公的妹妹穿的比我還像新娘。我一直安慰自己镣衡,他們只是感情好霜定,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,189評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著廊鸥,像睡著了一般望浩。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上惰说,一...
    開封第一講書人閱讀 51,155評(píng)論 1 299
  • 那天磨德,我揣著相機(jī)與錄音,去河邊找鬼。 笑死典挑,一個(gè)胖子當(dāng)著我的面吹牛酥宴,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播您觉,決...
    沈念sama閱讀 40,041評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼拙寡,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了琳水?” 一聲冷哼從身側(cè)響起肆糕,我...
    開封第一講書人閱讀 38,903評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎在孝,沒想到半個(gè)月后擎宝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,319評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡浑玛,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,539評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了噩咪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片顾彰。...
    茶點(diǎn)故事閱讀 39,703評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖胃碾,靈堂內(nèi)的尸體忽然破棺而出涨享,到底是詐尸還是另有隱情,我是刑警寧澤仆百,帶...
    沈念sama閱讀 35,417評(píng)論 5 343
  • 正文 年R本政府宣布厕隧,位于F島的核電站,受9級(jí)特大地震影響俄周,放射性物質(zhì)發(fā)生泄漏吁讨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,013評(píng)論 3 325
  • 文/蒙蒙 一峦朗、第九天 我趴在偏房一處隱蔽的房頂上張望建丧。 院中可真熱鬧,春花似錦波势、人聲如沸翎朱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,664評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽拴曲。三九已至,卻和暖如春凛忿,著一層夾襖步出監(jiān)牢的瞬間澈灼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,818評(píng)論 1 269
  • 我被黑心中介騙來泰國打工侄非, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蕉汪,地道東北人流译。 一個(gè)月前我還...
    沈念sama閱讀 47,711評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像者疤,于是被迫代替她去往敵國和親福澡。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,601評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容