教育資源是組成教育生態(tài)的重要部分·朽寞,其中知識點、視頻課程斩郎、教輔資料脑融、作業(yè)題庫等內(nèi)容是組成教育資源的基礎(chǔ)。教育產(chǎn)品以“內(nèi)容為王”缩宜,內(nèi)容運用于教學肘迎、學習、作業(yè)锻煌、批改等場景妓布。當前在線教育領(lǐng)域存在內(nèi)容質(zhì)量良宥不齊、內(nèi)容分布不均衡宋梧、創(chuàng)作者積極性不高等現(xiàn)象匣沼。從內(nèi)容的生產(chǎn)和消費角度,我們該如何優(yōu)化內(nèi)容生產(chǎn)路徑捂龄,挖掘優(yōu)質(zhì)內(nèi)容释涛,使得內(nèi)容更好地服務(wù)于教師、學生和家長倦沧?
盡管不同領(lǐng)域內(nèi)容建設(shè)各有差異唇撬,但都離不開內(nèi)容建設(shè)的四部曲:內(nèi)容生產(chǎn)、內(nèi)容入庫展融、內(nèi)容審核窖认、內(nèi)容推薦。
一.內(nèi)容生產(chǎn)
在線教育領(lǐng)域的內(nèi)容生產(chǎn)一部分來源平臺生產(chǎn),另一部分來源于用戶-教師和學生耀态。用戶生產(chǎn)內(nèi)容的方式主要是PGC轮傍、UGC和OGC。
1.PGC
PGC:英文為Professionally-generated Content首装,即專業(yè)人士生產(chǎn)的內(nèi)容创夜。這種方式對于生產(chǎn)者的專業(yè)能力和知識具有較高要求,生產(chǎn)者一般是某一領(lǐng)域的名師仙逻、大V或者專家驰吓,質(zhì)量有保障。
2.UGC
UGC:英文為User-generated Content系奉,即普通用戶生產(chǎn)的內(nèi)容檬贰。這種方式門檻較低,人人都可生產(chǎn)內(nèi)容缺亮,但質(zhì)量參差不齊翁涤。
當前在線教育平臺普遍存在優(yōu)質(zhì)用戶難以沉淀、缺乏高質(zhì)量的內(nèi)容等現(xiàn)象萌踱,我們?nèi)绾谓⑼晟频挠脩艏铙w系葵礼,營造良好的創(chuàng)作氛圍,同時優(yōu)化內(nèi)容生產(chǎn)路徑并鸵,降低用戶內(nèi)容生產(chǎn)成本是另一個值得思考的問題鸳粉。
二.內(nèi)容入庫
用戶生產(chǎn)的海量內(nèi)容,需要在平臺進行沉淀园担、組織和管理届谈。我們需要提煉不同內(nèi)容的共性字段,設(shè)計結(jié)構(gòu)化的信息將內(nèi)容進行組織弯汰,方便內(nèi)容的展示和管理艰山。
1.組織架構(gòu)
1)階梯形
從上至下,由大類逐層劃分小類蝙泼,最終將內(nèi)容歸屬到相應(yīng)的小類中程剥。這種組織架構(gòu)常用于內(nèi)容展示和后臺管理。
2)用戶自組織
用戶自發(fā)地搜集內(nèi)容汤踏,并將相同分類的內(nèi)容歸入同一個文件夾內(nèi)织鲸。這種組織架構(gòu)常用于教師的收藏夾,學生的錯題本溪胶。?
2.結(jié)構(gòu)化信息處理
1)共性字段
視頻搂擦、試卷、課件哗脖、教案瀑踢、素材等不同內(nèi)容類型的共性字段為所屬知識點扳还、內(nèi)容標題、創(chuàng)建者橱夭、來源氨距、創(chuàng)建時間等,合理的字段便于內(nèi)容的維護和功能的擴展棘劣。
2)分類
分類是將無規(guī)律的事物按照不同的特點劃分為有規(guī)律的事物俏让,使事物具有統(tǒng)一性。分類體系的設(shè)計要符合大眾的認知茬暇,在線教育常見的分類體系為依據(jù)所編寫的教材或者知識點而構(gòu)建的教材體系和知識點體系首昔,將內(nèi)容進行有體系的歸檔和組織,便于用戶快速找到需要的內(nèi)容糙俗。
3)標簽
標簽是事物抽象出來的定義勒奇,方便用戶標記和機器識別。一般而言巧骚,分類體系大都是穩(wěn)定的赊颠,而標簽具有靈活性、自定義性劈彪。在線教育標簽主要分為三類:知識標簽巨税、內(nèi)容標簽和用戶標簽。通過抽取出不同分類的共性標簽粉臊,將知識、內(nèi)容和用戶進行連接驶兜。標簽體系的建立是內(nèi)容推薦的基礎(chǔ)扼仲。
三.內(nèi)容審核
內(nèi)容審核的主要目的是一方面識別黃賭毒等違規(guī)內(nèi)容,降低不良內(nèi)容風險抄淑;另一方面甄別優(yōu)質(zhì)內(nèi)容屠凶。目前內(nèi)容審核一般采用機器審核為主+人工審核為輔,審核機制一搬為先審后發(fā)和先發(fā)后審肆资。
1.審核機制
1)先審后發(fā)
先審后發(fā)通常是指生產(chǎn)者生產(chǎn)的內(nèi)容經(jīng)過平臺審核通過后才能給其他用戶展示和使用矗愧。平臺審核的方式一般為自動化審核(事前定義好邏輯判斷規(guī)則)或人工審核(事前定義好非機器審核標準)。自動化審核主要是通過預(yù)先設(shè)定的關(guān)鍵詞郑原、圖片識別唉韭、NLP語義識別、違禁詞等策略進行審核犯犁。自動化審核可以有效提升人工審核效率属愤,但自動化審核只能采用已知邏輯作為判斷依據(jù),對未知新生的問題無法給出合理的判斷酸役,因此人工審核的流程還無法被機器取代住诸。
先發(fā)后審的優(yōu)點是內(nèi)容質(zhì)量有保證驾胆,可以有效避免違法違規(guī)低質(zhì)有害內(nèi)容的傳播;缺點是時效性與內(nèi)容傳播流動性差贱呐,人工審核成本高丧诺。?
2)先發(fā)后審
先發(fā)后審是用戶創(chuàng)建的內(nèi)容無需審核就能給其他用戶展示和使用,一般通過后期用戶的反饋再對內(nèi)容進行審核處理奄薇。先發(fā)后審的優(yōu)點是時效性強驳阎,缺點是一旦內(nèi)容具有違規(guī)內(nèi)容,存在處理延遲的風險惕艳。
目前內(nèi)容運營在承擔內(nèi)容審核的工作搞隐,提高內(nèi)容審核效率的主要方式為:
1)用戶分類:平臺提前區(qū)分優(yōu)質(zhì)用戶、普通用戶和風險用戶远搪,對于不同用戶生產(chǎn)的內(nèi)容采取不同的審核策略劣纲;
2)內(nèi)容自動審核系統(tǒng):平臺通過預(yù)先設(shè)定的敏感詞和關(guān)鍵詞、圖片識別等策略進行機器審核谁鳍,提前將不合規(guī)的內(nèi)容篩選出來癞季,節(jié)省人工審核的成本;
3)分級處理:對于不同質(zhì)量的內(nèi)容進行對應(yīng)的獎懲處理倘潜。優(yōu)質(zhì)內(nèi)容生產(chǎn)者可獲得加V绷柒、積分等獎勵,其內(nèi)容將加權(quán)推薦涮因、優(yōu)先推薦废睦;違規(guī)內(nèi)容生產(chǎn)者將受到封號、加入黑明單等處罰养泡,其內(nèi)容將刪除嗜湃、禁用。
4)反饋機制:對于用戶端增加舉報和反饋入口澜掩,后臺設(shè)計反饋處理模塊购披,在一定程度上可降低違規(guī)內(nèi)容的風險。
四.內(nèi)容推薦
前面所做的內(nèi)容生產(chǎn)肩榕、內(nèi)容入庫刚陡、內(nèi)容審核都是為內(nèi)容推薦服務(wù)。內(nèi)容推薦被應(yīng)用于電商株汉、新聞資訊筐乳、音樂、視頻郎逃、知識付費等領(lǐng)域哥童,在線教育領(lǐng)域目前也在涉及。推薦的本質(zhì)是給用戶推薦適合的內(nèi)容褒翰,學生推薦他感興趣贮懈、正在學習或者不會的內(nèi)容匀泊,教師推薦他正在教或者待要教的內(nèi)容。用戶期望推薦的內(nèi)容是他想要的朵你,然而目前內(nèi)容推薦普遍存在推薦的不準各聘、重復(fù)、同質(zhì)化等現(xiàn)象抡医。內(nèi)容推薦要做到推薦的精和準的前提是要積累優(yōu)質(zhì)的內(nèi)容和大量的數(shù)據(jù)躲因。優(yōu)質(zhì)的內(nèi)容需要在內(nèi)容生產(chǎn)、入庫和審核過程中進行把控忌傻,大量的數(shù)據(jù)需要建立標簽體系大脉、用戶畫像和內(nèi)容畫像。用戶畫像主要分為用戶基礎(chǔ)信息和用戶行為水孩,用戶畫像最終要和內(nèi)容進行匹配镰矿、連接。
常用的內(nèi)容推薦方法:
(1)人工推薦
?推薦方式一般通過后臺人工選擇推薦的內(nèi)容和內(nèi)容的排列順序俘种。這是一種低成本的推薦方式秤标,適合于產(chǎn)品初期階段,運營可運用數(shù)據(jù)分析宙刘、用戶反饋等方式進行推薦參考苍姜。這種推薦方式的劣勢在于,不同用戶看到的內(nèi)容都千篇一律悬包,而且內(nèi)容更新需要人工進行操作衙猪。
(2)個性化推薦
人工設(shè)置的推薦過于單調(diào),無法滿足不同用戶對于內(nèi)容的需求布近。個性化推薦通過算法屈嗤,結(jié)合大數(shù)據(jù),基于用戶畫像吊输,對于不同的用戶推送不同的內(nèi)容。個性化系統(tǒng)常見的方式主要為:
1)基于相似用戶推薦
通過具有相似特征的用戶推薦用戶喜歡或感興趣的內(nèi)容铁追。什么叫相似用戶季蚂?我們可以根據(jù)用戶屬性和用戶行為進行劃分。用戶屬性根據(jù)人口統(tǒng)計學的地區(qū)琅束、性別扭屁、年齡、年級等進行劃分涩禀,用戶行為可根據(jù)用戶觀看視頻時長料滥、正確率、答題次數(shù)等維度劃分艾船。通過一定的計算公式和不同屬性的權(quán)重計算出相似分葵腹,對于相同地區(qū)高每、相同年級和相同相似分的用戶推薦相同的內(nèi)容。
2)基于相似內(nèi)容推薦
通過內(nèi)容的基本信息確認內(nèi)容與內(nèi)容之間的相似度践宴,再根據(jù)用戶歷史瀏覽和行為記錄鲸匿,將相似內(nèi)容推薦給用戶。這種推薦需要建立豐富的內(nèi)容標簽阻肩,將內(nèi)容標簽拆分的越細带欢,描述的越完整,內(nèi)容與用戶行為記錄匹配度就更高烤惊,推薦更精準乔煞。
不同推薦方式在不同場景下各有優(yōu)勢,在實際應(yīng)用中柒室,會將人工推薦+個性化推薦進行組合渡贾。