背景
? 獲得原始數(shù)據(jù)后神帅,由AI PM先用相關工具簡單處理伐憾,再交付給數(shù)據(jù)標注人員進行標注减响,但標注人員對數(shù)據(jù)的理解和標注質量差異大婿奔,導致數(shù)據(jù)標注效率和質量不達標
? 細分領域積累了大量數(shù)據(jù)遇革,但往往使用一次后就不再產(chǎn)生價值荆隘,數(shù)據(jù)無法沉淀和復用
定義
? 通過分析產(chǎn)品需求和相關數(shù)據(jù)精偿,制定數(shù)據(jù)標注規(guī)則舱痘,實現(xiàn)“提高數(shù)據(jù)標注的效率和質量”和“積累細分領域通用數(shù)據(jù)”的價值
職責
? 制定數(shù)據(jù)標注規(guī)則:從數(shù)據(jù)中提取行業(yè)特征場景徘钥,結合行業(yè)知識衔蹲,制定表達精準、邏輯清晰的數(shù)據(jù)標注規(guī)則
? 數(shù)據(jù)驗收和管理:參與模型搭建和數(shù)據(jù)驗收呈础,并負責核心指標和數(shù)據(jù)的日常跟蹤維護
? 積累細分領域通用數(shù)據(jù):從已有數(shù)據(jù)中挑選通用數(shù)據(jù)(適用于同領域內不同用戶)舆驶,形成數(shù)據(jù)沉淀和積累
流程
AI訓練師在數(shù)據(jù)標注員和AI PM之間,起到橋梁的作用
AI訓練師需要和數(shù)據(jù)標注員緊密協(xié)作而钞,把控好整個流程的輸入規(guī)則和輸出結果沙廉,最終輸出標注準確的數(shù)據(jù)(供模型訓練)
AI訓練師需要和AI PM討論需求,進而制定數(shù)據(jù)標注規(guī)則臼节,并提出產(chǎn)品體驗優(yōu)化建議
能力模型
??數(shù)據(jù)能力:了解科學的數(shù)據(jù)獲取方法論撬陵,能運用數(shù)據(jù)處理工具,邏輯思維強
??分析能力:基于產(chǎn)品的數(shù)據(jù)需求网缝,及時發(fā)現(xiàn)巨税、提煉問題特征,產(chǎn)出優(yōu)化方案和建議
??行業(yè)背景:熟悉公司行業(yè)領域知識粉臊,特別是語言或圖像方面數(shù)據(jù)的特點
??溝通能力:具備較強與不同崗位同事同頻交流的能力草添,能通俗易懂的闡釋專業(yè)術語信息
??AI技術理解力:能夠厘清基本的AI概念,并了解其技術邊界
??AI行業(yè)理解力:具備AI行業(yè)知識或相關產(chǎn)品運營經(jīng)驗扼仲,在此基礎上能夠預判行業(yè)趨勢远寸、深挖場景痛點、設計AI方案