1负溪、商品包匹配模型完成在32w全流量數(shù)據(jù)的商品級(jí)問法的預(yù)打標(biāo)蓬推,將閾值卡在0.95烫幕,召回的流量大約13%(總數(shù)據(jù)量為326588條俺抽,商品級(jí)問法數(shù)據(jù)召回41349條)。
2较曼、隨機(jī)抽樣1000條樣本進(jìn)行人工檢驗(yàn)打標(biāo)磷斧,精度值為58%。
3捷犹、對(duì)錯(cuò)誤進(jìn)行分析:
1)模型訓(xùn)練集是原來模型預(yù)打標(biāo)的閾值以上的數(shù)據(jù)加上聚類之后合并的一些問法數(shù)據(jù)弛饭,清洗不徹底。
2)導(dǎo)入ES庫中的問法對(duì)應(yīng)的句子數(shù)量少(有些只有個(gè)位數(shù))萍歉,知識(shí)太少侣颂,ES召回?fù)p失大