學習總結(jié)
l工作方式與時間安排
研發(fā)型的工作:這類工作一般分為:理論方法確定陷揪,算法coding,測試&調(diào)整改進
1.理論的算法設(shè)計
u盡可能多的進入細節(jié)部分犀忱,想到每一個細節(jié)可能出現(xiàn)的問題,和大家一起解決娃圆;
u這個階段一定要產(chǎn)出一份算法設(shè)計文檔陷遮,可以只是紙質(zhì)的,最關(guān)鍵的是把所有的邏輯和細節(jié)處理都呈現(xiàn)出來重挑;
u對于初步確定好的算法嗓化,要寫成文檔發(fā)給RD最高負責人做確定把關(guān),負責人確認通過了以后再動手coding谬哀。
這次打標簽的程序設(shè)計做了非常久刺覆,最大的問題就是沒有開會一起確定最后的方案,以至于后期發(fā)現(xiàn)的時候已經(jīng)非常晚了史煎,東西又要重做谦屑。
2.Coding
u模塊化,函數(shù)化篇梭;讓自己的所有東西都可以最大化的重復利用氢橙,每一個環(huán)節(jié)都盡量設(shè)計成函數(shù)的型式;
u遇到問題要問可能懂的人恬偷,自己想的方法可能并不是很好【比如這次薛天幫助我改進算法的時間耗時久問題悍手,nico幫我改進循環(huán)中的條件不滿足就跳過問題】
u對遇到過的報錯,要從長遠的角度解決袍患,列出所有錯誤清單坦康,從源頭解決,而不是簡單的改一改【在過程中最頭疼的問題是csv中的科學計數(shù)法格式問題诡延,使得ID信息全部丟失】
3.測試
u時間要充足:假設(shè)編程編程編程時間需要1天滞欠,那么測試時間則需要3天(包括測試過程中的代碼方法調(diào)整),很多問題都是在測試的時候來的肆良,所以一定要盡早進入測試階段筛璧;
u測試的時候赤兴,需要盡可能多的數(shù)據(jù)環(huán)境,【比如這次的方法在做女裝品類的時候就完成沒問題隧哮,但是進入到童裝品類桶良,多了大童小童,男童女童沮翔,很多地方就要調(diào)整】陨帆,從緊急的數(shù)據(jù)開始測起;
l分工方面與工作的安排
這次的項目幾乎是我自己從頭做到尾采蚀,從算法的設(shè)計到實施疲牵,最后的項目應用,使得自己非常累榆鼠,而且精力有限的話纲爸,效率低,易出錯妆够。團隊行動才能更好的高效完成一些工作识啦。
u借助每一個人的智慧,和每一個人一起成長神妹,鼓勵多思考颓哮,而非機械執(zhí)行,對于勞動密集型工作鸵荠,鼓勵盡可能用程序解決
u每一天都要和團隊成員一起碰一碰冕茅,看看進度,發(fā)現(xiàn)過程中的問題
u年度規(guī)劃產(chǎn)品的功能其實可以拆解成多個同時并行的任務(wù)一起進行蛹找,能及早完成的要先完成姨伤,對于最難的部分慢慢啃【以往認為只要把最難部分做完后面就很好做的思路會造成后期壓力過大】
l實際產(chǎn)品方法流程改進方面
1.數(shù)據(jù)質(zhì)量把控要加強,避免后期的分析工作的很多麻煩庸疾;很多數(shù)據(jù)需要前期的清洗乍楚,做完后在放入數(shù)據(jù)庫。清洗數(shù)據(jù)一份彼硫,原始數(shù)據(jù)一份炊豪。清洗的內(nèi)容包括
1)串列的數(shù)據(jù)做還原
2)價格異常值處理【0元或極大值】
3)商品詳情抓取不完全凌箕,需要補數(shù)據(jù)【如童裝的外套拧篮,其他品類需要進一步排查】
4)大童小童的提取方法確定后,盡快區(qū)別大小童數(shù)據(jù)牵舱,對數(shù)據(jù)直接加入一個區(qū)別大小童的列串绩。
2.詞庫的結(jié)構(gòu)方法層次,以及準確性芜壁,可用性
1)童裝的詞庫比較混亂礁凡,結(jié)構(gòu)不清晰
2)有少量的準確性問題【比如“常規(guī)”高氮,在很多維度里都出現(xiàn)】
3)對于最終用大維度,還是小維度顷牌,還得進一步確定【風格剪芍、顏色的歸納】
3.打標簽的方法
1)算法邏輯的確定,需要以文檔形式呈現(xiàn)
2)打標簽的速度需要改進提升
4.年度規(guī)劃中還有很多數(shù)據(jù)結(jié)果的計算可以程序化
1)價格段列表的展現(xiàn)形式可以直接合并成客戶要的形式
2)實力與空間指標的計算【主要價格段的市場/品牌銷售額】窟蓝;
3)主打季度的支持數(shù)據(jù)計算
4)另外對于品類的策略罪裹,主打季節(jié)規(guī)則,主打異位/同位/同類的規(guī)則需要進一步一起商議確定运挫,才能程序化状共。