- 北京 天氣晴
上午計算機設計大賽答辯
頭天九點多下了班往北大那邊的酒店趕巴帮,到了都快11點了我真滴累了。我們是早上第三組答辯,6點30起來剂陡,差不多7點40去候場。
我們這組學長沒來狐胎,另個同學演示鸭栖,我來負責答辯。老師提問特別犀利握巢,到后面問得我啞口無言晕鹊,問滿了20分鐘才放過我們/(ㄒoㄒ)/但是確實有些東西不是我做的我不了解,老師一看你不了解就瘋狂抓著那個點問QAQ相比省賽的順利,這次國賽真是慘兮兮溅话。除去是真的知識盲區(qū)我真的答不上來晓锻,之前那段我感覺還發(fā)揮得挺好,主要是感覺自己說話還挺順的吧飞几,氣場臺風什么的也還可以砚哆。果然經過了各種比賽、面試屑墨、課堂分享什么的躁锁,自己的臨場能力確實有了提升,已經不是以前那個講屁屁踢都會嚇得腿抖的小朋友啦卵史。
依著記憶寫幾個老師提的問題:
Q1:你覺得自己的作品還有什么缺陷
我當時答的是數(shù)據源單一讓我們系統(tǒng)的使用場景受限灿里,結果老師指出我們一個很明顯的缺陷是可視化那個熱力圖做得太糙了,像一塊馬賽克直接糊上去程腹。當時我解釋是因為原始數(shù)據只是一個點的軌跡數(shù)據匣吊,進行分區(qū)分時段太細的話工作量太大,呃老師聽了并不咋關心寸潦。
Q2:你做這個系統(tǒng)給誰用的色鸳,功能似乎很雜
確實這個系統(tǒng)模塊有一絲絲堆功能的意圖,如果是真的做產品的話肯定是要把模塊拆分然后做得更細致些见转。只是我想命雀,我們還是在校生做的東西,要多精多巧真沒有斩箫,能把功能做多一點就不錯了(當然我沒說出來)
Q3:spark-Hadoop分別是怎么用的
這真是被學長坑死了吏砂,根本就沒用什么集群什么分布式的,只是單純用Hadoop的工具進行了數(shù)據劃分乘客,這個問題是糊弄過去的狐血,從這里就開始全線崩塌,一直追著數(shù)據問易核。
Q4:預測功能為什么要輸入那么多值匈织,為什么只能預測下一時段的值
這個當時是設計了很多接口,只是截止到我們交作品的時候制作出來輸入序列預測下一序列值的功能牡直。預期輸入值就是一個序列缀匕,只是要通過鍵盤輸入顯得有點麻煩,不過我們沒有這樣的數(shù)據源提供輸入碰逸。后來老師提建議說可以模擬數(shù)據源輸入乡小。
Q5:LSTM為什么適合長序列問題,你的預測接口是怎么體現(xiàn)出它的優(yōu)勢
首先是LSTM的模塊結構能對信息分態(tài)饵史,讓信息的特征能在時間維度上傳遞满钟,保留信息趨勢的殘差掸哑,使得LSTM適合解決長序列問題。我們的接口就是通過輸入的序列值經過訓練好的LSTM模型進行下一時刻的預測零远。老師說那為什么只能預測下一時刻苗分,這樣就沒有體現(xiàn)長序列預測的優(yōu)勢,就不能預測未來時刻的嗎牵辣?我當時沒領悟到這個題意摔癣,就一直說我們的數(shù)據集限制,只能驗證數(shù)據集里有的測試數(shù)據纬向。但是本來就是歷史數(shù)據集择浊,用來預測未來不是很扯嗎(我可能還是不懂老師在問什么,還是老師不懂我做的是什么)
Q6:原始數(shù)據集具體是什么樣子的逾条,怎么處理的
不就是xx平臺xx市x年x月xx訂單軌跡數(shù)據琢岩,然后對時間、區(qū)域進行劃分师脂。這里又問得更細一些担孔,但是不難答。
Q7:訓練集的observed字段是什么意思
我真是第一次知道我們交上去的東西有這個字段吃警,而且當時答辯的時候我們的電腦沒有這個訓練集糕篇,評委看材料真的特別細。然后我們說我們電腦上沒這個東西酌心,本來快結束了拌消,已經讓我們出去了,然后有個女老師偏要讓我下去看看安券,給她解釋墩崩,我?。我真不知道啊侯勉,我就說是另個沒來的同學做的鹦筹,然后老師就說那數(shù)據給你們了,你們用了還不知道什么意思壳鹤,到底是不是你們自己做的盛龄?饰迹?芳誓?我?啊鸭?锹淌?到這里心態(tài)都崩了,我就開始說我們模型的輸入是什么樣的赠制,沒用到這個字段赂摆,結果自己提到特征值挟憔,然后又被追問特征值是什么?烟号?绊谭?我當時腦子已經一片混亂了,然后時間徹徹底底到了汪拥,然后出來之后我都是懵的??达传。
高老師特別好,我們出來之后一直鼓勵我們說講的特別好啦迫筑,臺風特別好什么的宪赶。我就感覺答得挺差的,啊脯燃,觸及知識盲區(qū)也是沒辦法搂妻,這已經是我能做到的最好的程度了。
項目上線
下午回公司繼續(xù)工作辕棚。昨天改的日志輸出那個問題欲主,測試通過之后可以上線了。本來應該先發(fā)到測試環(huán)境逝嚎,mentor說我改的東西很簡單岛蚤,不會出錯,直接教我發(fā)布到生產環(huán)境了懈糯。然后盯著日志看改動有沒有生效涤妒。第一次把自己代碼發(fā)布讓用戶使用,自豪感滿滿的赚哗。
一個小的需求點實現(xiàn)
大哥給了一個很簡單的需求點給我做她紫,把調用量特別高的一個接口實現(xiàn)從外部api改為db查詢。先按著我自己的理解寫了一版,然后給mentor review歇竟,review之后大概有一半代碼要改QAQ养篓。首先是改代碼不可以改輸出的格式和類型,要不然別人調用我們的方法別人也得跟著改民褂。然后是數(shù)據庫分讀庫和寫庫,我那個功能點只需要讀就行了疯潭。后面寫完了之后一直在搞單元測試赊堪,用go test xx_test.go xx.go這個命令的時候,如果代碼里有用包下的變量竖哩,會報undefined錯誤導致build fail哭廉。一直沒測成功,下班相叁,回家遵绰。