再出發(fā)

框架:

  1. 梳理已經(jīng)完成的項(xiàng)目兴革,挖掘項(xiàng)目中自己的成長(zhǎng)點(diǎn)&項(xiàng)目的亮點(diǎn)&難點(diǎn)绎晃,理清項(xiàng)目的背景、意義杂曲,待優(yōu)化點(diǎn)庶艾。
  2. 確定自己面試的方向,搜廣推擎勘,擴(kuò)展學(xué)習(xí)基礎(chǔ)知識(shí)咱揍。
  3. 列出第一、二棚饵、三階段面試的公司煤裙,第一階段是用來(lái)練手的,第二階段是中廠保底的噪漾,第三階段是想去的硼砰,然后在boss直聘上開始找合適的崗位海投
  4. 想好官方可接受的離職原因,對(duì)下份工作的期待欣硼,對(duì)自己未來(lái)3-5年成長(zhǎng)的規(guī)劃想好自己的優(yōu)勢(shì)题翰、劣勢(shì),如何在面試中揚(yáng)長(zhǎng)避短
  5. 適當(dāng)[刷題]

準(zhǔn)備

1)項(xiàng)目及擴(kuò)展
項(xiàng)目過(guò)程:背景诈胜、難點(diǎn)豹障、收益、技術(shù)方案焦匈、亮點(diǎn)沼填、待優(yōu)化點(diǎn)
擴(kuò)展:
2)通用機(jī)器學(xué)習(xí)類
http://www.reibang.com/p/1b49317beb6b
3)leetcode

項(xiàng)目:

1)實(shí)體鏈指
2)實(shí)體識(shí)別
3)實(shí)體歸一
4)文本分類
1) 數(shù)據(jù)分析:
1)樣本量分布
2)長(zhǎng)度分布
3)token分布:

2)token分析:

機(jī)器學(xué)習(xí)深度研究:特征選擇中幾個(gè)重要的統(tǒng)計(jì)學(xué)概念

文本建模常用的預(yù)處理方法——特征選擇方法(CHI和IG)

過(guò)濾法(Filter):方差Var,卡方chi括授,F(xiàn)檢驗(yàn)ANOVA坞笙。先對(duì)數(shù)據(jù)集進(jìn)行特征選擇岩饼,然后再訓(xùn)練學(xué)習(xí)器,特征選擇過(guò)程與后續(xù)學(xué)習(xí)器無(wú)關(guān)薛夜。

方差var:無(wú)法區(qū)分各類籍茧,只分析整體。每個(gè)token的重要度(tf-idf)方差大梯澜,說(shuō)明該token按重要性在樣本中分布不均勻寞冯,有區(qū)分度

卡方chi:

包裝法(Wrapper):模型優(yōu)層面。根據(jù)目標(biāo)函數(shù)(通常是預(yù)測(cè)效果評(píng)分)晚伙,每次選擇若干特征吮龄,或者排除若干特征。

嵌入法(Embedding):樹模型咆疗、線性模型漓帚。先使用機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到各個(gè)特征的權(quán)值系數(shù)午磁,根據(jù)系數(shù)從大到小選擇特征尝抖。

3)數(shù)據(jù)量分布

4)其他特征的分布

 2)建模
 3)迭代:數(shù)據(jù)1)

5)特征建模:
1)特征分析
單特征核密度函數(shù)
特征重要性
2)GBDT
6)預(yù)訓(xùn)練模型:attendtion transformer bert albert albertiny charcnn

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市迅皇,隨后出現(xiàn)的幾起案子昧辽,更是在濱河造成了極大的恐慌,老刑警劉巖登颓,帶你破解...
    沈念sama閱讀 217,185評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件搅荞,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡框咙,警方通過(guò)查閱死者的電腦和手機(jī)取具,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)扁耐,“玉大人,你說(shuō)我怎么就攤上這事产阱⊥癯疲” “怎么了?”我有些...
    開封第一講書人閱讀 163,524評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵构蹬,是天一觀的道長(zhǎng)王暗。 經(jīng)常有香客問(wèn)我,道長(zhǎng)庄敛,這世上最難降的妖魔是什么俗壹? 我笑而不...
    開封第一講書人閱讀 58,339評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮藻烤,結(jié)果婚禮上绷雏,老公的妹妹穿的比我還像新娘头滔。我一直安慰自己,他們只是感情好涎显,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評(píng)論 6 391
  • 文/花漫 我一把揭開白布坤检。 她就那樣靜靜地躺著,像睡著了一般期吓。 火紅的嫁衣襯著肌膚如雪早歇。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,287評(píng)論 1 301
  • 那天讨勤,我揣著相機(jī)與錄音箭跳,去河邊找鬼。 笑死潭千,一個(gè)胖子當(dāng)著我的面吹牛灾搏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播窃肠,決...
    沈念sama閱讀 40,130評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼顿乒,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了割捅?” 一聲冷哼從身側(cè)響起奶躯,我...
    開封第一講書人閱讀 38,985評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎亿驾,沒(méi)想到半個(gè)月后嘹黔,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,420評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡莫瞬,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評(píng)論 3 334
  • 正文 我和宋清朗相戀三年儡蔓,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片疼邀。...
    茶點(diǎn)故事閱讀 39,779評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡喂江,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出旁振,到底是詐尸還是另有隱情获询,我是刑警寧澤,帶...
    沈念sama閱讀 35,477評(píng)論 5 345
  • 正文 年R本政府宣布拐袜,位于F島的核電站吉嚣,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏蹬铺。R本人自食惡果不足惜尝哆,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望甜攀。 院中可真熱鬧秋泄,春花似錦琐馆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至奸焙,卻和暖如春瞎暑,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背与帆。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工了赌, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人玄糟。 一個(gè)月前我還...
    沈念sama閱讀 47,876評(píng)論 2 370
  • 正文 我出身青樓勿她,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親阵翎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子逢并,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容