Jason雨 - 簡書

發(fā)簡信

Jason雨

127
關注
4
粉絲
0
文章
0

字數
0

收獲喜歡
7

總資產

IP屬地：天津

吃醋不吃辣的雷兒

python中range np.linspace np.arange torch.range torch.arange的區(qū)別
表示整數：皆可range, np.arange, torch.arange不包含終點np.linspace, torch.range包含終點np.linspace第三個參數表...

669 0 7
孫庚辛

Transformer 的注意力頭越多越好么
多頭注意力機制的目的是通過捕捉不同的注意力信息來提升 AI 模型的表達能力松捉。利用多頭矩陣的子空間從不同的視角或者說維度來表達輸入的數據。從貝葉斯神經網絡的角度券躁，多頭注意力機...

4037 0 2
馬小李23

pytorch實現t-SNE
pytorch版本實現的t-SNE惩坑，可以支持cuda加速，根據作者的python版本修改獲得MNIST數據集在pytorch版本下的結果對比原來python版本實現的結果 ...

7333 0 1
錦繡拾年

Multi-head attention 多頭注意力機制
Multi-head attention 本文基于《dive into deep learning》-pytorch 代碼參考《dive into deep learnin...

10706 0 4
小菜雞

Python刷題的時候編寫測試用例的輸入重定向
如題也拜，刷題的時候程序需要從標準（input()）輸入獲取數據以舒，如果每次運行代碼都需要手動的在console復制題目的樣例輸入就很費事，輸入重定向可以解決這個問題慢哈，實行起來有兩...

796 0 1
top_小醬油

訓練集/驗證集/測試集的區(qū)別
深度學習模型的參數分為普通參數和超參數：普通參數：在模型訓練的過程中可以被梯度下降所更新的蔓钟，也就是訓練集所更新的參數。超參數：比如網絡層數卵贱、網絡節(jié)點數滥沫、迭代次數侣集、學習率等...

1345 0 2
Jachin111

69自然語言處理預訓練技術實踐--BERT 預訓練模型及文本分類
BERT 預訓練模型及文本分類 BERT[https://arxiv.org/abs/1810.04805] 全稱為 Bidirectional Encoder Repres...

1940 0 8
土豆干鍋

用Python去計算：方差var现诀、協(xié)方差cov屿聋、相關系數
方差[https://baike.baidu.com/item/%E6%96%B9%E5%B7%AE/3108412?fr=aladdin] 定義方差是在概率論和統(tǒng)計方差衡...

8396 0 5
taobao

梯度下降
摘抄：https://www.cnblogs.com/shixiangwan/p/7532830.html[https://www.cnblogs.com/shixiangw...

843 0 4