我又回來了掷空,Pytorch的學(xué)習(xí)也是為了熟悉AllenNLP結(jié)構(gòu)吵血,所以,在完成基礎(chǔ)tutorial之后又折回來繼續(xù)學(xué)AllenNLP慎璧。四月份的目標(biāo)是復(fù)現(xiàn)那篇論文中的結(jié)構(gòu)并使用Finetuning完成Transformer。
今天開始AllenNLP入門的第二部分How-to胸私。總共包括七個小節(jié)鳖谈。
- 創(chuàng)建自己的json配置文件
- How to train a model with lazy data
- How to train and use a Transformer-based ELMo
- How to Debug Your AllenNLP Code
- How to visualize model internals (BETA)
- Using pre-trained ELMo representations
- Using span representations
1. 創(chuàng)建自己的json配置文件
AllenNLP由類似Json的配置文件驅(qū)動。我們得到的一個常見反饋是“很難知道配置文件中需要進(jìn)行哪些操作缆娃。”因此贯要,構(gòu)建一些工具(仍然有點實驗性)來幫助用戶了解這部分。
1.1 AllenNLP配置向?qū)?/h4>
AllenNLP通過瀏覽器創(chuàng)建了一個配置想到崇渗,可以使用這行命令調(diào)用
$ allennlp configure
在瀏覽器中訪問http://localhost:8123就可以出現(xiàn)下面的界面
可以在命令行版本中看到相同的字段和注釋。 (注釋隱藏為工具提示宅广,將鼠標(biāo)懸停在問號按鈕上以查看它們)葫掉。
必填字段的名稱為黑色,而可選字段的名稱為灰色跟狱。未完成的必填字段以紅色嘆號突出顯示俭厚。
如果單擊dataset_reader的“CONFIGURE”按鈕,將出現(xiàn)一個下拉列表:
如果再次選擇SquadReader驶臊,將顯示數(shù)據(jù)集讀取器部件的配置程序:
注意在后面的那個X按鈕挪挤,作用是用來刪除dataset reader配置绪抛。
當(dāng)用戶填寫配置選項后,在頁面底部有實時json配置更新电禀。用戶可以使用此向?qū)顚懻麄€配置幢码,將生成的JSON復(fù)制到文件中,然后啟動實驗尖飞。
這個配置文件等于是傻瓜式的生成模版症副,可以看到要生成的json的幾個主要模塊,更有利于初學(xué)者了解AllenNLP政基。