聲明:轉(zhuǎn)載請(qǐng)注明出處藏否,謝謝:http://www.reibang.com/p/ce83f5801bce
另外枉疼,更多實(shí)時(shí)更新的個(gè)人學(xué)習(xí)筆記分享,請(qǐng)關(guān)注:
知乎:https://www.zhihu.com/people/yuquanle/columns
公眾號(hào):StudyForAI
CSDN地址:http://blog.csdn.net/m0_37306360
nlpnet語義角色標(biāo)注
安裝:pip install nlpnet
國(guó)內(nèi)源安裝:pip install nlpnet -i https://pypi.tuna.tsinghua.edu.cn/simple
1.nlpnet是一個(gè)基于神經(jīng)網(wǎng)絡(luò)的自然語言處理任務(wù)的Python庫(kù)。
目前,它支持詞性標(biāo)注泼各、依存分析以及語義角色標(biāo)記。
2.首先要下載預(yù)訓(xùn)練模型:http://nilc.icmc.usp.br/nlpnet/models.html#srl-portuguese
目前語義角色標(biāo)注只提供了葡萄牙語的預(yù)訓(xùn)練模型
import nlpnet
tagger = nlpnet.SRLTagger('nlpnet-model\srl-pt', language='pt')
sents = tagger.tag(u'O rato roeu a roupa do rei de Roma.')[0]
sents.arg_structures
[('roeu',
{'A0': ['O', 'rato'],
'A1': ['a', 'roupa', 'do', 'rei', 'de', 'Roma'],
'V': ['roeu']})]
pyltp語義角色標(biāo)注
pyltp安裝有點(diǎn)麻煩-.-亏拉,這里記錄window 10下的安裝方法
1.首先扣蜻,pip install pyltp安裝報(bào)錯(cuò):error: command 'C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\BIN\x86_amd64\cl.exe' failed with exit status 2
- 安裝cmake逆巍,下載地址,https://cmake.org/download/
- 安裝VS2008 EXPRESS弱贼,下載網(wǎng)址:https://visualstudio.microsoft.com/zh-hans/vs/express/
2.然后蒸苇,我選擇使用python setup.py install安裝
- 下載pyltp,地址:https://github.com/hit-scir/pyltp
- 下載ltp吮旅,地址:https://github.com/hit-scir/ltp
- 解壓ltp溪烤,然后將解壓之后文件命名為ltp,覆蓋pyltp文件夾中的ltp
- 打開cmd庇勃,進(jìn)入到pyltp目錄下檬嘀,找到setup.py
- 先執(zhí)行命令:python setup.py build
- 然后執(zhí)行命令:python setup.py install
使用里面的預(yù)訓(xùn)練模型,需要先下載责嚷,然后指定相應(yīng)目錄
要先進(jìn)行分詞鸳兽,詞性標(biāo)注,依存分析
sentence = "我愛自然語言處理技術(shù)罕拂!"
from pyltp import Segmentor
seg = Segmentor() #生成對(duì)象
seg.load("pyltp-model\ltp_data_v3.4.0\cws.model") #加載分詞預(yù)訓(xùn)練模型
seg_words = seg.segment(sentence)
print(" ".join(seg_words))
seg.release() #釋放資源
我 愛 自然 語言 處理 技術(shù) 揍异!
from pyltp import Postagger
pos=Postagger()
#加載詞性預(yù)訓(xùn)練模型
pos.load("pyltp-model\ltp_data_v3.4.0\pos.model")
words_pos=pos.postag(seg_words)
for k,v in zip(seg_words, words_pos):
print(k+'\t'+v)
pos.release()
我 r
愛 v
自然 n
語言 n
處理 v
技術(shù) n
! wp
from pyltp import Parser
parser=Parser()
parser.load("pyltp-model\ltp_data_v3.4.0\parser.model")
arcs=parser.parse(seg_words,words_pos)
print([(arc.head,arc.relation) for arc in arcs])
parser.release()
[(2, 'SBV'), (0, 'HED'), (4, 'ATT'), (5, 'FOB'), (2, 'VOB'), (5, 'VOB'), (2, 'WP')]
from pyltp import SementicRoleLabeller
labeller = SementicRoleLabeller()
labeller.load("pyltp-model\ltp_data_v3.4.0\pisrl_win.model")
roles = labeller.label(seg_words,words_pos,arcs)
for role in roles:
print(role.index, "".join(
["%s:(%d,%d)" % (arg.name, arg.range.start, arg.range.end) for arg in role.arguments]))
labeller.release()
1 A0:(0,0)A1:(2,5)
4 A1:(5,5)