自然語言處理基礎(chǔ)技術(shù)之語義角色標(biāo)注實(shí)戰(zhàn)

聲明:轉(zhuǎn)載請(qǐng)注明出處藏否,謝謝:http://www.reibang.com/p/ce83f5801bce
另外枉疼,更多實(shí)時(shí)更新的個(gè)人學(xué)習(xí)筆記分享,請(qǐng)關(guān)注:


知乎https://www.zhihu.com/people/yuquanle/columns
公眾號(hào):StudyForAI
CSDN地址http://blog.csdn.net/m0_37306360


nlpnet語義角色標(biāo)注

安裝:pip install nlpnet

國(guó)內(nèi)源安裝:pip install nlpnet -i https://pypi.tuna.tsinghua.edu.cn/simple

1.nlpnet是一個(gè)基于神經(jīng)網(wǎng)絡(luò)的自然語言處理任務(wù)的Python庫(kù)。
目前,它支持詞性標(biāo)注泼各、依存分析以及語義角色標(biāo)記。

2.首先要下載預(yù)訓(xùn)練模型:http://nilc.icmc.usp.br/nlpnet/models.html#srl-portuguese
目前語義角色標(biāo)注只提供了葡萄牙語的預(yù)訓(xùn)練模型

import nlpnet
tagger = nlpnet.SRLTagger('nlpnet-model\srl-pt', language='pt')
sents = tagger.tag(u'O rato roeu a roupa do rei de Roma.')[0]
sents.arg_structures
[('roeu',
  {'A0': ['O', 'rato'],
   'A1': ['a', 'roupa', 'do', 'rei', 'de', 'Roma'],
   'V': ['roeu']})]

pyltp語義角色標(biāo)注

pyltp安裝有點(diǎn)麻煩-.-亏拉,這里記錄window 10下的安裝方法

1.首先扣蜻,pip install pyltp安裝報(bào)錯(cuò):error: command 'C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\BIN\x86_amd64\cl.exe' failed with exit status 2

2.然后蒸苇,我選擇使用python setup.py install安裝

  • 下載pyltp,地址:https://github.com/hit-scir/pyltp
  • 下載ltp吮旅,地址:https://github.com/hit-scir/ltp
  • 解壓ltp溪烤,然后將解壓之后文件命名為ltp,覆蓋pyltp文件夾中的ltp
  • 打開cmd庇勃,進(jìn)入到pyltp目錄下檬嘀,找到setup.py
  • 先執(zhí)行命令:python setup.py build
  • 然后執(zhí)行命令:python setup.py install

使用里面的預(yù)訓(xùn)練模型,需要先下載责嚷,然后指定相應(yīng)目錄

要先進(jìn)行分詞鸳兽,詞性標(biāo)注,依存分析

sentence = "我愛自然語言處理技術(shù)罕拂!"
from pyltp import Segmentor
seg = Segmentor() #生成對(duì)象
seg.load("pyltp-model\ltp_data_v3.4.0\cws.model") #加載分詞預(yù)訓(xùn)練模型
seg_words = seg.segment(sentence)
print(" ".join(seg_words))
seg.release() #釋放資源
我 愛 自然 語言 處理 技術(shù) 揍异!
from pyltp import Postagger  
pos=Postagger()
#加載詞性預(yù)訓(xùn)練模型
pos.load("pyltp-model\ltp_data_v3.4.0\pos.model")
words_pos=pos.postag(seg_words)
for k,v in zip(seg_words, words_pos):
    print(k+'\t'+v)
pos.release()
我   r
愛   v
自然  n
語言  n
處理  v
技術(shù)  n
!   wp
from pyltp import Parser
parser=Parser()
parser.load("pyltp-model\ltp_data_v3.4.0\parser.model")
arcs=parser.parse(seg_words,words_pos)
print([(arc.head,arc.relation) for arc in arcs])
parser.release()
[(2, 'SBV'), (0, 'HED'), (4, 'ATT'), (5, 'FOB'), (2, 'VOB'), (5, 'VOB'), (2, 'WP')]
from pyltp import SementicRoleLabeller
labeller = SementicRoleLabeller()
labeller.load("pyltp-model\ltp_data_v3.4.0\pisrl_win.model")
roles = labeller.label(seg_words,words_pos,arcs)
for role in roles:
    print(role.index, "".join(
        ["%s:(%d,%d)" % (arg.name, arg.range.start, arg.range.end) for arg in role.arguments]))
    
labeller.release()
1 A0:(0,0)A1:(2,5)
4 A1:(5,5)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末爆班,一起剝皮案震驚了整個(gè)濱河市衷掷,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌柿菩,老刑警劉巖戚嗅,帶你破解...
    沈念sama閱讀 211,884評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異枢舶,居然都是意外死亡懦胞,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門凉泄,熙熙樓的掌柜王于貴愁眉苦臉地迎上來躏尉,“玉大人,你說我怎么就攤上這事旧困〈挤荩” “怎么了?”我有些...
    開封第一講書人閱讀 157,435評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵吼具,是天一觀的道長(zhǎng)僚纷。 經(jīng)常有香客問我,道長(zhǎng)拗盒,這世上最難降的妖魔是什么怖竭? 我笑而不...
    開封第一講書人閱讀 56,509評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮陡蝇,結(jié)果婚禮上痊臭,老公的妹妹穿的比我還像新娘哮肚。我一直安慰自己,他們只是感情好广匙,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,611評(píng)論 6 386
  • 文/花漫 我一把揭開白布允趟。 她就那樣靜靜地躺著,像睡著了一般鸦致。 火紅的嫁衣襯著肌膚如雪潮剪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,837評(píng)論 1 290
  • 那天分唾,我揣著相機(jī)與錄音抗碰,去河邊找鬼。 笑死绽乔,一個(gè)胖子當(dāng)著我的面吹牛弧蝇,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播折砸,決...
    沈念sama閱讀 38,987評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼看疗,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了睦授?” 一聲冷哼從身側(cè)響起鹃觉,我...
    開封第一講書人閱讀 37,730評(píng)論 0 267
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎睹逃,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體祷肯,經(jīng)...
    沈念sama閱讀 44,194評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡沉填,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,525評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了佑笋。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片翼闹。...
    茶點(diǎn)故事閱讀 38,664評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖蒋纬,靈堂內(nèi)的尸體忽然破棺而出猎荠,到底是詐尸還是另有隱情,我是刑警寧澤蜀备,帶...
    沈念sama閱讀 34,334評(píng)論 4 330
  • 正文 年R本政府宣布关摇,位于F島的核電站,受9級(jí)特大地震影響碾阁,放射性物質(zhì)發(fā)生泄漏输虱。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,944評(píng)論 3 313
  • 文/蒙蒙 一脂凶、第九天 我趴在偏房一處隱蔽的房頂上張望宪睹。 院中可真熱鬧愁茁,春花似錦、人聲如沸亭病。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽罪帖。三九已至促煮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間胸蛛,已是汗流浹背污茵。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評(píng)論 1 266
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留葬项,地道東北人泞当。 一個(gè)月前我還...
    沈念sama閱讀 46,389評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像民珍,于是被迫代替她去往敵國(guó)和親襟士。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,554評(píng)論 2 349