語言技術(shù)平臺(tái) LTP 由哈工大社會(huì)計(jì)算與信息檢索研究中心
研發(fā)界弧,提供包括中文分詞凡蜻、詞性標(biāo)注、命名實(shí)體識(shí)別垢箕、依存句法分析划栓、語義角色標(biāo)注等豐富、高效条获、精準(zhǔn)的自然語言處理技術(shù)忠荞。在2014年11月,哈工大聯(lián)合科大訊飛公司推出“哈工大-訊飛語言云”帅掘,提供網(wǎng)絡(luò)接入的語言云服務(wù)委煤。
在線使用 LTP-Cloud
官網(wǎng)API https://www.ltp-cloud.com/document/#api_rest_style
我主要是用到python進(jìn)行調(diào)用,但是官方文檔里面給的 demo 用的是 python2.x 寫的修档,而現(xiàn)在我主要用的是 python3.x 了碧绞,所以我將原來的 demo 修改如下。
demo1
# -*- coding:utf8 -*-
import urllib.request
import urllib.parse
url_get_base = "http://api.ltp-cloud.com/analysis/?" # 注意結(jié)尾是'?'
args = {
'api_key' : 'YourApiKey', # 用戶注冊(cè)語言云服務(wù)后獲得的認(rèn)證標(biāo)識(shí)
'text' : '我是中國(guó)人吱窝。', # 待分析的文本
'pattern' : 'ner', # 指定分析模式讥邻,ner(命名實(shí)體識(shí)別)
'format' : 'plain' # 指定結(jié)果格式類型,plain(簡(jiǎn)潔文本格式)
}
result = urllib.request.urlopen(url_get_base+urllib.parse.urlencode(args)) # POST method
content = result.read().decode('utf8')
print(content)
運(yùn)行結(jié)果為:
我 是 [中國(guó)]Ns 人 院峡。
在 NER 中:機(jī)構(gòu)名(Ni)兴使、人名(Nh)、地名(Ns)
幾點(diǎn)注意:
① python3.x
的版本中 urllib
與 urllib2
已經(jīng)合并為一個(gè) urllib
庫
② python2.x
中的 urllib.urlopen()
和 urllib.urlencode
在 python3.x
中分別是 urllib.request.urlopen()
和 urllib.parse.urlencode()
③ 錯(cuò)誤:urllib.error.HTTPError: HTTP Error 401: UNAUTHORIZED
的原因在于 url 一定要寫對(duì)照激,可以參考該網(wǎng)址https://github.com/HIT-SCIR/ltp-cloud-api-tutorial/issues/3
demo2
# -*- coding:utf8 -*-
import urllib.request
import urllib.parse
text="我來自成都信息工程大學(xué)的計(jì)算機(jī)學(xué)院发魄。"
text=str(text)
#text=urllib.quote(text)
text=urllib.parse.quote(text)
pattern = 'ner'
url = 'http://api.ltp-cloud.com/analysis/?' \
'api_key=YourApiKey' \
'&text='+text+\
'&pattern='+pattern+\
'&format=plain';
response = request.urlopen(url)
content = response.read().decode('utf-8')
print(content)
運(yùn)行結(jié)果:
輸入:我來自成都信息工程大學(xué)的計(jì)算機(jī)學(xué)院。
輸出:我 來自 [成都 信息 工程 大學(xué)]Ni 的 計(jì)算機(jī) 學(xué)院 俩垃。
輸入:我來自成都信息工程大學(xué)計(jì)算機(jī)學(xué)院励幼。
輸出:我 來自 [成都 信息 工程 大學(xué) 計(jì)算機(jī) 學(xué)院]Ni 。
附
該文章于2017年10月12日于CSDN上首次發(fā)表吆寨,2017年12月24日搬家至此赏淌!