自然語言處理資源大全

https://github.com/HIT-SCIR/pyltp

http://ltp.readthedocs.io/zh_CN/latest/

http://blog.csdn.net/churximi/article/details/51174182

http://www.cnblogs.com/ybf-yyj/p/7658571.html

http://blog.csdn.net/churximi/article/details/51174182

http://www.cnblogs.com/anderslly/p/jiebanet.html

https://www.codeproject.com/Articles/32201/Lucene-Net-Custom-Synonym-Analyzer

https://github.com/linezero/jieba.NET

https://github.com/anderscui/jieba.NET

https://www.ltp-cloud.com/

https://github.com/chapzq77/LTP_Python_Interface

https://github.com/NLPchina/nlp-lang

https://github.com/NLPchina/ansj_seg

http://www.nlpcn.org/resource/list/4

https://github.com/sing1ee/jieba-solr

https://www.nuget.org/packages/jieba.NET

https://python.libhunt.com/project/snownlp/vs/jieba

https://github.com/FudanNLP/fnlp

https://github.com/hankcs/HanLP/

https://github.com/crownpku/awesome-chinese-nlp

https://www.codeproject.com/Articles/32175/Lucene-Net-Text-Analysis

http://lucenenet.apache.org/

https://github.com/apache/lucenenet

https://github.com/JimLiu/Lucene.Net.Analysis.PanGu

https://github.com/LonghronShen/OurAspNet.Lucene.Net.Analysis.PanGu

1.Chinese NLP Toolkits 中文NLP工具

Toolkits 綜合NLP工具包

Popular NLP Toolkits for English/Multi-Language 常用的英文或支持多語言的NLP工具包

Chinese Word Segment 中文分詞

Information Extraction 信息提取

QA & Chatbot 問答和聊天機(jī)器人

2.Corpus 中文語料

3.Organizations 相關(guān)中文NLP組織和會(huì)議

4.Learning Materials 學(xué)習(xí)資料

Chinese NLP Toolkits 中文NLP工具

Toolkits 綜合NLP工具包

THULAC 中文詞法分析工具包by 清華 (C++/Java/Python)

NLPIRby 中科院 (Java)

LTP 語言技術(shù)平臺(tái)by 哈工大 (C++)

FudanNLPby 復(fù)旦 (Java)

BosonNLPby Boson (商業(yè)API服務(wù))

HanNLP(Java)

SnowNLP(Python) Python library for processing Chinese text

YaYaNLP(Python) 純python編寫的中文自然語言處理包捏悬,取名于“牙牙學(xué)語”

DeepNLP(Python) Deep Learning NLP Pipeline implemented on Tensorflow with pretrained Chinese models.

chinese_nlp(C++ & Python) Chinese Natural Language Processing tools and examples

Chinese-Annotator(Python) Annotator for Chinese Text Corpus 中文文本標(biāo)注工具

Popular NLP Toolkits for English/Multi-Language 常用的英文或支持多語言的NLP工具包

CoreNLPby Stanford (Java)

NLTK(Python)

spaCy(Python)

OpenNLP(Java)

gensim(Python) Gensim is a Python library for topic modelling, document indexing and similarity retrieval with large corpora.

Chinese Word Segment 中文分詞

Jieba 結(jié)巴中文分詞(Python) 做最好的 Python 中文分詞組件

kcws 深度學(xué)習(xí)中文分詞(Python) BiLSTM+CRF與IDCNN+CRF

ID-CNN-CWS(Python) Iterated Dilated Convolutions for Chinese Word Segmentation

Genius 中文分詞(Python) Genius是一個(gè)開源的python中文分詞組件游添,采用 CRF(Conditional Random Field)條件隨機(jī)場算法。

loso 中文分詞(Python)

Information Extraction 信息提取

MITIE(C++) library and tools for information extraction

Duckling(Haskell) Language, engine, and tooling for expressing, testing, and evaluating composable language rules on input strings.

IEPY(Python) IEPY is an open source tool for Information Extraction focused on Relation Extraction.

Snorkel: A training data creation and management system focused on information extraction

Neural Relation Extraction implemented with LSTM in TensorFlow

A neural network model for Chinese named entity recognition

Information-Extraction-ChineseChinese Named Entity Recognition with IDCNN/biLSTM+CRF, and Relation Extraction with biGRU+2ATT 中文實(shí)體識(shí)別與關(guān)系提取

QA & Chatbot 問答和聊天機(jī)器人

Rasa NLU(Python) turn natural language into structured data

Rasa Core(Python) machine learning based dialogue engine for conversational software

Chatterbot(Python) ChatterBot is a machine learning, conversational dialog engine for creating chat bots.

Chatbot(Python) 基於向量匹配的情境式聊天機(jī)器人

Tipask(PHP) 一款開放源碼的PHP問答系統(tǒng),基于Laravel框架開發(fā)宛徊,容易擴(kuò)展歧杏,具有強(qiáng)大的負(fù)載能力和穩(wěn)定性。

QuestionAnsweringSystem(Java) 一個(gè)Java實(shí)現(xiàn)的人機(jī)問答系統(tǒng)影晓,能夠自動(dòng)分析問題并給出候選答案镰吵。

使用TensorFlow實(shí)現(xiàn)的Sequence to Sequence的聊天機(jī)器人模型(Python)

使用深度學(xué)習(xí)算法實(shí)現(xiàn)的中文閱讀理解問答系統(tǒng)(Python)

DuReader中文閱讀理解Baseline代碼(Python)

Corpus 中文語料

開放知識(shí)圖譜OpenKG.cn

大規(guī)模中文概念圖譜CN-Probase公眾號(hào)介紹

CLDC中文語言資源聯(lián)盟

中文 Wikipedia Dump

98年人民日?qǐng)?bào)詞性標(biāo)注庫@百度盤

百度百科100gb語料@百度盤密碼neqs 出處應(yīng)該是梁斌penny大神

搜狗20061127新聞?wù)Z料(包含分類)@百度盤

UDChinese(for training spaCy POS)

中文word2vec模型

中文word2vec模型之維基百科中文使用2017年6月20日中文維基百科語料訓(xùn)練的腳本和模型文件。

Synonyms:中文近義詞工具包基于維基百科中文和word2vec訓(xùn)練的近義詞庫挂签,封裝為python包文件疤祭。

Chinese_conversation_sentimentA Chinese sentiment dataset may be useful for sentiment analysis.

中文突發(fā)事件語料庫Chinese Emergency Corpus

dgk_lost_conv 中文對(duì)白語料chinese conversation corpus

用于訓(xùn)練中英文對(duì)話系統(tǒng)的語料庫Datasets for Training Chatbot System

八卦版問答中文語料

中國股市公告信息爬取通過python腳本從巨潮網(wǎng)絡(luò)的服務(wù)器獲取中國股市(sz,sh)的公告(上市公司和監(jiān)管機(jī)構(gòu))

tushare財(cái)經(jīng)數(shù)據(jù)接口TuShare是一個(gè)免費(fèi)、開源的python財(cái)經(jīng)數(shù)據(jù)接口包饵婆。

保險(xiǎn)行業(yè)語料庫[52nlp介紹Blog] OpenData in insurance area for Machine Learning Tasks

最全中華古詩詞數(shù)據(jù)庫唐宋兩朝近一萬四千古詩人, 接近5.5萬首唐詩加26萬宋詩. 兩宋時(shí)期1564位詞人勺馆,21050首詞。

DuReader中文閱讀理解數(shù)據(jù)

中文語料小數(shù)據(jù)包含了中文命名實(shí)體識(shí)別侨核、中文關(guān)系識(shí)別草穆、中文閱讀理解等一些小量數(shù)據(jù)

中文人名語料庫中文姓名,姓氏,名字,稱呼,日本人名,翻譯人名,英文人名。

中文數(shù)據(jù)預(yù)處理材料中文分詞詞典和中文停用詞

漢語拆字字典

Organizations 相關(guān)中文NLP組織和會(huì)議

中國中文信息學(xué)會(huì)

NLP Conference CalenderMain conferences, journals, workshops and shared tasks in NLP community.

Learning Materials 學(xué)習(xí)資料

中文Deep Learning Book

Stanford CS224n Natural Language Processing with Deep Learning 2017

Oxford CS DeepNLP 2017

Speech and Language Processingby Dan Jurafsky and James H. Martin

52nlp 我愛自然語言處理

hankcs 碼農(nóng)場

文本處理實(shí)踐課資料文本處理實(shí)踐課資料搓译,包含文本特征提缺(TF-IDF),文本分類侥衬,文本聚類诗祸,word2vec訓(xùn)練詞向量及同義詞詞林中文詞語相似度計(jì)算、文檔自動(dòng)摘要轴总,信息抽取直颅,情感分析與觀點(diǎn)挖掘等實(shí)驗(yàn)。

https://github.com/crownpku/Awesome-Chinese-NLP

<自已動(dòng)手構(gòu)造編譯系統(tǒng)》GCC

https://github.com/fanzhidongyzby/cit/

https://code.google.com/archive/p/redis/#!

https://github.com/antirez/redis/

https://github.com/rabbitmq

https://github.com/rabbitmq/rabbitmq-dotnet-client

https://www.microsoft.com/en-us/cognitive-toolkit/

http://www.csharpkit.com/

https://github.com/mathnet

https://marketplace.visualstudio.com/items?itemName=ms-toolsai.vstoolsai-vs2015

https://marketplace.visualstudio.com/items?itemName=ms-toolsai.vstoolsai-vs2017

https://docs.microsoft.com/en-us/cognitive-toolkit/setup-cntk-on-your-machine

https://www.microsoft.com/en-us/cognitive-toolkit/features/model-gallery/

https://github.com/Microsoft/CNTK

https://github.com/migueldeicaza/TensorFlowSharp

http://www.csharpkit.com/2017-10-15_55288.html

https://github.com/Microsoft/vs-tools-for-ai


作者:readilen

鏈接:http://www.reibang.com/p/f678372b0444

來源:簡書

簡書著作權(quán)歸作者所有怀樟,任何形式的轉(zhuǎn)載都請(qǐng)聯(lián)系作者獲得授權(quán)并注明出處功偿。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市往堡,隨后出現(xiàn)的幾起案子械荷,更是在濱河造成了極大的恐慌,老刑警劉巖虑灰,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吨瞎,死亡現(xiàn)場離奇詭異,居然都是意外死亡穆咐,警方通過查閱死者的電腦和手機(jī)颤诀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門字旭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人崖叫,你說我怎么就攤上這事遗淳。” “怎么了心傀?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵屈暗,是天一觀的道長。 經(jīng)常有香客問我脂男,道長养叛,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任疆液,我火速辦了婚禮一铅,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘堕油。我一直安慰自己潘飘,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布掉缺。 她就那樣靜靜地躺著卜录,像睡著了一般。 火紅的嫁衣襯著肌膚如雪眶明。 梳的紋絲不亂的頭發(fā)上艰毒,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音搜囱,去河邊找鬼丑瞧。 笑死,一個(gè)胖子當(dāng)著我的面吹牛蜀肘,可吹牛的內(nèi)容都是我干的绊汹。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼扮宠,長吁一口氣:“原來是場噩夢啊……” “哼西乖!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起坛增,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤获雕,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后收捣,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體届案,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年罢艾,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了楣颠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片嫁乘。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖球碉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情仓蛆,我是刑警寧澤睁冬,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站看疙,受9級(jí)特大地震影響豆拨,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜能庆,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一施禾、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧搁胆,春花似錦弥搞、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至顾腊,卻和暖如春粤铭,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背杂靶。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來泰國打工梆惯, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人吗垮。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓垛吗,卻偏偏與公主長得像,于是被迫代替她去往敵國和親抱既。 傳聞我的和親對(duì)象是個(gè)殘疾皇子职烧,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容