該資源的github地址:Qix
《人工智能和機(jī)器學(xué)習(xí)領(lǐng)域有趣的開源項目》
介紹:部分中文列表
《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實現(xiàn)--基于SMO的SVM分類器》
介紹:此外作者還有一篇元算法、AdaBoost python實現(xiàn)文章
《Numerical Optimization: Understanding L-BFGS》
介紹:加州伯克利大學(xué)博士Aria Haghighi寫了一篇超贊的數(shù)值優(yōu)化博文漱挎,從牛頓法講到擬牛頓法庐扫,再講到BFGS以及L-BFGS, 圖文并茂诲泌,還有偽代碼。強(qiáng)烈推薦肛冶。
介紹:還有續(xù)集簡明深度學(xué)習(xí)方法概述(二)
介紹:R語言程序員私人定制版
《谷歌地圖解密:大數(shù)據(jù)與機(jī)器學(xué)習(xí)的結(jié)合》
介紹:谷歌地圖解密
介紹:空間數(shù)據(jù)挖掘常用方法
《Use Google's Word2Vec for movie reviews》
介紹:Kaggle新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學(xué)邊用word2vec和deep learning做NLP“ 里面全套教程教一步一步用python和gensim包的word2vec模型鲜锚,并在實際比賽里面比調(diào)參數(shù)和清數(shù)據(jù)突诬。 如果已裝過gensim不要忘升級
介紹:PyNLPIR提供了NLPIR/ICTCLAS漢語分詞的Python接口,此外Zhon提供了常用漢字常量,如CJK字符和偏旁芜繁,中文標(biāo)點(diǎn)旺隙,拼音,和漢字正則表達(dá)式(如找到文本中的繁體字)
《深度卷積神經(jīng)網(wǎng)絡(luò)下圍棋》
介紹:這文章說把最近模型識別上的突破應(yīng)用到圍棋軟件上骏令,打16萬張職業(yè)棋譜訓(xùn)練模型識別功能蔬捷。想法不錯。訓(xùn)練后目前能做到不用計算榔袋,只看棋盤就給出下一步周拐,大約10級棋力。但這篇文章太過樂觀凰兑,說什么人類的最后一塊堡壘馬上就要跨掉了妥粟。話說得太早。不過吏够,如果與別的軟件結(jié)合應(yīng)該還有潛力可挖勾给。@萬精油墨綠
介紹:UT Austin教授Eric Price關(guān)于今年NIPS審稿實驗的詳細(xì)分析,他表示,根據(jù)這次實驗的結(jié)果稿饰,如果今年NIPS重新審稿的話锦秒,會有一半的論文被拒。
《2014年最佳的大數(shù)據(jù)喉镰,數(shù)據(jù)科學(xué)文章》
介紹:KDNuggets分別總結(jié)了2014年14個閱讀最多以及分享最多的文章旅择。我們從中可以看到多個主題——深度學(xué)習(xí),數(shù)據(jù)科學(xué)家職業(yè)侣姆,教育和薪酬生真,學(xué)習(xí)數(shù)據(jù)科學(xué)的工具比如R和Python以及大眾投票的最受歡迎的數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘語言
《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實現(xiàn)--線性回歸(Linear Regression)算法》
介紹:Python實現(xiàn)線性回歸,作者還有其他很棒的文章推薦可以看看
《2014中國大數(shù)據(jù)技術(shù)大會33位核心專家演講PDF》
介紹:2014中國大數(shù)據(jù)技術(shù)大會33位核心專家演講PDF下載
介紹:這是T. Mikolov & Y. Bengio最新論文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews 沉噩,使用RNN和PV在情感分析效果不錯,[項目代碼](https://github.com/mesnilgr/iclr15)公布在github(目前是空的)柱蟀。這意味著ParagraphVector終于揭開面紗了嘛川蒙。
《NLPIR/ICTCLAS2015分詞系統(tǒng)大會上的技術(shù)演講 》
介紹:NLPIR/ICTCLAS2015分詞系統(tǒng)發(fā)布與用戶交流大會上的演講,請更多朋友檢閱新版分詞吧长已。 我們實驗室同學(xué)的演講包括:孫夢姝-基于評論觀點(diǎn)挖掘的商品搜索技術(shù)研究李然-主題模型
介紹:Convex Neural Networks 解決維數(shù)災(zāi)難
介紹:介紹CNN參數(shù)在使用bp算法時該怎么訓(xùn)練畜眨,畢竟CNN中有卷積層和下采樣層,雖然和MLP的bp算法本質(zhì)上相同术瓮,但形式上還是有些區(qū)別的康聂,很顯然在完成CNN反向傳播前了解bp算法是必須的。此外作者也做了一個資源集:機(jī)器學(xué)習(xí)胞四,深度學(xué)習(xí)恬汁,視覺,數(shù)學(xué)等
介紹:如果要在一篇文章中匹配十萬個關(guān)鍵詞怎么辦辜伟?Aho-Corasick算法利用添加了返回邊的Trie樹氓侧,能夠在線性時間內(nèi)完成匹配。 但如果匹配十萬個正則表達(dá)式呢 导狡? 這時候可以用到把多個正則優(yōu)化成Trie樹的方法约巷,如日本人寫的Regexp::Trie
介紹:深度學(xué)習(xí)閱讀清單
介紹:Caffe是一個開源的深度學(xué)習(xí)框架,作者目前在google工作烘豌,作者主頁Yangqing Jia (賈揚(yáng)清)
《GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn) 》
介紹:2014 ImageNet冠軍GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn)模型,GoogleNet論文.
《LambdaNet载庭,Haskell實現(xiàn)的開源人工神經(jīng)網(wǎng)絡(luò)庫 》
介紹:LambdaNetLambdaNet是由Haskell實現(xiàn)的一個開源的人工神經(jīng)網(wǎng)絡(luò)庫,它抽象了網(wǎng)絡(luò)創(chuàng)建廊佩、訓(xùn)練并使用了高階函數(shù)囚聚。該庫還提供了一組預(yù)定義函數(shù),用戶可以采取多種方式組合這些函數(shù)來操作現(xiàn)實世界數(shù)據(jù)标锄。
介紹:如果你從事互聯(lián)網(wǎng)搜索顽铸,在線廣告,用戶行為分析料皇,圖像識別谓松,自然語言理解,或者生物信息學(xué)践剂,智能機(jī)器人鬼譬,金融預(yù)測,那么這門核心課程你必須深入了解逊脯。
介紹:"人工智能研究分許多流派优质。其中之一以IBM為代表,認(rèn)為只要有高性能計算就可得到智能,他們的‘深藍(lán)’擊敗了世界象棋冠軍巩螃;另一流派認(rèn)為智能來自動物本能演怎;還有個很強(qiáng)的流派認(rèn)為只要找來專家,把他們的思維用邏輯一條條寫下避乏,放到計算機(jī)里就行……" 楊強(qiáng)在TEDxNanjing談智能的起源
《深度RNN/LSTM用于結(jié)構(gòu)化學(xué)習(xí) 0)序列標(biāo)注Connectionist Temporal ClassificationICML06》
介紹:1)機(jī)器翻譯Sequence to Sequence NIPS142)成分句法GRAMMAR AS FOREIGN LANGUAGE
《Deep Learning實戰(zhàn)之word2vec》
介紹:網(wǎng)易有道的三位工程師寫的word2vec的解析文檔爷耀,從基本的詞向量/統(tǒng)計語言模型->NNLM->Log-Linear/Log-Bilinear->層次化Log-Bilinear,到CBOW和Skip-gram模型拍皮,再到word2vec的各種tricks歹叮,公式推導(dǎo)與代碼,基本上是網(wǎng)上關(guān)于word2vec資料的大合集春缕,對word2vec感興趣的朋友可以看看
《Machine learning open source software》
介紹:機(jī)器學(xué)習(xí)開源軟件,收錄了各種機(jī)器學(xué)習(xí)的各種編程語言學(xué)術(shù)與商業(yè)的開源軟件.與此類似的還有很多例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software,LIBSVM -- A Library for Support Vector Machines,Weka 3: Data Mining Software in Java,scikit-learn:Machine Learning in Python,Natural Language Toolkit:NLTK,MAchine Learning for LanguagE Toolkit,Data Mining - Fruitful and Fun,Open Source Computer Vision Library
《機(jī)器學(xué)習(xí)入門者學(xué)習(xí)指南》
介紹:作者是計算機(jī)研二(寫文章的時候盗胀,現(xiàn)在是2015年了應(yīng)該快要畢業(yè)了),專業(yè)方向自然語言處理.這是一點(diǎn)他的經(jīng)驗之談.對于入門的朋友或許會有幫助
《A Tour of Machine Learning Algorithms》
介紹:這是一篇關(guān)于機(jī)器學(xué)習(xí)算法分類的文章锄贼,非常好
《2014年的《機(jī)器學(xué)習(xí)日報》大合集》
介紹:機(jī)器學(xué)習(xí)日報里面推薦很多內(nèi)容,在這里有一部分的優(yōu)秀內(nèi)容就是來自機(jī)器學(xué)習(xí)日報.
《 Image classification with deep learning常用模型》
介紹:這是一篇關(guān)于圖像分類在深度學(xué)習(xí)中的文章
介紹:作者與Bengio的兄弟Samy 09年合編《自動語音識別:核方法》 3)李開復(fù)1989年《自動語音識別》專著女阀,其博導(dǎo)宅荤、94年圖靈獎得主Raj Reddy作序
介紹: 作者是360電商技術(shù)組成員,這是一篇NLP在中文分詞中的應(yīng)用
《Using convolutional neural nets to detect facial keypoints tutorial》
介紹: 使用deep learning的人臉關(guān)鍵點(diǎn)檢測,此外還有一篇AWS部署教程
《書籍推薦:Advanced Structured Prediction》
介紹: 由Sebastian Nowozin等人編纂MIT出版的新書《Advanced Structured Prediction》http://t.cn/RZxipKG浸策,匯集了結(jié)構(gòu)化預(yù)測領(lǐng)域諸多牛文冯键,涉及CV、NLP等領(lǐng)域庸汗,值得一讀惫确。網(wǎng)上公開的幾章草稿:一,二,三,四,五
《An Introduction to Matrix Concentration Inequalities》
介紹: Tropp把數(shù)學(xué)家用高深裝逼的數(shù)學(xué)語言寫的矩陣概率不等式用初等的方法寫出來,是非常好的手冊蚯舱,領(lǐng)域內(nèi)的paper各種證明都在用里面的結(jié)果改化。雖說是初等的,但還是非常的難
《The free big data sources you should know》
介紹: 不容錯過的免費(fèi)大數(shù)據(jù)集枉昏,有些已經(jīng)是耳熟能詳陈肛,有些可能還是第一次聽說,內(nèi)容跨越文本兄裂、數(shù)據(jù)句旱、多媒體等,讓他們伴你開始數(shù)據(jù)科學(xué)之旅吧晰奖,具體包括:Data.gov谈撒、US Census Bureau、European Union Open Data Portal匾南、Data.gov.uk等
《A Brief Overview of Deep Learning》
介紹: 谷歌科學(xué)家啃匿、Hinton親傳弟子Ilya Sutskever的深度學(xué)習(xí)綜述及實際建議
《A Deep Dive into Recurrent Neural Nets》
介紹: 非常好的討論遞歸神經(jīng)網(wǎng)絡(luò)的文章,覆蓋了RNN的概念午衰、原理立宜、訓(xùn)練及優(yōu)化等各個方面內(nèi)容冒萄,強(qiáng)烈推薦!本文作者Nikhil Buduma還有一篇Deep Learning in a Nutshell值得推薦
《機(jī)器學(xué)習(xí):學(xué)習(xí)資源》
介紹:里面融合了很多的資源橙数,例如競賽尊流,在線課程,demo灯帮,數(shù)據(jù)整合等崖技。有分類