作者:Joseph Rickert
翻譯:黃小偉命浴,先后從事游戲、社交及金融數(shù)據(jù)研究及應(yīng)用贱除,目前就職網(wǎng)易杭州
2018年3月份生闲,共有約200個R新包收錄于CRAN,本文選摘了其中40個新包加以功能簡述月幌,主要包括:計(jì)算方法碍讯、數(shù)據(jù)、數(shù)據(jù)科學(xué)飞醉、科學(xué)冲茸、統(tǒng)計(jì)屯阀、時(shí)間序列缅帘、工具和可視化等轴术。希望有助于大家的學(xué)習(xí)!
一. 計(jì)算方法
1. dynprog: 提供將遞歸快速轉(zhuǎn)換為動態(tài)編程算法的工具钦无。
2. fmlogcondens: 實(shí)現(xiàn)了多元對數(shù)凹函數(shù)族最大似然估計(jì)的快速求解逗栽。
3. knor: 提供對knor的訪問,用于計(jì)算k-means算法失暂。
二. 數(shù)據(jù)
1. daymetr: 提供Daymet氣候數(shù)據(jù)的編程接口彼宠,并支持相關(guān)分析。
2. NOAAWeather: 提供從所有NOAA站點(diǎn)檢索實(shí)時(shí)天氣數(shù)據(jù)的功能弟塞,并支持繪制時(shí)間序列凭峡、箱線圖、熱圖和地理空間圖等圖形决记。
3. ppitables: 提供部分國家的相關(guān)數(shù)據(jù)摧冀,以確定基于其PPI(貧困概率指數(shù))的貧困家庭可能性,同時(shí)提供了創(chuàng)新扶貧行動的相關(guān)資料系宫。
4. usfertilizer: 提供了美國各個縣在1945年至2012年索昂,所使用肥料、氮和磷的統(tǒng)計(jì)數(shù)據(jù)扩借。
三. 數(shù)據(jù)科學(xué)
1. greybox: 基于偏相關(guān)性的信息標(biāo)準(zhǔn)椒惨,實(shí)現(xiàn)模型選擇和組合的工具。
2. h2o4gpu: 實(shí)現(xiàn)H2O4GPU的接口潮罪,這是一組用于機(jī)器學(xué)習(xí)算法的GPU解算器康谆。
3. iml: 提供了部分具備可解釋性的方法,用于分析機(jī)器學(xué)習(xí)模型的行為和預(yù)測結(jié)果嫉到。包括特征重要性沃暗、局部依賴圖、Shapley值和樹替代模型等屯碴。
4. iTOP: 提供函數(shù)來推斷不同數(shù)據(jù)集之間的拓?fù)浣Y(jié)構(gòu)關(guān)系描睦,該方法是基于RV系數(shù)的擴(kuò)展。
5. onnx: 實(shí)現(xiàn)了ONNX的接口(the Open Neural Network Exchange)导而,為機(jī)器學(xué)習(xí)模型提供了一種開源的格式忱叭。
6. rcqp: 實(shí)現(xiàn)基于CWB軟件的語料庫查詢協(xié)議功能,這是一組用于管理和查詢大型文本語料庫的開源工具今艺。
四. 政治科學(xué)
1. coalitions: 根據(jù)調(diào)查結(jié)果數(shù)據(jù)韵丑,利用MCMC方法計(jì)算聯(lián)盟大多數(shù)的概率。
五. 科學(xué)
1. diagmeta: 采用Steinhauser等人2016年提出的方法虚缎,對診斷精度研究進(jìn)行薈萃分析撵彻。
2. NetworkExtinction: 提供了模擬食物鏈中物種滅絕的功能钓株,并分析了Dunne等人所描述的連鎖效應(yīng)。
3. foreSIGHT: 提供工具來創(chuàng)建水文氣候場景陌僵、壓力測試轴合、可視化等系統(tǒng),用于氣候變化影響的評估碗短。
4. PINSPlus: 根據(jù)Nguyen等人2017年提出的方法受葛,提供了一種擾動聚類方法,將疾病的數(shù)據(jù)和分類整合到不同亞型偎谁。
六. 統(tǒng)計(jì)
1. chandwich: 根據(jù)Chandler和Bate在2007年提出的方法总滩,提供了使用參數(shù)協(xié)方差矩陣的穩(wěn)健三明治估計(jì)量,調(diào)整獨(dú)立對數(shù)似然函數(shù)巡雨。
2. ciuupi: 當(dāng)存在不確定的先驗(yàn)信息時(shí)闰渔,提供函數(shù)來計(jì)算具有iid正態(tài)誤差和已知方差的線性回歸參數(shù)組合的置信區(qū)間。
3. CoxPhLb: 利用Cox模型用于分析右截?cái)囝硗㈤L度偏差數(shù)據(jù)冈涧。包括模型擬合和檢驗(yàn)、平穩(wěn)性假設(shè)檢驗(yàn)等蝌以。
4. cutpointr: 提供函數(shù)來估計(jì)炕舵、優(yōu)化二進(jìn)制分類任務(wù)中指定度量標(biāo)準(zhǔn)的切點(diǎn),并使用自助法來驗(yàn)證性能跟畅。
5. fcr: 提供了部分函數(shù)咽筋,用于功能并發(fā)回歸中的動態(tài)預(yù)測問題,并對函數(shù):pffr()進(jìn)行了擴(kuò)展徊件。
6. ggdag: 基于DAGitty web工具奸攻,提供對有序的非循環(huán)圖的整理、分析和繪圖功能虱痕。
7. hdme: 對于廣義線性模型的誤差度量提供了部分函數(shù)睹耐,包括套索(L1懲罰)、廣義矩陣不確定性選擇器等部翘。
8. joineRmeta: 擴(kuò)展了Henderson等人2000年提出的聯(lián)合模型硝训,包括多元研究、元分析案例等新思。
9. rare: 借助Yan和Bien在2018年提出的交替方向法窖梁,構(gòu)建了基于樹的套索正則化的線性模型。
七. 時(shí)間序列
1. rMEA: 提供讀取夹囚、可視化和輸出雙變量運(yùn)動能量時(shí)間序列的工具纵刘。
2. tsfknn: 提供使用最近鄰回歸預(yù)測時(shí)間序列的功能。
3. spGARCH: 提供了部分功能荸哟,用于分析空間和時(shí)空自回歸條件異位假哎、空間ARCH類型過程的模擬瞬捕、spARCH模型參數(shù)的準(zhǔn)極大似然估計(jì)等問題。
八. 工具
1. base2grob: 提供了一個函數(shù)將基礎(chǔ)繪圖函數(shù)對象轉(zhuǎn)化為grob對象舵抹,并與grid系統(tǒng)兼容肪虎。
2. cranly: 提供用于清理、組織掏父、總結(jié)和可視化CRAN包信息的功能笋轨,以及構(gòu)建包指示網(wǎng)絡(luò)(依賴秆剪、導(dǎo)入赊淑、建議、增強(qiáng))和協(xié)作網(wǎng)絡(luò)的功能仅讽。
3. osrmr: 對OSRM(Open Source Routing Machine)API實(shí)現(xiàn)了封裝陶缺。
4. fasterize: 對raster包的函數(shù):rasterize()提供了一個快速的簡單替換,它采用sf類型對象和Wylie等人在1967年提出的掃描線算法(scan line algorithm)洁灵。
5. jsr223: 提供了一個高質(zhì)量的集成饱岸,使得在R中方便的調(diào)用Java對象,同時(shí)提供了統(tǒng)一的接口徽千,可以在R中方便的調(diào)用其他編程語言苫费,諸如Groovy、JS双抽、Ruby等百框。
九. 可視化
1. clustree: 隨著分辨率的增加,提供函數(shù)來生成聚類樹可視化展示牍汹。
2. datamaps: 在RStudio铐维、Shiny app等環(huán)境中,創(chuàng)建具有氣泡和圓弧的交互式輪廓圖慎菲,其中坐標(biāo)和區(qū)域名稱可由用戶自主設(shè)定嫁蛇。
3. funnelR: 提供為比例數(shù)據(jù)創(chuàng)建漏斗圖的功能,并支持用戶定義的基準(zhǔn)露该、置信范圍和估計(jì)方法睬棚。
4. nVennR: 為Perez-Silva等人2018年提出的nVenn算法提供一個調(diào)用接口。
5. smovie: 使用rpanel包創(chuàng)建交互式動畫解幼,幫助學(xué)生理解統(tǒng)計(jì)概念抑党。