R語言挖掘pubmed

par(no.readonly = T)顯示繪圖的全局參數(shù)

圖片.png

RISmed包,挖掘期刊和詞圖繪制

library(RISmed)
search_topic <- c('("Heart"[Title/Abstract] OR "Heart"[MeSH Terms])')
search_query <- EUtilsSummary(search_topic,db='pubmed', 
                              retmax=100,datetype='pdat',
                              mindate=2019,maxdate=2020
                              )
#retmax設置最大獲取量,mindate和maxdate設置檢索時間
#查看檢索內(nèi)容和文獻的pmid
summary(search_query)
QueryId(search_query)
image.png
#EUtilsGet爬取文獻信息
records <- EUtilsGet(search_query)
圖片.png
#信息挖掘跟匆,此處以找出發(fā)表最多的雜志為例
library(tidyverse)
#獲取第一篇摘要信息
records@AbstractText[1]
#獲取第一篇文章類型
records@PublicationType[1]
#提取檢索結(jié)果,用tibble搜集數(shù)據(jù)
pubmed <- tibble('Title'=ArticleTitle(records),
                 'Year'=YearPubmed(records),
                 'journal'=ISOAbbreviation(records))
#作圖查看論文發(fā)表最多的雜志
library(ggplot2)
ggplot(pubmed,aes(fct_infreq(journal)))+  #因子按照頻率排序
  geom_bar()+
  coord_flip()+
  theme_classic()
圖片.png

mesh主題詞提取及詞云繪制

#mesh詞提取
word <- records@Mesh
word <- word[!is.na(word)]
#去除重復的mesh詞
distinct(word[[1]],Heading,keep_all=T) #去除第一篇的重復的mesh詞
word <- lapply(word,distinct,Heading,.keep_all=T)
#批量提取第一列詞
wordtable <- list()
for (i in 1:length(word)){
  wordtable[[i]] = word[[i]][,1]
}
#計算詞頻
wordcd <- table(unlist(wordtable))
#詞云可視化
library(wordcloud2)
wordcloud2(wordcd) #交互性詞云
library(wordcloud)
library(RColorBrewer)
wordcd <- as.data.frame(wordcd)
wordcloud(wordcd$Var1,wordcd$Freq,col=rev(brewer.pal(7,'Set2')))
圖片.png

pubmed.mineR包爬取下載好的摘要信息

1.pubmed下載摘要信息


圖片.png
#pubmed.mineR包
library(pubmed.mineR)
#導入下載好的摘要
pubmed_abstracts <- readabs('abstract-Dimethylfu-set.txt')
#查看雜志信息
pubmed_abstracts@Journal[1:10]
#查看第一篇摘要信息
pubmed_abstracts@Abstract[1]
#設置分詞參數(shù)
Sys.setlocale('LC_ALL','C')
#摘要文本分詞
abswords <- word_atomizations(pubmed_abstracts)
#可視化前20個
library(ggpubr)
ggdotchart(abswords[1:50,],x='words',y='Freq',  #顯示前50個高頻詞
           sorting='descending',
           add = 'segments',
           ggtheme=theme_pubr(),
           rotate=TRUE
)
圖片.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末膨更,一起剝皮案震驚了整個濱河市拖云,隨后出現(xiàn)的幾起案子曾雕,更是在濱河造成了極大的恐慌,老刑警劉巖剂娄,帶你破解...
    沈念sama閱讀 212,080評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異玄呛,居然都是意外死亡阅懦,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,422評論 3 385
  • 文/潘曉璐 我一進店門徘铝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來耳胎,“玉大人,你說我怎么就攤上這事惕它∨挛纾” “怎么了?”我有些...
    開封第一講書人閱讀 157,630評論 0 348
  • 文/不壞的土叔 我叫張陵淹魄,是天一觀的道長郁惜。 經(jīng)常有香客問我,道長甲锡,這世上最難降的妖魔是什么兆蕉? 我笑而不...
    開封第一講書人閱讀 56,554評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮缤沦,結(jié)果婚禮上虎韵,老公的妹妹穿的比我還像新娘。我一直安慰自己缸废,他們只是感情好包蓝,可當我...
    茶點故事閱讀 65,662評論 6 386
  • 文/花漫 我一把揭開白布驶社。 她就那樣靜靜地躺著,像睡著了一般养晋。 火紅的嫁衣襯著肌膚如雪衬吆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,856評論 1 290
  • 那天绳泉,我揣著相機與錄音逊抡,去河邊找鬼。 笑死零酪,一個胖子當著我的面吹牛冒嫡,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播四苇,決...
    沈念sama閱讀 39,014評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼孝凌,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了月腋?” 一聲冷哼從身側(cè)響起蟀架,我...
    開封第一講書人閱讀 37,752評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎榆骚,沒想到半個月后片拍,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,212評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡妓肢,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,541評論 2 327
  • 正文 我和宋清朗相戀三年捌省,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片碉钠。...
    茶點故事閱讀 38,687評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡纲缓,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出喊废,到底是詐尸還是另有隱情祝高,我是刑警寧澤,帶...
    沈念sama閱讀 34,347評論 4 331
  • 正文 年R本政府宣布操禀,位于F島的核電站褂策,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏颓屑。R本人自食惡果不足惜斤寂,卻給世界環(huán)境...
    茶點故事閱讀 39,973評論 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望揪惦。 院中可真熱鬧遍搞,春花似錦、人聲如沸器腋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,777評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至诊县,卻和暖如春讲弄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背依痊。 一陣腳步聲響...
    開封第一講書人閱讀 32,006評論 1 266
  • 我被黑心中介騙來泰國打工避除, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人胸嘁。 一個月前我還...
    沈念sama閱讀 46,406評論 2 360
  • 正文 我出身青樓瓶摆,卻偏偏與公主長得像,于是被迫代替她去往敵國和親性宏。 傳聞我的和親對象是個殘疾皇子群井,可洞房花燭夜當晚...
    茶點故事閱讀 43,576評論 2 349