最近在參加共讀活動(dòng)详瑞,群里有書(shū)友對(duì)長(zhǎng)篇大段劃線的行為進(jìn)行了討論。 讀書(shū)時(shí)究竟要不要?jiǎng)澗€臣缀,要怎么劃線呢坝橡?這就涉及到讀書(shū)方法的問(wèn)題。 一精置、為什么讀書(shū)要?jiǎng)澗€计寇? 要想知道怎樣合理劃線,...

最近在參加共讀活動(dòng)详瑞,群里有書(shū)友對(duì)長(zhǎng)篇大段劃線的行為進(jìn)行了討論。 讀書(shū)時(shí)究竟要不要?jiǎng)澗€臣缀,要怎么劃線呢坝橡?這就涉及到讀書(shū)方法的問(wèn)題。 一精置、為什么讀書(shū)要?jiǎng)澗€计寇? 要想知道怎樣合理劃線,...
tidy結(jié)構(gòu)要求:a table with one-token-per-document-per-row,這使得我們可以使用流行的一整套工具番宁,比如 dplyr蹲堂、tidyr 和...
1、載入數(shù)據(jù) 2贝淤、中文分詞 3柒竞、使用unnest_tokens()函數(shù)整理為tidy結(jié)構(gòu) 4、去除停用詞 5播聪、dplyr::count()函數(shù)查找頻次最高的詞 6朽基、根據(jù)詞頻畫(huà)...
加載相應(yīng)R包 讀取hlm.txt文件 [1] "悶來(lái)時(shí)斂額,行去幾回頭. " 文本分詞 抓取“石頭”相關(guān)內(nèi)容离陶,并輸出第一段 [1] "此開(kāi)卷第一回也.作者自云:因曾歷過(guò)...
1 準(zhǔn)備工作 備注微信好友真實(shí)姓名稼虎。 通過(guò)Python的itchat庫(kù)爬取所有微信好友信息。代碼如下: 2 文本整理 2.1 讀取文本 2.2 將有用信息清洗成原始素材 2....
《精通機(jī)器學(xué)習(xí):基于R 第二版》學(xué)習(xí)筆記 1招刨、數(shù)據(jù)理解與數(shù)據(jù)準(zhǔn)備 在這個(gè)案例中霎俩,我們研究美國(guó)前總統(tǒng)奧巴馬的國(guó)會(huì)演講。有兩個(gè)主要的分析目標(biāo)沉眶,首先使用7篇國(guó)會(huì)演講建立一個(gè)主題模型...
主題建模的主要技術(shù)是隱含狄式分布(LDA)打却,它假定在文檔里能找到的主題和單詞分布來(lái)源于事先按照狄式分布抽樣的隱藏多項(xiàng)分布。主題建幕丫螅可以視為聚類(lèi)的一種形式柳击。 1、數(shù)據(jù)準(zhǔn)備 bb...
仙鶴草 AGRIMONIAEHERBA 來(lái)源 本品為薔薇科植物龍芽草AgrimoniapilosaLedeb.的干燥地上部分片习。 圖片 采收加工 夏捌肴、秋二季莖葉茂盛時(shí)采割,除去...
浙貝母Zhebeimu FRITILLARIAE THUNBERGII BULBUS 來(lái)源 本品為百合科植物浙貝母Fritillaria thunbergii Miq.的干燥...