240 發(fā)簡信
IP屬地:四川
  • 120
    Solr建立索引練習(xí)

    目錄 實(shí)驗(yàn)內(nèi)容實(shí)驗(yàn)環(huán)境實(shí)驗(yàn)過程總結(jié) 實(shí)驗(yàn)內(nèi)容: 使用Solr全文搜索引擎,定位金庸小說神雕俠侶中獨(dú)孤求敗出現(xiàn)的情節(jié)计螺,認(rèn)識(shí)Solr期奔,并學(xué)習(xí)Solr的使用。 實(shí)驗(yàn)環(huán)境: 操作系統(tǒng)...

  • 120
    EX06 Google的愚人節(jié)項(xiàng)目

    谷歌素來有在愚人節(jié)發(fā)布所謂“新服務(wù)”的傳統(tǒng)危尿,盡管最終證明這不過是愚人節(jié)玩笑而已,但每一個(gè)都讓人津津樂道馁痴,回味無窮谊娇。以下列舉了2000年到2018年谷歌在愚人節(jié)這天推出的各種項(xiàng)...

  • 120
    使用開放API獲取網(wǎng)站數(shù)據(jù)——以豆瓣為例

    目錄 實(shí)驗(yàn)內(nèi)容實(shí)驗(yàn)環(huán)境實(shí)驗(yàn)過程 實(shí)驗(yàn)內(nèi)容: 嘗試使用網(wǎng)站開放的API,獲取網(wǎng)站數(shù)據(jù)罗晕,了解除網(wǎng)絡(luò)爬蟲外獲取高質(zhì)量網(wǎng)站數(shù)據(jù)的新途徑济欢。 實(shí)驗(yàn)環(huán)境: 操作系統(tǒng):CentOS Linu...

  • 120
    使用python抓取豆瓣top250電影數(shù)據(jù)進(jìn)行分析

    抓取豆瓣Top250電影數(shù)據(jù)的鏈接和電影名稱 代碼如下: 直接打開top350_movie.csv 文件可能會(huì)亂碼,這是window下因?yàn)閏sv 文件編碼格式為gbk 預(yù)覽數(shù)...

  • 120
    Apache Tika文件解析練習(xí)

    目錄 1.實(shí)驗(yàn)內(nèi)容2.實(shí)驗(yàn)環(huán)境3.實(shí)驗(yàn)過程1)啟用Apache Tika2)使用Tika解析docx文件3)使用Tika解析網(wǎng)頁4)使用Tika解析XML和RDF文件5)使用...

  • 120
    jieba分詞練習(xí)

    實(shí)驗(yàn)內(nèi)容: 使用Python分詞模塊:Jieba,對(duì)四川大學(xué)公共管理學(xué)院2015-2018年308條新聞內(nèi)容進(jìn)行分詞分析谬擦。 實(shí)驗(yàn)環(huán)境: 操作系統(tǒng):CentOS Linux r...

  • 120
    《大小說家》歌詞分詞切距、詞頻統(tǒng)計(jì)及詞云圖

    《大小說家》是林宥嘉于2012年6月22日發(fā)行的第四張專輯,共收錄了10首歌曲惨远。 而后谜悟,我整理出了這十首歌曲的歌詞放置在YogaLin.txt文件中。并準(zhǔn)備用jieba與在線...

  • 120
    認(rèn)識(shí)robots協(xié)議

    robots協(xié)議的作用: Robots協(xié)議(也稱為爬蟲協(xié)議、機(jī)器人協(xié)議等)的全稱是“網(wǎng)絡(luò)爬蟲排除標(biāo)準(zhǔn)”(Robots Exclusion Protocol)贺氓,網(wǎng)站通過Robo...

  • 120
    scrapy學(xué)習(xí)

    一礼患、云服務(wù)器配置:為Python安裝scrapy 1)檢查當(dāng)前服務(wù)器是否安裝Python scrapy模塊 Python版本已升級(jí)為:2.7.14顯示:No module n...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品