240 發(fā)簡信
IP屬地:北京
  • 120
    游戲領(lǐng)域輿論的數(shù)據(jù)獲取與分析項目總結(jié)

    項目目標(biāo) 數(shù)據(jù)獲取。使用scrapy-redis框架構(gòu)建分布式爬蟲, 數(shù)據(jù)分析。主要分為以下三個模塊:新詞發(fā)現(xiàn)柳弄。由于語料中含有許多在常規(guī)的語料當(dāng)中不含有的新詞诫咱,對于之后的任務(wù)...

  • 一個隱蔽的jq getJson回調(diào)不執(zhí)行問題

    一般而言jq的getJson回調(diào)不執(zhí)行除了請求本身就出錯之外那肯定就是json格式本身有問題了最近在做一個demo鸿摇,使用python的flask框架進行構(gòu)建萨惑,route代碼如...

  • 120
    百度貼吧高級爬蟲

    最近做了一個完整版的百度貼啊全吧爬蟲,過程比較具有代表性贞滨,分析過來供大家參考入热。代碼在解禁后后貼吧爬蟲查看。 項目結(jié)構(gòu)項目主要采用scrap-redis框架,為分布式爬蟲勺良。數(shù)據(jù)...

  • 2019-07-25

    回歸簡書绰播,最近幾日逐漸把之前的文章都搬運過來~

  • xpath一些經(jīng)驗記錄

    常做爬蟲的人肯定是對xpath非常地熟悉了,在這么多h5元素選擇器當(dāng)中郑气,我還是最喜歡xpath幅垮。下面就來記錄一些xpath當(dāng)中用到的東西: class選擇器的問題 一般來說選...

  • CCF NLP比賽

    好久沒寫文章了,因為最近在忙這個比賽示弓。初賽已經(jīng)刷到第一了讳侨,但是實在沒有什么所謂的經(jīng)驗,我在想是不是這種類型的比賽參加的選手都在挖空腦門怎么去調(diào)模型卻忘記了數(shù)據(jù)本身的重要性奏属,我...

  • 劍指offer刷題筆記

    因為劍指offer的題目比較簡單跨跨,所以就做成合集了,刷一題更新一題囱皿。 1 二位數(shù)組中的查找 在一個二維數(shù)組中(每個一維數(shù)組的長度相同)勇婴,每一行都按照從左到右遞增的順序排序,每...

  • List

    今天研究了一下markdown的語法才發(fā)現(xiàn)還有一種可以劃分出區(qū)域的方法嘱腥。鏈表是一種很常見的數(shù)據(jù)結(jié)構(gòu)耕渴,那么我們就復(fù)習(xí)一下,使用C++現(xiàn)擼出一個linkedlist Leetco...

  • Permutation

    leetcode里面應(yīng)該有很多個與permutation相關(guān)的問題齿兔,那么首先就先寫出一個全排列把橱脸。 道理其實很簡單,就是簡單的backtracking分苇。其實用什么樹去解釋會讓...

  • Jump Game

    這道題有點像大富翁呀添诉,題意也很簡單明確,就不解釋了医寿。我首先想到的就是用迭代遍歷硬杠它栏赴。從最大值開始跳,每個位置都是從最小值開始跳靖秩,如果碰到了就返回须眷,然后輸出。形象點地盆偿,可以用...

  • Spiral Matrix

    好久沒寫文章了...自罰30大板在刷leetcode就繼續(xù)更新吧 題目很好理解柒爸,就是把一個矩陣螺旋著輸出∈屡ぃ看到這個題目捎稚,我首先就想著使用深度優(yōu)先進行搜索。這有點像迷宮的搜索,...

  • LDA是什么

    對百度貼文檔的處理探索系列第一期Target:弄清什么是LDA主題模型想直接看如何使用Python進行處理而對于理論沒有什么要求的同學(xué)可以移步使用LDA主題模型對貼吧文檔進行...

個人介紹
一只咸魚
求一個數(shù)據(jù)分析のoffer
亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品