Jsoup實(shí)現(xiàn)微博登陸及發(fā)微博(帶驗(yàn)證碼)

城堡

前言

很早之前用別的語言寫過一次微博登陸泥技,現(xiàn)在改成java版浆兰,主要是為了驗(yàn)證jsoup的強(qiáng)大,一款完全可勝任http請(qǐng)求和html解析的工具珊豹。抓包簸呈,抽取js的方法這里就不在贅述。

工具

  • jsoup-1.11.2(使用最新)
  • 打碼賬號(hào)及官方提供的java類(市面上很多店茶,這里用若快)

開始

  1. 首先是分析登錄過程蜕便,常登陸的沒有驗(yàn)證碼,新的會(huì)有驗(yàn)證碼贩幻,保險(xiǎn)起見這里都采用有驗(yàn)證碼的方式登錄轿腺。
  2. Base64編碼用戶名后,get請(qǐng)求獲取servertime丛楚,nonce族壳,pubkey,pcid趣些,及返回的cookie
        //Base64編碼用戶名
        su = new BASE64Encoder().encode(usename.getBytes());
        String url = "http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=" + su + "&rsakt=mod&checkpin=1&client=ssologin.js(v1.4.18)&_=" +
                getTimestamp();
        Connection.Response execute = Jsoup.connect(url).ignoreContentType(true).execute();
        //獲取返回?cái)?shù)據(jù)
        String body = execute.body();
        //獲取返回cookie
        Map<String, String> photocookie = execute.cookies();
        JSONObject jsonObject = JSONObject.parseObject(StringUtils.substringBetween(body, "(", ")"));
        servertime = jsonObject.getString("servertime");
        nonce = jsonObject.getString("nonce");
        pubkey = jsonObject.getString("pubkey");
        pcid = jsonObject.getString("pcid");
    
  3. 帶著返回的cookie及pcid仿荆,get請(qǐng)求獲取驗(yàn)證碼
        url = "http://login.sina.com.cn/cgi/pin.php?r=54474015&s=0&p=" + pcid;
        byte[] bytes = Jsoup.connect(url).ignoreContentType(true).cookies(photocookie).execute().bodyAsBytes();
    
  4. 調(diào)用打碼平臺(tái)的類實(shí)現(xiàn)打碼,返回結(jié)果
    public static String createByPost(String username, String password, String typeid, String timeout, String softid, String softkey,byte[] byteArr) {
        String result = "";
        String param = String
                .format(
                        "username=%s&password=%s&typeid=%s&timeout=%s&softid=%s&softkey=%s",
                        username, password, typeid, timeout, softid, softkey);
        try {
            result = RuoKuai.httpPostImage("http://api.ruokuai.com/create.xml", param, byteArr);
            // jsoup去解析xml (略坑坏平,加了好多參數(shù)進(jìn)去)
            result = Jsoup.parse(result).select("body > root > result").text();
        } catch(Exception e) {
            result = "未知問題";
        }
        return result;
    }
    
  5. 調(diào)用js拢操,對(duì)密碼動(dòng)態(tài)加密,返回參數(shù)sp
    private boolean encodePwd() {
        ScriptEngineManager sem = new ScriptEngineManager();
        ScriptEngine se = sem.getEngineByName("javascript");
        try {
            // FileReader fr = new FileReader("");
            se.eval(LOGIN_JS);
            Invocable invocableEngine = (Invocable) se;
            sp = (String) invocableEngine.invokeFunction("getPW", password, servertime, nonce, pubkey);
            return true;
        } catch (ScriptException e) {
        } catch (NoSuchMethodException e) {
        }
        return false;
    }
    
  6. 帶著參數(shù)pcid舶替,code令境,sp,su顾瞪,servertime展父,nonce,sp及cookie玲昧,post請(qǐng)求返回cookies及下一個(gè)url栖茉,此時(shí)可從返回的body中判斷登錄成功與否
        //retcode=101 賬號(hào)密碼錯(cuò)誤
        //retcode=80 請(qǐng)輸入正確的密碼
        //retcode=4049 輸入驗(yàn)證碼
        //retcode=2070 驗(yàn)證碼錯(cuò)誤
        url = "http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.4.18)";
        String post = "entry=weibo&gateway=1&from=&savestate=7&useticket=1&pagerefer=http%3A%2F%2Fpassport.weibo" +
                ".com%2Fvisitor%2Fvisitor%3Fentry%3Dminiblog%26a%3Denter%26url%3Dhttp%253A%252F%252Fweibo.com%252F%26domain%3D.weibo" +
                ".com%26ua%3Dphp-sso_sdk_client-0.6.14%26_rand%3D1441434306.495&pcid=" + pcid + "&door=" + code + "&vsnf=1&su=" + su + "&service=miniblog&servertime=" + servertime + "&nonce=" + nonce
                + "&pwencode=rsa2&rsakv=1330428213&sp=" + sp + "&sr=1366*768&encoding=UTF-8&url=http%3A%2F%2Fweibo.com%2Fajaxlogin.php%3Fframelogin%3D1%26callback%3Dparent.sinaSSOController.feedBackUrlCallBack&returntype=META";
    
        Connection.Response execute1 = Jsoup.connect(url).method(Connection.Method.POST).requestBody(post).cookies(photocookie).ignoreContentType(true).execute().charset("GBK");
        String body1 = execute1.body();
        Map<String, String> cookies = execute1.cookies();
        System.out.println(body1);
        System.out.println(body1.indexOf("正在登錄") != -1 ? "登錄成功" : "登錄失敗");
    
        url = StringUtils.substringBetween(body1, "location.replace('", "'");
    
    
  7. 帶著上次返回的cookie,get請(qǐng)求(禁止重定向)獲取最終的cookie
        Connection.Response execute2 = Jsoup.connect(url).cookies(cookies).followRedirects(false).ignoreContentType(true).execute();
        Map<String, String> cookies1 = execute2.cookies();
        //從返回協(xié)議頭中獲取location孵延,重定向地址吕漂,一般是固定
        Map<String, String> headers = execute2.headers();
    

結(jié)束

獲取到cookie,基本之后的操作都可以尘应,那就簡單的發(fā)條微博惶凝,發(fā)微博其實(shí)只帶post數(shù)據(jù)和cookie就能提交吼虎,協(xié)議頭完全可以不帶,偏偏jsoup默認(rèn)帶個(gè)UA苍鲜,結(jié)果要多帶個(gè)refrere頭才可以思灰。

  1. 通過步驟7,獲取的重定向地址混滔,get請(qǐng)求獲取refrere參數(shù)uniqueid
      url = "http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack&sudaref=login.sina.com.cn";
      String body2 = Jsoup.connect(url).cookies(cookies1).ignoreContentType(true).execute().body();
      String uid = StringUtils.substringBetween(body2, "uniqueid\":\"", "\",\"userid");
      String referer = "https://weibo.com/u/" + uid + "/home";
    
  2. 帶著cookie洒疚,及協(xié)議頭referer,post請(qǐng)求坯屿,發(fā)一條微博吧
      url = "https://weibo.com/aj/mblog/add?ajwvr=6&__rnd=" + getTimestamp();
      post = "location=v6_content_home&appkey=&style_type=1&pic_id=&text=" + text + "&pdetail=&rank=0&rankid=&module=stissue&pub_source=main_&pub_type=dialog&_t=0";
    
      Connection.Response execute3 = Jsoup.connect(url).method(Connection.Method.POST).requestBody(post).cookies(cookies1).referrer(referer).ignoreContentType(true).execute().charset("GBK");
      System.out.println(execute3.body());
    
Success
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末油湖,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子领跛,更是在濱河造成了極大的恐慌乏德,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,884評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吠昭,死亡現(xiàn)場離奇詭異喊括,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)矢棚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門瘾晃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人幻妓,你說我怎么就攤上這事蹦误。” “怎么了肉津?”我有些...
    開封第一講書人閱讀 157,435評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵强胰,是天一觀的道長。 經(jīng)常有香客問我妹沙,道長偶洋,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,509評(píng)論 1 284
  • 正文 為了忘掉前任距糖,我火速辦了婚禮玄窝,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘悍引。我一直安慰自己恩脂,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,611評(píng)論 6 386
  • 文/花漫 我一把揭開白布趣斤。 她就那樣靜靜地躺著俩块,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上玉凯,一...
    開封第一講書人閱讀 49,837評(píng)論 1 290
  • 那天势腮,我揣著相機(jī)與錄音,去河邊找鬼漫仆。 笑死捎拯,一個(gè)胖子當(dāng)著我的面吹牛么抗,可吹牛的內(nèi)容都是我干的招拙。 我是一名探鬼主播,決...
    沈念sama閱讀 38,987評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼仪媒,長吁一口氣:“原來是場噩夢啊……” “哼狸眼!你這毒婦竟也來了藤树?” 一聲冷哼從身側(cè)響起浴滴,我...
    開封第一講書人閱讀 37,730評(píng)論 0 267
  • 序言:老撾萬榮一對(duì)情侶失蹤拓萌,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后升略,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體微王,經(jīng)...
    沈念sama閱讀 44,194評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,525評(píng)論 2 327
  • 正文 我和宋清朗相戀三年品嚣,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了炕倘。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,664評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡翰撑,死狀恐怖罩旋,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情眶诈,我是刑警寧澤涨醋,帶...
    沈念sama閱讀 34,334評(píng)論 4 330
  • 正文 年R本政府宣布,位于F島的核電站逝撬,受9級(jí)特大地震影響浴骂,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜宪潮,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,944評(píng)論 3 313
  • 文/蒙蒙 一溯警、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧狡相,春花似錦梯轻、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春蟀悦,著一層夾襖步出監(jiān)牢的瞬間媚朦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評(píng)論 1 266
  • 我被黑心中介騙來泰國打工日戈, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留询张,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,389評(píng)論 2 360
  • 正文 我出身青樓浙炼,卻偏偏與公主長得像份氧,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子弯屈,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,554評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理蜗帜,服務(wù)發(fā)現(xiàn),斷路器资厉,智...
    卡卡羅2017閱讀 134,633評(píng)論 18 139
  • 轉(zhuǎn)載厅缺,覺得這篇寫 SQLAlchemy Core,寫得非常不錯(cuò)宴偿。不過后續(xù)他沒寫SQLAlchemy ORM... ...
    非夢nj閱讀 5,379評(píng)論 1 14
  • 一湘捎、概念(載錄于:http://www.cnblogs.com/EricaMIN1987_IT/p/3837436...
    yuantao123434閱讀 8,337評(píng)論 6 152
  • Http協(xié)議詳解 標(biāo)簽(空格分隔): Linux 聲明:本片文章非原創(chuàng),內(nèi)容來源于博客園作者M(jìn)IN飛翔的HTTP協(xié)...
    Sivin閱讀 5,210評(píng)論 3 82
  • 寫一封情書 有生以來的第一封情書 在上面勾畫一只小海貝 托著比它重萬倍的重物 說去追逐它的愛戀 天空飄來一朵云 儼...
    海心沉思之花閱讀 197評(píng)論 0 0