2019-03-19

namespace TagTools
{
    using System;
    using System.IO;
    using System.Net;
    using System.Text;
    using System.Text.RegularExpressions;

    public class HttpHelper
    {
        private static Stream _reader;
        private static StreamReader _responseReader;
        private static HttpWebResponse _webResponse;

        public static void Dispose()
        {
            if (_reader != null)
            {
                _reader.Close();
            }
            if (_responseReader != null)
            {
                _responseReader.Close();
            }
            if (_webResponse != null)
            {
                _webResponse.Close();
            }
            _reader = null;
            _responseReader = null;
            _webResponse = null;
        }

        public static string DoHttp(string httpStr)
        {
            string str;
            HttpWebRequest request = (HttpWebRequest) WebRequest.Create(httpStr);
            request.Method = "GET";
            request.ServicePoint.Expect100Continue = false;
            request.Timeout = 0x7530;
            using (_webResponse = (HttpWebResponse) request.GetResponse())
            {
                _reader = _webResponse.GetResponseStream();
                if (_reader != null)
                {
                    _responseReader = new StreamReader(_reader, Encoding.UTF8);
                    str = _responseReader.ReadToEnd();
                }
                else
                {
                    str = string.Empty;
                }
            }
            if (!string.IsNullOrEmpty(str))
            {
                return str;
            }
            return "返回新聞為空";
        }

        public static string[] GetHtmlImageUrlList(string sHtmlText)
        {
            MatchCollection matchs = new Regex("<img\\b[^<>]*?\\bsrc[\\s\\t\\r\\n]*=[\\s\\t\\r\\n]*[\"']?[\\s\\t\\r\\n]*(?<imgUrl>[^\\s\\t\\r\\n\"'<>]*)[^<>]*?/?[\\s\\t\\r\\n]*>", RegexOptions.IgnoreCase).Matches(sHtmlText);
            int num = 0;
            string[] strArray = new string[matchs.Count];
            foreach (Match match in matchs)
            {
                strArray[num++] = match.Groups["imgUrl"].Value;
            }
            return strArray;
        }

        public static string GetHtmlTxt(string htmlstring)
        {
            htmlstring = Regex.Replace(htmlstring, "<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "<(.[^>]*)>", "", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "-->", "", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "<!--.*", "", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(quot|#34);", "\"", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(amp|#38);", "&", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(lt|#60);", "<", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(gt|#62);", ">", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(nbsp|#160);", "   ", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(iexcl|#161);", "\x00a1", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(cent|#162);", "\x00a2", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(pound|#163);", "\x00a3", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, "&(copy|#169);", "\x00a9", RegexOptions.IgnoreCase);
            htmlstring = Regex.Replace(htmlstring, @"&#(\d+);", "", RegexOptions.IgnoreCase);
            htmlstring = htmlstring.Replace("<", "");
            htmlstring = htmlstring.Replace(">", "");
            htmlstring = htmlstring.Replace("\r\n", "");
            htmlstring = htmlstring.Replace("ss=\"wzzw\"", "");
            return htmlstring;
        }
    }
}

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末拔疚,一起剝皮案震驚了整個濱河市肥隆,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌稚失,老刑警劉巖栋艳,帶你破解...
    沈念sama閱讀 222,627評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異句各,居然都是意外死亡吸占,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評論 3 399
  • 文/潘曉璐 我一進(jìn)店門凿宾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來矾屯,“玉大人,你說我怎么就攤上這事初厚〖希” “怎么了?”我有些...
    開封第一講書人閱讀 169,346評論 0 362
  • 文/不壞的土叔 我叫張陵产禾,是天一觀的道長排作。 經(jīng)常有香客問我,道長下愈,這世上最難降的妖魔是什么纽绍? 我笑而不...
    開封第一講書人閱讀 60,097評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮势似,結(jié)果婚禮上拌夏,老公的妹妹穿的比我還像新娘僧著。我一直安慰自己,他們只是感情好障簿,可當(dāng)我...
    茶點故事閱讀 69,100評論 6 398
  • 文/花漫 我一把揭開白布盹愚。 她就那樣靜靜地躺著,像睡著了一般站故。 火紅的嫁衣襯著肌膚如雪皆怕。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,696評論 1 312
  • 那天西篓,我揣著相機與錄音愈腾,去河邊找鬼。 笑死岂津,一個胖子當(dāng)著我的面吹牛虱黄,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播吮成,決...
    沈念sama閱讀 41,165評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼橱乱,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了粱甫?” 一聲冷哼從身側(cè)響起泳叠,我...
    開封第一講書人閱讀 40,108評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎茶宵,沒想到半個月后危纫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,646評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡乌庶,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,709評論 3 342
  • 正文 我和宋清朗相戀三年叶摄,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片安拟。...
    茶點故事閱讀 40,861評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡蛤吓,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出糠赦,到底是詐尸還是另有隱情会傲,我是刑警寧澤,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布拙泽,位于F島的核電站淌山,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏顾瞻。R本人自食惡果不足惜泼疑,卻給世界環(huán)境...
    茶點故事閱讀 42,196評論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望荷荤。 院中可真熱鬧退渗,春花似錦移稳、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,698評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至翻翩,卻和暖如春都许,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背嫂冻。 一陣腳步聲響...
    開封第一講書人閱讀 33,804評論 1 274
  • 我被黑心中介騙來泰國打工胶征, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人桨仿。 一個月前我還...
    沈念sama閱讀 49,287評論 3 379
  • 正文 我出身青樓弧烤,卻偏偏與公主長得像,于是被迫代替她去往敵國和親蹬敲。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,860評論 2 361

推薦閱讀更多精彩內(nèi)容

  • 漫漫 -----致R 床頭開始漫延 屬于衣服的沙沙的細(xì)語 像是那晚我們的說出口的 和沒有說出口的 ...
    半余閱讀 208評論 0 0
  • 今天早上乘車返回豐順,路上看了一部電影从铲,車上放的瘪校,戰(zhàn)狼,這部電影其中有一個情節(jié)名段,令我動容阱扬,就是吳京的戰(zhàn)友拿出他閨女...
    麻麻爸爸閱讀 392評論 1 2
  • 不念過往麻惶, 不畏將來。 是個狀態(tài)信夫。 做得到繼續(xù)窃蹋, 做不到倒地。
    lapetite33明天在哪里閱讀 199評論 0 0
  • 你,是幾個群的群主振湾?很多人會是不止一個杀迹。 但,有幾個群你覺得很活躍押搪,甚至從群里變現(xiàn)了树酪?很多人都是0浅碾,甚至是負(fù)(投入...
    哎賣姜閱讀 6,124評論 2 8
  • 日復(fù)一日,我們尋求亞里士多德在《倫理學(xué)》中提出的那一古老問題的答案:一個人應(yīng)該如何度過他的一生嗅回?但及穗,問題的答案總在...
    畫重點閱讀 688評論 0 1