一花履、什么是cURL
????????1. cURL (Client URL Library Functions) 由Daniel Stenberg 創(chuàng)建
2. 官方定義 : curl is a command line tool for transferring data with URL syntax?釋義:使用URL語法傳輸數(shù)據(jù)的命令行工具
3. 籠統(tǒng)總結(jié) : curl是客戶端向服務(wù)器請(qǐng)求資源的工具
二、cURL的使用場(chǎng)景
1. 網(wǎng)頁資源????????????????????????????(編寫爬蟲 新聞轮听、購物等... ...)
2. WebService 數(shù)據(jù)接口資源? ? (接口數(shù)據(jù) 天氣、號(hào)碼歸屬地... ...)
3. FTP 服務(wù)器里面的文件資源? ?(文件下載)
4. 其他資源???????????????????????????(所有網(wǎng)絡(luò)上的資源都可以用curl去訪問和下載到---強(qiáng)大之處)
三、在PHP中使用cURL
????? ? 1. 確認(rèn)PHP支持cURL
?-Windows 確認(rèn)方式:win+R 》cmd 》 php -i/m 》顯示出所有PHP的設(shè)置 》在cmd中右鍵鼠標(biāo)‘編輯-查找’ cURL 》如果查找到(cURL support)說明支持
注 php -i 出錯(cuò)可能是環(huán)境變量導(dǎo)致 自行腦補(bǔ) 不再敘述
?-Linux 確認(rèn)方式:?xshell連接Linux,命令行輸入 ‘php -i | grep cURL’宙帝。 如果看到cURL support=enabled 和 cURL Information 版本信息 說明支持
????????????????? ? ?-通用方式:phpinfo() 查看 curl
???????????????????-如果不支持:百度PHP Windows/Linux cURL 方法解決
2.cURL操作步驟解析
????????????????客戶端: 初始化curl? ? ->? ? 向服務(wù)器發(fā)送請(qǐng)求? ? ->? ? 接收服務(wù)器數(shù)據(jù)? ? ->? ? 關(guān)閉curl
?? ? curl_init()????????????? ? ? ? ? ? ? ? ?發(fā)送和接收之間是靠curl_exec()執(zhí)行????????????? ? ? ? ? ?curl_close()
三、cURL實(shí)戰(zhàn)?
????1.用cURL做一個(gè)簡(jiǎn)單的網(wǎng)頁爬蟲
????????????? ? 代碼:
$curl=curl_init("http://www.baidu.com"); ????????????????# 初始化
curl_exec($curl); # 執(zhí)行
curl_close($curl); # 關(guān)閉curl
?????????????????????????????>
????????????? ? 新需求:用cURL抓取網(wǎng)頁信息并替換部分內(nèi)容(將百度 替換為 ‘阿里巴巴’)
$curlobj = curl_init(); #初始化
curl_setopt($curlobj, CURLOPT_URL, "http://www.baidu.com"); #設(shè)置訪問網(wǎng)頁的URL地址
curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); #執(zhí)行之后不用直接打印出來
$output = curl_exec($curlobj); # 執(zhí)行
curl_close($curlobj); # 關(guān)閉 curl
// echo str_replace("百度", "阿里巴巴", $output); #替換
// echo str_replace("新聞", "阿里巴巴", $output); #替換
echo str_replace("地圖", "阿里巴巴", $output); #替換
????2.用cURL獲取天氣信息
$data = "theCityName=蘭州"; # 多個(gè)地址用 & 符號(hào)即可
$curlobj =curl_init();
curl_setopt($curlobj, CURLOPT_URL, "http://www.webxml.com.cn/WebServices/WeatherWebService.asmx/getWeatherbyCityName"); # 獲取的路徑
curl_setopt($curlobj, CURLOPT_HEADER, 0);
curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']);? # 解決為將對(duì)象引用設(shè)置到對(duì)象的實(shí)例問題
curl_setopt($curlobj, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'); ? # 解決為將對(duì)象引用設(shè)置到對(duì)象的實(shí)例問題
curl_setopt($curlobj, CURLOPT_POST, 1);
curl_setopt($curlobj, CURLOPT_POSTFIELDS, $data);
curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("application/x-www-form-urlencoded;charset=utf8","Content-length:".strlen($data))); # 設(shè)置編碼格式 長(zhǎng)度
$rtn = curl_exec($curlobj);
if (!curl_errno($curlobj)) {
echo $rtn;
} else {
echo 'Curl 錯(cuò)誤:'.curl_error($curlobj);
}
curl_close($curlobj);
????3.用cURL操作 ftp 服務(wù)器中的數(shù)據(jù)
loding...
????4.用cURL訪問 https 資源
?/**
* 代碼實(shí)例 -PHP-cURL實(shí)戰(zhàn)
* 實(shí)例描述:下載網(wǎng)絡(luò)上面的一個(gè)HTTPS的資源
*? ?????注意?
*/
$curlobj = curl_init();
curl_setopt($curlobj, CURLOPT_URL, "https://ajax.aspnetcdn.com/ajax/jquery.validate/1.12.0/jquery.validate.js"); # 設(shè)置訪問的頁面
curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); #執(zhí)行之后不打印出來
date_default_timezone_set('PRC'); # 使用Cookie時(shí)募闲,必須先設(shè)時(shí)區(qū)
curl_setopt($curlobj, CURLOPT_SSL_VERIFYPEER, 0); # 終止服務(wù)器端進(jìn)行驗(yàn)證
$output = curl_exec($curlobj);
curl_close($curlobj);
echo $output;
????5.用cURL模擬登錄后獲取數(shù)據(jù)
/**
* 代碼實(shí)例 -PHP-cURL實(shí)戰(zhàn)
* 實(shí)例描述:用cURL登錄網(wǎng)站并且下載個(gè)人空間內(nèi)容? ? (以慕課網(wǎng)為例)
*? 注意
*/
$data = 'username=此處填寫對(duì)應(yīng)網(wǎng)站能夠登錄的用戶名&password=登錄密碼&remember=1';
$curlobj = curl_init(); # 初始化
curl_setopt($curlobj, CURLOPT_URL, "https://m.imooc.com/account/login");# 設(shè)置訪問網(wǎng)頁的URL
curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); # 執(zhí)行之后不直接打印出來
// Cookie 相關(guān)設(shè)置步脓,這部分設(shè)置需要在所有的會(huì)話開始之前就設(shè)置
date_default_timezone_set('PRC'); # 使用cookie時(shí) 必須先設(shè)置時(shí)區(qū)
curl_setopt($curlobj, CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($curlobj, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($curlobj, CURLOPT_COOKIESESSION, true);
curl_setopt($curlobj, CURLOPT_COOKIEFILE, "cookiefile");
curl_setopt($curlobj, CURLOPT_COOKIEJAR, "cookiefile");
curl_setopt($curlobj, CURLOPT_COOKIE, session_name() . '=' . session_id());
curl_setopt($curlobj, CURLOPT_HEADER, 0);
curl_setopt($curlobj, CURLOPT_FOLLOWLOCATION, 1); #能夠讓cURL支持餓頁面鏈接跳轉(zhuǎn)
curl_setopt($curlobj, CURLOPT_POST, 1);
curl_setopt($curlobj, CURLOPT_POSTFIELDS, $data);
curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("application/x-www-form-urlencoded; charset=utf-8","Content-length: ".strlen($data)));
curl_exec($curlobj); # 執(zhí)行
curl_setopt($curlobj, CURLOPT_URL, "https://www.imooc.com/u/1893790");
curl_setopt($curlobj, CURLOPT_POST, 0);
curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("Content-type:text/xml"));
$output=curl_exec($curlobj);
curl_close($curlobj);
echo $output;