class ManyCurl {
//異步加載多個url請求
//用例:
//? ? ? $url_array = array(
//? ? ? ? ? 'http://example.com/sleep.php?time=5',
//? ? ? ? ? 'http://example.com/sleep.php?time=10',
//? ? ? ? ? 'http://example.com/sleep.php?time=7',
//? ? ? ? ? 'http://example.com/sleep.php?time=5',
//? ? ? ? );
//? ??
public function async_get_url($url_array, $wait_usec = 0) {
if (!is_array($url_array))
return false;
$wait_usec = intval($wait_usec);
$data? ? = array();
$handle? = array();
$running = 0;
$mh = curl_multi_init(); // multi curl handler
$i = 0;
foreach($url_array as $url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // 獲取頁面內(nèi)容,不直接輸出到頁面
curl_setopt($ch, CURLOPT_TIMEOUT, 30);//超時時間
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)');//在HTTP請求中包含一個”user-agent”頭的字符串曾沈。
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
curl_setopt($ch, CURLOPT_MAXREDIRS, 7);//以限定遞歸返回的數(shù)量
curl_multi_add_handle($mh, $ch); // 把 curl resource 放進 multi curl handler 裡
//作用是向curl批處理會話中添加單獨的curl句柄資源。curl_multi_add_handle()函數(shù)有兩個參數(shù),第一個參數(shù)表示一個curl批處理句柄資源兴垦,第二個參數(shù)表示一個單獨的curl句柄資源日矫。
$handle[$i++] = $ch;
}
/* 執(zhí)行 */
/* 此種做法會造成 CPU loading 過重 (CPU 100%)
do {
curl_multi_exec($mh, $running);
if ($wait_usec > 0) // 每個 connect 要間隔多久
usleep($wait_usec); // 250000 = 0.25 sec
} while ($running > 0);
*/
/* 此做法就可以避免掉 CPU loading 100% 的問題 */
// 參考自: http://www.hengss.com/xueyuan/sort0362/php/info-36963.html
do {
$mrc = curl_multi_exec($mh, $active);
} while ($mrc == CURLM_CALL_MULTI_PERFORM);//CURLM_CALL_MULTI_PERFORM=-1
while ($active and $mrc == CURLM_OK) {//CURLM_OK=0
if (curl_multi_select($mh) != -1) {
do {
$mrc = curl_multi_exec($mh, $active);
} while ($mrc == CURLM_CALL_MULTI_PERFORM);//CURLM_CALL_MULTI_PERFORM=-1
}
}
/*因為$active要等全部url數(shù)據(jù)接受完畢才變成false茵汰,所以這里用到了curl_multi_exec的返回值判斷是否還有數(shù)據(jù)枢里,當有數(shù)據(jù)的時候就不停調(diào)用、//curl_multi_exec蹂午,暫時沒有數(shù)據(jù)就進入select階段栏豺,新數(shù)據(jù)一來就可以被喚醒繼續(xù)執(zhí)行。這里的好處就是CPU的無謂消耗沒有了画侣。
// curl_multi_exec的返回值是用來返回多線程處裡時的錯誤冰悠,正常來說返回值是0堡妒,也就是說只用$mrc捕捉返回值當成判斷式的迴圈只會運行一次配乱,而真的發(fā)生錯誤時,有拿$mrc判斷的都會變死迴圈皮迟。
// 而curl_multi_select的功能是curl發(fā)送請求後搬泥,在有回應(yīng)前會一直處於等待狀態(tài),所以不需要把它導入空迴圈伏尼,它就像是會自己做判斷&自己決定等待時間的sleep()忿檩。
do {
curl_multi_exec($mh, $running);
curl_multi_select($mh);
} while ($running > 0);
*/
/* 讀取資料 */
foreach($handle as $i => $ch) {
$content? = curl_multi_getcontent($ch);
$data[$i] = (curl_errno($ch) == 0) ? $content : false;
}
/* 移除 handle*/
foreach($handle as $ch) {
curl_multi_remove_handle($mh, $ch);
}
curl_multi_close($mh);
return $data;
}