錯誤1:foreach循環(huán)后留下懸掛指針
在foreach循環(huán)中,如果我們需要更改迭代的元素或是為了提高效率可款,運(yùn)用引用是一個好辦法: $arr = array(1,2,3,4);
foreach($arr as&$value){? ? $value = $value *2; } // $arr is now
array(2, 4, 6, 8) 這里有個問題很多人會迷糊讹蘑。
錯誤1:foreach循環(huán)后留下懸掛指針
在foreach循環(huán)中,如果我們需要更改迭代的元素或是為了提高效率筑舅,運(yùn)用引用是一個好辦法:
$arr=array(1,2,3,4);
foreach($arras&$value){
$value=$value*2;
}
// $arr is now array(2, 4, 6, 8)
這里有個問題很多人會迷糊。循環(huán)結(jié)束后陨舱,$value并未銷毀翠拣,$value其實(shí)是數(shù)組中最后一個元素的引用,這樣在后續(xù)對$value的使用中游盲,如果不知道這一點(diǎn)误墓,會引發(fā)一些莫名奇妙的錯誤:)看看下面這段代碼:
$array=[1,2,3];
echoimplode(',',$array),"\n";
foreach($arrayas&$value){}// by reference
echoimplode(',',$array),"\n";
foreach($arrayas$value){}// by value (i.e., copy)
echoimplode(',',$array),"\n";
上面代碼的運(yùn)行結(jié)果如下:
1,2,3
1,2,3
1,2,2
你猜對了嗎?為什么是這個結(jié)果呢益缎?
我們來分析下谜慌。第一個循環(huán)過后,$value是數(shù)組中最后一個元素的引用莺奔。第二個循環(huán)開始:
第一步:復(fù)制$arr[0]到$value(注意此時$value是$arr[2]的引用)欣范,這時數(shù)組變成[1,2,1]
第二步:復(fù)制$arr[1]到$value,這時數(shù)組變成[1,2,2]
第三步:復(fù)制$arr[2]到$value,這時數(shù)組變成[1,2,2]
綜上恼琼,最終結(jié)果就是1,2,2
避免這種錯誤最好的辦法就是在循環(huán)后立即用unset函數(shù)銷毀變量:
$arr=array(1,2,3,4);
foreach($arras&$value){
$value=$value*2;
}
unset($value);// $value no longer references $arr[3]
錯誤2:對isset()函數(shù)行為的錯誤理解
對于isset()函數(shù)妨蛹,變量不存在時會返回false,變量值為null時也會返回false晴竞。這種行為很容易把人弄迷糊蛙卤。。噩死〔眩看下面的代碼:
$data=fetchRecordFromStorage($storage,$identifier);
if(!isset($data['keyShouldBeSet']){
// do something here if 'keyShouldBeSet' is not set
}
寫這段代碼的人本意可能是如果$data[‘keyShouldBeSet’]未設(shè)置,則執(zhí)行對應(yīng)邏輯已维。但問題在于即使$data[‘keyShouldBeSet’]已設(shè)置行嗤,但設(shè)置的值為null,還是會執(zhí)行對應(yīng)的邏輯衣摩,這就不符合代碼的本意了昂验。
下面是另外一個例子:
if($_POST['active']){
$postData=extractSomething($_POST);
}
// ...
if(!isset($postData)){
echo'post not active';
}
上
面的代碼假設(shè)$_POST[‘a(chǎn)ctive’]為真,那么$postData應(yīng)該被設(shè)置艾扮,因此isset($postData)會返回true既琴。反之,上
面代碼假設(shè)isset($postData)返回false的唯一途徑就是$_POST[‘a(chǎn)ctive’]也返回false泡嘴。
真是這樣嗎甫恩?當(dāng)然不是!
即使$_POST[‘a(chǎn)ctive’]返回true酌予,$postData也有可能被設(shè)置為null磺箕,這時isset($postData)就會返回false。這就不符合代碼的本意了抛虫。
如果上面代碼的本意僅是檢測$_POST[‘a(chǎn)ctive’]是否為真松靡,下面這樣實(shí)現(xiàn)會更好:
if($_POST['active']){
$postData=extractSomething($_POST);
}
// ...
if($_POST['active']){
echo'post not active';
}
判斷一個變量是否真正被設(shè)置(區(qū)分未設(shè)置和設(shè)置值為null),array_key_exists()函數(shù)或許更好建椰。重構(gòu)上面的第一個例子雕欺,如下:
$data=fetchRecordFromStorage($storage,$identifier);
if(!array_key_exists('keyShouldBeSet',$data)){
// do this if 'keyShouldBeSet' isn't set
}
另外,結(jié)合get_defined_vars()函數(shù)棉姐,我們可以更加可靠的檢測變量在當(dāng)前作用域內(nèi)是否被設(shè)置:
if(array_key_exists('varShouldBeSet',get_defined_vars())){
// variable $varShouldBeSet exists in current scope
}
錯誤3:混淆返回值和返回引用
考慮下面的代碼:
classConfig
{
private$values=[];
publicfunction getValues(){
return$this->values;
}
}
$config=newConfig();
$config->getValues()['test']='test';
echo$config->getValues()['test'];
運(yùn)行上面的代碼屠列,將會輸出下面的內(nèi)容:
PHPNotice:Undefinedindex:testin/path/to/my/script.php on line21
問題出在哪呢?問題就在于上面的代碼混淆了返回值和返回引用伞矩。在PHP中笛洛,除非你顯示的指定返回引用,否則對于數(shù)組PHP是值返回乃坤,也就是數(shù)組的拷貝苛让。因此上面代碼對返回數(shù)組賦值沟蔑,實(shí)際是對拷貝數(shù)組進(jìn)行賦值,非原數(shù)組賦值蝌诡。
// getValues() returns a COPY of the $values array, so this adds a 'test' element
// to a COPY of the $values array, but not to the $values array itself.
$config->getValues()['test']='test';
// getValues() again returns ANOTHER COPY of the $values array, and THIS copy doesn't
// contain a 'test' element (which is why we get the "undefined index" message).
echo$config->getValues()['test'];
下面是一種可能的解決辦法溉贿,輸出拷貝的數(shù)組,而不是原數(shù)組:
$vals=$config->getValues();
$vals['test']='test';
echo$vals['test'];
如果你就是想要改變原數(shù)組浦旱,也就是要反回數(shù)組引用宇色,那應(yīng)該如何處理呢?辦法就是顯示指定返回引用即可:
classConfig
{
private$values=[];
// return a REFERENCE to the actual $values array
publicfunction&getValues(){
return$this->values;
}
}
$config=newConfig();
$config->getValues()['test']='test';
echo$config->getValues()['test'];
經(jīng)過改造后颁湖,上面代碼將會像你期望那樣會輸出test宣蠕。
我們再來看一個例子會讓你更迷糊的例子:
classConfig
{
private$values;
// using ArrayObject rather than array
publicfunction __construct(){
$this->values=newArrayObject();
}
publicfunction getValues(){
return$this->values;
}
}
$config=newConfig();
$config->getValues()['test']='test';
echo$config->getValues()['test'];
如果你想的是會和上面一樣輸出“ Undefined index”錯誤,那你就錯了甥捺。代碼會正常輸出“test”抢蚀。原因在于PHP對于對象默認(rèn)就是按引用返回的,而不是按值返回镰禾。
綜上所述皿曲,我們在使用函數(shù)返回值時,要弄清楚是值返回還是引用返回吴侦。PHP中對于對象屋休,默認(rèn)是引用返回,數(shù)組和內(nèi)置基本類型默認(rèn)均按值返回备韧。這個要與其它語言區(qū)別開來(很多語言對于數(shù)組是引用傳遞)劫樟。
像其它語言,比如Java或C#织堂,利用getter或setter來訪問或設(shè)置類屬性是一種更好的方案叠艳,當(dāng)然PHP默認(rèn)不支持,需要自己實(shí)現(xiàn):
classConfig
{
private$values=[];
publicfunction setValue($key,$value){
$this->values[$key]=$value;
}
publicfunction getValue($key){
return$this->values[$key];
}
}
$config=newConfig();
$config->setValue('testKey','testValue');
echo$config->getValue('testKey');// echos 'testValue'
上面的代碼給調(diào)用者可以訪問或設(shè)置數(shù)組中的任意值而不用給與數(shù)組public訪問權(quán)限易阳。感覺怎么樣:)
錯誤4:在循環(huán)中執(zhí)行sql查詢
在PHP編程中發(fā)現(xiàn)類似下面的代碼并不少見:
$models=[];
foreach($inputValuesas$inputValue){
$models[]=$valueRepository->findByValue($inputValue);
}
當(dāng)然上面的代碼是沒有什么錯誤的附较。問題在于我們在迭代過程中$valueRepository->findByValue()可能每次都執(zhí)行了sql查詢:
$result=$connection->query("SELECT `x`,`y` FROM `values` WHERE `value`=".$inputValue);
如果迭代了10000次,那么你就分別執(zhí)行了10000次sql查詢潦俺。如果這樣的腳本在多線程程序中被調(diào)用翅睛,那很可能你的系統(tǒng)就掛了。黑竞。。
在編寫代碼過程中疏旨,你應(yīng)該要清楚什么時候應(yīng)該執(zhí)行sql查詢很魂,盡可能一次sql查詢?nèi)〕鏊袛?shù)據(jù)。
有一種業(yè)務(wù)場景檐涝,你很可能會犯上述錯誤遏匆。假設(shè)一個表單提交了一系列值(假設(shè)為IDs)法挨,然后為了取出所有ID對應(yīng)的數(shù)據(jù),代碼將遍歷IDs幅聘,分別對每個ID執(zhí)行sql查詢凡纳,代碼如下所示:
$data=[];
foreach($idsas$id){
$result=$connection->query("SELECT `x`, `y` FROM `values` WHERE `id` = ".$id);
$data[]=$result->fetch_row();
}
但同樣的目的可以在一個sql中更加高效的完成,代碼如下:
$data=[];
if(count($ids)){
$result=$connection->query("SELECT `x`, `y` FROM `values` WHERE `id` IN (".implode(',',$ids));
while($row=$result->fetch_row()){
$data[]=$row;
}
}
錯誤5:內(nèi)存使用低效和錯覺
一次sql查詢獲取多條記錄比每次查詢獲取一條記錄效率肯定要高帝蒿,但如果你使用的是php中的MySQL擴(kuò)展荐糜,那么一次獲取多條記錄就很可能會導(dǎo)致內(nèi)存溢出。
我們可以寫代碼來實(shí)驗(yàn)下(測試環(huán)境: 512MB RAM葛超、MySQL暴氏、php-cli):
// connect to mysql
$connection=newmysqli('localhost','username','password','database');
// create table of 400 columns
$query='CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT';
for($col=0;$col<400;$col++){
$query.=", `col$col` CHAR(10) NOT NULL";
}
$query.=');';
$connection->query($query);
// write 2 million rows
for($row=0;$row<2000000;$row++){
$query="INSERT INTO `test` VALUES ($row";
for($col=0;$col<400;$col++){
$query.=', '.mt_rand(1000000000,9999999999);
}
$query.=')';
$connection->query($query);
}
現(xiàn)在來看看資源消耗:
// connect to mysql
$connection=newmysqli('localhost','username','password','database');
echo"Before: ".memory_get_peak_usage()."\n";
$res=$connection->query('SELECT `x`,`y` FROM `test` LIMIT 1');
echo"Limit 1: ".memory_get_peak_usage()."\n";
$res=$connection->query('SELECT `x`,`y` FROM `test` LIMIT 10000');
echo"Limit 10000: ".memory_get_peak_usage()."\n";
輸出結(jié)果如下:
Before:224704
Limit1:224704
Limit10000:224704
根據(jù)內(nèi)存使用量來看,貌似一切正常绣张。為了更加確定答渔,試著一次獲取100000條記錄,結(jié)果程序得到如下輸出:
PHPWarning:mysqli::query():(HY000/2013):
Lostconnection toMySQLserver during queryin/root/test.php on line11
這是怎么回事呢侥涵?
問
題出在php的mysql模塊的工作方式沼撕,mysql模塊實(shí)際上就是libmysqlclient的一個代理。在查詢獲取多條記錄的同時芜飘,這些記錄會直接
保存在內(nèi)存中务豺。由于這塊內(nèi)存不屬于php的內(nèi)存模塊所管理,所以我們調(diào)用memory_get_peak_usage()函數(shù)所獲得的值并非真實(shí)使用內(nèi)存
值燃箭,于是便出現(xiàn)了上面的問題冲呢。
我們可以使用mysqlnd來代替mysql,mysqlnd編譯為php自身擴(kuò)展招狸,其內(nèi)存使用由php內(nèi)存管理模塊所控制敬拓。如果我們用mysqlnd來實(shí)現(xiàn)上面的代碼,則會更加真實(shí)的反應(yīng)內(nèi)存使用情況:
Before:232048
Limit1:324952
Limit10000:32572912
更加糟糕的是裙戏,根據(jù)php的官方文檔乘凸,mysql擴(kuò)展存儲查詢數(shù)據(jù)使用的內(nèi)存是mysqlnd的兩倍,因此原來的代碼使用的內(nèi)存是上面顯示的兩倍左右累榜。
為了避免此類問題营勤,可以考慮分幾次完成查詢,減小單次查詢數(shù)據(jù)量:
$totalNumberToFetch=10000;
$portionSize=100;
for($i=0;$i<=ceil($totalNumberToFetch/$portionSize);$i++){
$limitFrom=$portionSize*$i;
$res=$connection->query(
"SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize");
}
聯(lián)系上面提到的錯誤4可以看出壹罚,在實(shí)際的編碼過程中葛作,要做到一種平衡,才能既滿足功能要求猖凛,又能保證性能赂蠢。
錯誤6:忽略Unicode/UTF-8問題
php編程中,在處理非ascii字符時辨泳,會遇到一些問題虱岂,要很小心的去對待玖院,要不然就會錯誤遍地。舉個簡單的例子第岖,strlen($name)难菌,如果$name包含非ascii字符,那結(jié)果就有些出乎意料蔑滓。在此給出一些建議郊酒,盡量避免此類問題:
如果你對unicode和utf-8不是很了解,那么你至少應(yīng)該了解一些基礎(chǔ)烫饼。推薦閱讀這篇文章猎塞。
最好使用mb_*函數(shù)來處理字符串,避免使用老的字符串處理函數(shù)杠纵。這里要確保PHP的“multibyte”擴(kuò)展已開啟荠耽。
數(shù)據(jù)庫和表最好使用unicode編碼。
知道jason_code()函數(shù)會轉(zhuǎn)換非ascii字符比藻,但serialize()函數(shù)不會铝量。
php代碼源文件最好使用不含bom的utf-8格式。
在此推薦一篇文章银亲,更詳細(xì)的介紹了此類問題:UTF-8 Primer for PHP and MySQL
錯誤7:假定$_POST總是包含POST數(shù)據(jù)
PHP中的$_POST并非總是包含表單POST提交過來的數(shù)據(jù)慢叨。假設(shè)我們通過jQuery.ajax() 方法向服務(wù)器發(fā)送了POST請求:
// js
$.ajax({
url:'http://my.site/some/path',
method:'post',
data:JSON.stringify({a:'a',b:'b'}),
contentType:'application/json'
});
注意代碼中的 contentType: ‘a(chǎn)pplication/json’ ,我們是以json數(shù)據(jù)格式來發(fā)送的數(shù)據(jù)务蝠。在服務(wù)端拍谐,我們僅輸出$_POST數(shù)組:
// php
var_dump($_POST);
你會很驚奇的發(fā)現(xiàn),結(jié)果是下面所示:
array(0){}
為什么是這樣的結(jié)果呢馏段?我們的json數(shù)據(jù) {a: ‘a(chǎn)’, b: ‘b’} 哪去了呢轩拨?
答案就是PHP僅僅解析Content-Type為 application/x-www-form-urlencoded 或 multipart/form-data的Http請求。之所以這樣是因?yàn)闅v史原因院喜,PHP最初實(shí)現(xiàn)$_POST時亡蓉,最流行的就是上面兩種類型。因此雖說現(xiàn)在有些類型(比如application/json)很流行喷舀,但PHP中還是沒有去實(shí)現(xiàn)自動處理砍濒。
因?yàn)?_POST是全局變量,所以更改$_POST會全局有效硫麻。因此對于Content-Type為 application/json的請求爸邢,我們需要手工去解析json數(shù)據(jù),然后修改$_POST變量拿愧。
// php
$_POST=json_decode(file_get_contents('php://input'),true);
此時杠河,我們再去輸出$_POST變量,則會得到我們期望的輸出:
array(2){["a"]=>string(1)"a"["b"]=>string(1)"b"}
錯誤8:認(rèn)為PHP支持字符數(shù)據(jù)類型
看看下面的代碼,猜測下會輸出什么:
for($c='a';$c<='z';$c++){
echo$c."\n";
}
如果你的回答是輸出’a’到’z’感猛,那么你會驚奇的發(fā)現(xiàn)你的回答是錯誤的。
不錯奢赂,上面的代碼的確會輸出’a’到’z’陪白,但除此之外,還會輸出’aa’到’yz’膳灶。我們來分析下為什么會是這樣的結(jié)果咱士。
在PHP中不存在char數(shù)據(jù)類型,只有string類型轧钓。明白這點(diǎn)序厉,那么對’z’進(jìn)行遞增操作,結(jié)果則為’aa’毕箍。對于字符串比較大小弛房,學(xué)過C的應(yīng)該都知道,’aa’是小于’z’的而柑。這也就解釋了為何會有上面的輸出結(jié)果文捶。
如果我們想輸出’a’到’z’,下面的實(shí)現(xiàn)是一種不錯的辦法:
for($i=ord('a');$i<=ord('z');$i++){
echochr($i)."\n";
}
或者這樣也是OK的:
$letters=range('a','z');
for($i=0;$i
echo$letters[$i]."\n";
}
錯誤9:忽略編碼標(biāo)準(zhǔn)
雖說忽略編碼標(biāo)準(zhǔn)不會導(dǎo)致錯誤或是bug媒咳,但遵循一定的編碼標(biāo)準(zhǔn)還是很重要的粹排。
沒有統(tǒng)一的編碼標(biāo)準(zhǔn)會使你的項(xiàng)目出現(xiàn)很多問題。最明顯的就是你的項(xiàng)目代碼不具有一致性涩澡。更壞的地方在于顽耳,你的代碼將更加難以調(diào)試、擴(kuò)展和維護(hù)妙同。這也就意味著你的團(tuán)隊(duì)效率會降低射富,包括做一些很多無意義的勞動。
對于PHP開發(fā)者來說渐溶,是比較幸運(yùn)的辉浦。因?yàn)橛蠵HP編碼標(biāo)準(zhǔn)推薦(PSR),由下面5個部分組成:
PSR-0:自動加載標(biāo)準(zhǔn)
PSR-1:基本編碼標(biāo)準(zhǔn)
PSR-2:編碼風(fēng)格指南
PSR-3:日志接口標(biāo)準(zhǔn)
PSR-4:自動加載
PSR最初由PHP社區(qū)的幾個大的團(tuán)體所創(chuàng)建并遵循茎辐。Zend, Drupal, Symfony, Joomla及其它的平臺都為此標(biāo)準(zhǔn)做過貢獻(xiàn)并遵循這個標(biāo)準(zhǔn)宪郊。即使是PEAR,早些年也想讓自己成為一個標(biāo)準(zhǔn)拖陆,但現(xiàn)在也加入了PSR陣營弛槐。
在
某些情況下,使用什么編碼標(biāo)準(zhǔn)是無關(guān)緊要的依啰,只要你使用一種編碼風(fēng)格并一直堅持使用即可乎串。但是遵循PSR標(biāo)準(zhǔn)不失為一個好辦法,除非你有什么特殊的原因要
自己弄一套∷倬現(xiàn)在越來越多的項(xiàng)目都開始使用PSR叹誉,大部分的PHP開發(fā)者也在使用PSR鸯两,因此使用PSR會讓新加入你團(tuán)隊(duì)的成員更快的熟悉項(xiàng)目,寫代碼時
也會更加舒適长豁。
錯誤10:錯誤使用empty()函數(shù)
一些PHP開發(fā)人員喜歡用empty()函數(shù)去對變量或表達(dá)式做布爾判斷钧唐,但在某些情況下會讓人很困惑。
首先我們來看看PHP中的數(shù)組Array和數(shù)組對象ArrayObject匠襟《巯溃看上去好像沒什么區(qū)別,都是一樣的酸舍。真的這樣嗎帅韧?
// PHP 5.0 or later:
$array=[];
var_dump(empty($array));// outputs bool(true)
$array=newArrayObject();
var_dump(empty($array));// outputs bool(false)
// why don't these both produce the same output?
讓事情變得更復(fù)雜些,看看下面的代碼:
// Prior to PHP 5.0:
$array=[];
var_dump(empty($array));// outputs bool(false)
$array=newArrayObject();
var_dump(empty($array));// outputs bool(false)
很不幸的是啃勉,上面這種方法很受歡迎忽舟。例如,在Zend
Framework 2中璧亮,Zend\Db\TableGateway 在 TableGateway::select() 結(jié)果集上調(diào)用
current() 方法返回數(shù)據(jù)集時就是這么干的萧诫。開發(fā)人員很容易就會踩到這個坑。
為了避免這些問題枝嘶,檢查一個數(shù)組是否為空最后的辦法是用 count() 函數(shù):
// Note that this work in ALL versions of PHP (both pre and post 5.0):
$array=[];
var_dump(count($array));// outputs int(0)
$array=newArrayObject();
var_dump(count($array));// outputs int(0)
在這順便提一下帘饶,因?yàn)镻HP中會將數(shù)值0認(rèn)為是布爾值false,因此 count() 函數(shù)可以直接用在 if 條件語句的條件判斷中來判斷數(shù)組是否為空群扶。另外及刻,count() 函數(shù)對于數(shù)組來說復(fù)雜度為O(1),因此用 count() 函數(shù)是一個明智的選擇竞阐。
再來看一個用 empty() 函數(shù)很危險的例子缴饭。當(dāng)在魔術(shù)方法 __get() 中結(jié)合使用 empty() 函數(shù)時,也是很危險的骆莹。我們來定義兩個類颗搂,每個類都有一個 test 屬性。
首先我們定義 Regular 類幕垦,有一個 test 屬性:
classRegular
{
public$test='value';
}
然后我們定義 Magic 類丢氢,并用 __get() 魔術(shù)方法來訪問它的 test 屬性:
classMagic
{
private$values=['test'=>'value'];
publicfunction __get($key)
{
if(isset($this->values[$key])){
return$this->values[$key];
}
}
}
好了。我們現(xiàn)在來看看訪問各個類的 test 屬性會發(fā)生什么:
$regular=newRegular();
var_dump($regular->test);// outputs string(4) "value"
$magic=newMagic();
var_dump($magic->test);// outputs string(4) "value"
到目前為止先改,都還是正常的疚察,沒有讓我們感到迷糊。
但在 test 屬性上使用 empty() 函數(shù)會怎么樣呢仇奶?
var_dump(empty($regular->test));// outputs bool(false)
var_dump(empty($magic->test));// outputs bool(true)
結(jié)果是不是很意外貌嫡?
很不幸的是,如果一個類使用魔法 __get() 函數(shù)來訪問類屬性的值,沒有簡單的方法來檢查屬性值是否為空或是不存在岛抄。在類作用域外别惦,你只能檢查是否返回 null 值,但這并不一定意味著沒有設(shè)置相應(yīng)的鍵夫椭,因?yàn)殒I值可以被設(shè)置為 null 步咪。
相比之下,如果我們訪問 Regular 類的一個不存在的屬性益楼,則會得到一個類似下面的Notice消息:
Notice:Undefinedproperty:Regular::$nonExistantTestin/path/to/test.php on line10
CallStack:
0.00122347041.{main}()/path/to/test.php:0
因此,對于 empty() 函數(shù)点晴,我們要小心的使用感凤,要不然的話就會結(jié)果出乎意料,甚至潛在的誤導(dǎo)你粒督。
更多PHP相關(guān)技術(shù)請搜索千鋒PHP陪竿,做真實(shí)的自己,用良心做教育屠橄。
互聯(lián)網(wǎng)+時代族跛,時刻要保持學(xué)習(xí),攜手千鋒PHP,Dream It Possible锐墙。