MySQL批量更新
mysql更新語句很簡單,更新一條數(shù)據(jù)的某個字段,一般這樣寫:
復(fù)制代碼代碼如下:
UPDATE mytable SET myfield = 'value' WHERE other_field = 'other_value';
如果更新同一字段為同一個值,mysql也很簡單,修改下where即可:
復(fù)制代碼代碼如下:
UPDATE mytable SET myfield = 'value' WHERE other_field in ('other_values');
這里注意 ‘other_values' 是一個逗號(咬像,)分隔的字符串,如:1,2,3
那如果更新多條數(shù)據(jù)為不同的值,可能很多人會這樣寫:
復(fù)制代碼代碼如下:
foreach ($display_order as $id => $ordinal) {
$sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id";
mysql_query($sql);
}
即是循環(huán)一條一條的更新記錄县昂。一條記錄update一次肮柜,這樣性能很差,也很容易造成阻塞倒彰。
那么能不能一條sql語句實現(xiàn)批量更新呢审洞?mysql并沒有提供直接的方法來實現(xiàn)批量更新,但是可以用點小技巧來實現(xiàn)待讳。
復(fù)制代碼代碼如下:
UPDATE mytable
SET myfield = CASE id
WHEN 1 THEN 'value'
WHEN 2 THEN 'value'
WHEN 3 THEN 'value'
END
WHERE id IN (1,2,3)
這里使用了case when 這個小技巧來實現(xiàn)批量更新预明。
舉個例子:
復(fù)制代碼代碼如下:
UPDATE categories
SET display_order = CASE id
WHEN 1 THEN 3
WHEN 2 THEN 4
WHEN 3 THEN 5
END
WHERE id IN (1,2,3)
這句sql的意思是,更新display_order 字段耙箍,如果id=1 則display_order 的值為3,如果id=2 則 display_order 的值為4酥馍,如果id=3 則 display_order 的值為5辩昆。
即是將條件語句寫在了一起。
這里的where部分不影響代碼的執(zhí)行旨袒,但是會提高sql執(zhí)行的效率汁针。確保sql語句僅執(zhí)行需要修改的行數(shù),這里只有3條數(shù)據(jù)進(jìn)行更新砚尽,而where子句確保只有3行數(shù)據(jù)執(zhí)行施无。
如果更新多個值的話,只需要稍加修改:
復(fù)制代碼代碼如下:
UPDATE categories
SET display_order = CASE id
WHEN 1 THEN 3
WHEN 2 THEN 4
WHEN 3 THEN 5
END,
title = CASE id
WHEN 1 THEN 'New Title 1'
WHEN 2 THEN 'New Title 2'
WHEN 3 THEN 'New Title 3'
END
WHERE id IN (1,2,3)
到這里必孤,已經(jīng)完成一條mysql語句更新多條記錄了猾骡。
但是要在業(yè)務(wù)中運用,需要結(jié)合服務(wù)端語言敷搪,這里以PHP為例兴想,構(gòu)造這條mysql語句:
復(fù)制代碼代碼如下:
$display_order = array(
1 => 4,
2 => 1,
3 => 2,
4 => 3,
5 => 9,
6 => 5,
7 => 8,
8 => 9
);
$ids = implode(',', array_keys($display_order));
$sql = "UPDATE categories SET display_order = CASE id ";
foreach ($display_order as $id => $ordinal) {
$sql .= sprintf("WHEN %d THEN %d ", $id, $ordinal);
}
$sql .= "END WHERE id IN ($ids)";
echo $sql;
這個例子,有8條記錄進(jìn)行更新赡勘。代碼也很容易理解嫂便,你學(xué)會了嗎
性能分析
當(dāng)我使用上萬條記錄利用mysql批量更新,發(fā)現(xiàn)使用最原始的批量update發(fā)現(xiàn)性能很差闸与,將網(wǎng)上看到的總結(jié)一下一共有以下三種辦法:
1.批量update毙替,一條記錄update一次,性能很差
復(fù)制代碼代碼如下:
update test_tbl set dr='2' where id=1;
2.replace into 或者insert into ...on duplicate key update
復(fù)制代碼代碼如下:
replace into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y');
或者使用
復(fù)制代碼代碼如下:
insert into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y') on duplicate key update dr=values(dr);
3.創(chuàng)建臨時表践樱,先更新臨時表厂画,然后從臨時表中update
代碼如下 復(fù)制代碼
create temporary table tmp(id int(4) primary key,dr varchar(50));
insert into tmp values (0,'gone'), (1,'xx'),...(m,'yy');
update test_tbl, tmp set test_tbl.dr=tmp.dr where test_tbl.id=tmp.id;
注意:這種方法需要用戶有temporary 表的create 權(quán)限。
下面是上述方法update 100000條數(shù)據(jù)的性能測試結(jié)果:
逐條update
real 0m15.557s
user 0m1.684s
sys 0m1.372s
replace into
real 0m1.394s
user 0m0.060s
sys 0m0.012s
insert into on duplicate key update
real 0m1.474s
user 0m0.052s
sys 0m0.008s
create temporary table and update:
real 0m0.643s
user 0m0.064s
sys 0m0.004s
就測試結(jié)果來看映胁,測試當(dāng)時使用replace into性能較好木羹。
replace into 和insert into on duplicate key update的不同在于:
replace into 操作本質(zhì)是對重復(fù)的記錄先delete 后insert,如果更新的字段不全會將缺失的字段置為缺省值
insert into 則是只update重復(fù)記錄,不會改變其它字段坑填。