目錄
- 寫在前面
- 步驟
- 寫在最后
一、寫在前面
相信不少開發(fā)者在遇到項目對數(shù)據(jù)進行批量操作的時候送悔,都會有不少的煩惱慢显,尤其是針對數(shù)據(jù)量極大的情況下,效率問題就直接提上了菜板欠啤。
因此荚藻,開多線程來執(zhí)行批量任務(wù)是十分重要的一種批量操作思路,其實這種思路實現(xiàn)起來也十分簡單洁段,就拿批量更新的操作舉例应狱。
整體流程圖如下:
二、步驟
- 獲取需要進行批量更新的大集合 A祠丝,對大集合進行拆分操作疾呻,分成 N 個小集合 A-1 ~ A-N 。
- 開啟線程池写半,針對集合的大小進行調(diào)參岸蜗,對小集合進行批量更新操作。
- 對流程進行控制叠蝇,控制線程執(zhí)行順序璃岳。
按照指定大小拆分集合的工具類:
import com.google.common.collect.Lists;
import org.apache.commons.collections.CollectionUtils;
import java.util.List;
/**
* 拆分結(jié)合工具類
*
* @author shiwen
* @date 2020/12/27
*/
public class SplitListUtils {
/**
* 拆分集合
*
* @param <T> 泛型對象
* @param resList 需要拆分的集合
* @param subListLength 每個子集合的元素個數(shù)
* @return 返回拆分后的各個集合組成的列表
* 代碼里面用到了guava和common的結(jié)合工具類
**/
public static <T> List<List<T>> split(List<T> resList, int subListLength) {
if (CollectionUtils.isEmpty(resList) || subListLength <= 0) {
return Lists.newArrayList();
}
List<List<T>> ret = Lists.newArrayList();
int size = resList.size();
if (size <= subListLength) {
// 數(shù)據(jù)量不足 subListLength 指定的大小
ret.add(resList);
} else {
int pre = size / subListLength;
int last = size % subListLength;
// 前面pre個集合,每個大小都是 subListLength 個元素
for (int i = 0; i < pre; i++) {
List<T> itemList = Lists.newArrayList();
for (int j = 0; j < subListLength; j++) {
itemList.add(resList.get(i * subListLength + j));
}
ret.add(itemList);
}
// last的進行處理
if (last > 0) {
List<T> itemList = Lists.newArrayList();
for (int i = 0; i < last; i++) {
itemList.add(resList.get(pre * subListLength + i));
}
ret.add(itemList);
}
}
return ret;
}
// 運行代碼
public static void main(String[] args) {
List<String> list = Lists.newArrayList();
int size = 1099;
for (int i = 0; i < size; i++) {
list.add("hello-" + i);
}
// 大集合里面包含多個小集合
List<List<String>> temps = split(list, 100);
int j = 0;
// 對大集合里面的每一個小集合進行操作
for (List<String> obj : temps) {
System.out.println(String.format("row:%s -> size:%s,data:%s", ++j, obj.size(), obj));
}
}
}
開啟異步執(zhí)行任務(wù)的線程池:
public void threadMethod() {
List<T> updateList = new ArrayList();
// 初始化線程池, 參數(shù)一定要一定要一定要調(diào)好s∷痢7馈!炎功!
ThreadPoolExecutor threadPool = new ThreadPoolExecutor(20, 50,
4, TimeUnit.SECONDS, new ArrayBlockingQueue(10), new ThreadPoolExecutor.AbortPolicy());
// 大集合拆分成N個小集合, 這里集合的size可以稍微小一些(這里我用100剛剛好), 以保證多線程異步執(zhí)行, 過大容易回到單線程
List<T> splitNList = SplitListUtils.split(totalList, 100);
// 記錄單個任務(wù)的執(zhí)行次數(shù)
CountDownLatch countDownLatch = new CountDownLatch(splitNList.size());
// 對拆分的集合進行批量處理, 先拆分的集合, 再多線程執(zhí)行
for (List<T> singleList : splitNList) {
// 線程池執(zhí)行
threadPool.execute(new Thread(new Runnable(){
@Override
public void run() {
for (Entity yangshiwen : singleList) {
// 將每一個對象進行數(shù)據(jù)封裝, 并添加到一個用于存儲更新數(shù)據(jù)的list
// ......
}
}
}));
// 任務(wù)個數(shù) - 1, 直至為0時喚醒await()
countDownLatch.countDown();
}
try {
// 讓當前線程處于阻塞狀態(tài)枚冗,直到鎖存器計數(shù)為零
countDownLatch.await();
} catch (InterruptedException e) {
throw new BusinessLogException(ResponseEnum.FAIL);
}
// 通過mybatis的批量插入的方式來進行數(shù)據(jù)的插入, 這一步還是要做判空
if (GeneralUtil.listNotNull(updateList)) {
batchUpdateEntity(updateList);
LogUtil.info("xxxxxxxxxxxxxxx");
}
}
三、寫在最后
多線程是 Java 的一個難點蛇损,但是它也很有趣赁温,聽說玩得溜得起飛的人坛怪,人生都開啟多線程模式了…