論文紙片盒子 03
FRACTURE FLOW RATE ESTIMATION USING MACHINE LEARNING ON TEMPERATURE DATA
introduction
現(xiàn)有裂縫表征技術(shù)(fracture characterization techniques)有:間接法(indirect)、直接遠(yuǎn)場(chǎng)法(direct far-field)、直接近井法(direct near-wellbore)爬虱。
間接法:測(cè)井(well testing)聂沙、生產(chǎn)數(shù)據(jù)分析(production data analysis)、壓力分析(net pressure analysis)等。
直接遠(yuǎn)場(chǎng)法:裂縫監(jiān)測(cè)(tilt fracture mapping)、微震監(jiān)測(cè)(microseismic mapping)。
直接近井法:放射性示蹤(radioactive tracing)忿项、生產(chǎn)測(cè)井(production logging)、井眼圖像測(cè)井(borehole image logging)城舞、井下視頻(downhole video)轩触、溫度測(cè)井(temperature logging)。
temperature transient analysis
傳統(tǒng)的溫度測(cè)井主要獲取多點(diǎn)的時(shí)間-溫度關(guān)系曲線家夺。通過溫度變化情況確定流體進(jìn)入地層的位置脱柱。
深度學(xué)習(xí)結(jié)合溫度瞬態(tài)分析可用于裂縫標(biāo)準(zhǔn)。
problem statement
通過裂縫與井眼交點(diǎn)處的溫度時(shí)間序列估算在注水階段或停泵時(shí)的流體流量拉馋。
methodology
本項(xiàng)目主要包括兩部分:基于物理過程的正演模型(forward model)榨为、基于統(tǒng)計(jì)學(xué)或機(jī)器學(xué)習(xí)的反演模型(inverse model)。
正演模型用于生成流量-溫度歷史數(shù)據(jù)煌茴;反演模型用于通過輸入溫度數(shù)據(jù)自動(dòng)輸出流量數(shù)據(jù)随闺。
forward model
通過AD-GPRS flow simulator
建立一個(gè)二維模型,通過物理過程的數(shù)值模擬生成流量-溫度數(shù)據(jù)蔓腐。
儲(chǔ)層關(guān)鍵參數(shù)如下:
參數(shù) | 數(shù)值 | 單位 |
---|---|---|
幾何尺寸 | 400x200 | m |
鉆井長(zhǎng)度 | 200 | m |
滲透率 | 0.5 | md |
孔隙度 | 0.15 | - |
儲(chǔ)層溫度 | 368 | K |
導(dǎo)熱系數(shù) | 124.5 | kJ/(m·day·K) |
熱容量 | 0.9211 | kJ/(kg·K) |
密度 | 2250 | kg/m3 |
裂縫數(shù)量 | 3 | - |
裂縫半長(zhǎng) | [10,30,50] | m |
裂縫間距 | 50 | m |
壓裂液 | 25℃ 清水 | - |
無流動(dòng)邊界條件 |
inverse model
通過溫度估算流量矩乐,本質(zhì)上是回歸問題。
表示輸入數(shù)據(jù)——溫度時(shí)間序列
表示輸出數(shù)據(jù)——流量時(shí)間序列
由于正演模型生成數(shù)據(jù)計(jì)算消耗很大回论,所以輸入數(shù)據(jù)的規(guī)模較小散罕。因而不能采用簡(jiǎn)單的training-validation-test
數(shù)據(jù)集劃分方法分歇。本項(xiàng)目采用cross-validation
方法訓(xùn)練模型。
time series cross-validation
K-Fold Cross-Validation
將數(shù)據(jù)集分為 K
份欧漱,算法流程如下:
- 選擇第
k
份作為驗(yàn)證集职抡;選擇其他的k-1
份作為訓(xùn)練集。 - 訓(xùn)練集訓(xùn)練模型硫椰,驗(yàn)證集計(jì)算模型誤差。
-
k=1,2,3,...K
萨蚕,重復(fù)訓(xùn)練模型靶草。 -
K
次訓(xùn)練的誤差均值作為最終誤差屡拨。
常規(guī)的K-Fold Cross-Validation
對(duì)數(shù)據(jù)集有一定的要求:數(shù)據(jù)點(diǎn)各自獨(dú)立且分布均勻幢哨。但是溫度時(shí)間序列具有高度的時(shí)間相關(guān)性,顯然不適用這個(gè)條件先改。
為了解決上述問題浩蓉,本項(xiàng)目采用K-Fold Cross Validation
的變種派继,如下圖所示。
machine learning algorithms
本項(xiàng)目采用了三種機(jī)器學(xué)習(xí)算法:Lasso regression, Random forest, Kernel ridge regression捻艳。
linear regression methods
basis expansions
regularization: the lasso and ridge regression
kernels
tree based methods
random forest
machine learning framework
modeling results
case 1. injection at constant pressure
注水壓力控制驾窟。
features set
三個(gè)特征:溫度、溫度空間分量认轨、溫度時(shí)間分量绅络。
model performance
Lasso regression 方法均方根誤差為28%, Random forest 方法均方根誤差為68%嘁字。并且 Lasso regression 預(yù)測(cè)更為平滑恩急,接近真實(shí)數(shù)據(jù)。