串行代碼優(yōu)化（個人總結）

應用級別

1.編譯器選項
許多編譯器具有自己的優(yōu)化方案莉炉，也是最容易最穩(wěn)定的實現方法
2.調用高性能庫
如：BLAS FFTW
3.去掉全局變量
4.受限指針
多個指針指向同一個內存地址或指向的內存地址有重疊黑滴，它會阻礙編譯器對程序進行指令重排、表達式移除等優(yōu)化挟憔。restrict標識符砰奕，指定受限指針
5.條件編譯

算法級別

1.索引順序
訪問多維數據時的局部性直接與各維數據在內存中存放的先后順序有關。如C語言中數據是以行為主序存放的，在計算時盡量按行訪問數據售睹。

for( int i = 0; i<M; i++){
 float ret=0.0f;
 for(int j =0 ;j<N;j++){
   ret+=a[i][j];
   }
r[i]=ret;
}

2.緩存分塊
3.軟件預取
數據被使用前，投機的加載到緩存中
4.查表法
會較少精度可训，實際項目中將查表法和線性插值結合減少精度的降低

函數級別

1.函數調用參數
如果函數的參數是大結構體或類昌妹，應當通過傳指針或引用減少調用時復制和返回時的銷毀開銷
2.內聯小函數
能夠消除函數調用的開銷，并提供更多的指令級并行握截，表達式移除等優(yōu)化機會飞崖。建議少于10行的函數inline

循環(huán)級別

1.循環(huán)展開
展開循環(huán)不但減少了每次的判斷數量和循環(huán)變量改變的次數，更能增加流水線執(zhí)行的性能

float sum=0.0f;
for(int i=0;i<num;i++){
    sum+= a[i];
}
優(yōu)化后：
float sum=0.0f,sum1=0.0f,sum2=0.0f,sum3=0.0f;
for(int i = 0;i< num;i+=4){
    sum1 +=a[i];
    sum2 +=a[i+1];
    sum3 +=a[i+2];
    sum +=a[i+3];
}
sum +=sum1+sum2+sum3;

對于二層循環(huán)來說谨胞，建議優(yōu)先展開外層循環(huán)固歪，但不是一個普適的準則。

需要注意？枧＠紊选！留意處理末尾的數據

2.循環(huán)累積
循環(huán)累積主要和循環(huán)展開同時使用叶沛，減少寄存器的使用量的同時保證平行度蒲讯。

float sum=0.0f,sum1=0.0f,sum2=0.0f;
for(int i = 0;i< num;i+=6){
   sum1 +=a[i]+a[i+1];
   sum +=a[i+2]+a[i+3];
   sum2 +=a[i+4]+a[i+5];
}
sum +=sum1+sum2;

直接展開6次需要6個臨時變量，現在只需要3個灰署。
3.循環(huán)合并

for(int i=0; i<len; i++){{
   x1 +=a[i];
}
for(int i=0; i<len; i++){{
   x2 *=b[i];
}
合并后：
for(int i=0; i<len; i++){{
   x1 +=a[i];
   x2 *=b[i];
}

適合于小循環(huán)
4.循環(huán)拆分
相對于循環(huán)合并判帮，就是循環(huán)拆分局嘁。

語句級別

1.減少內存讀寫
2.選用盡量小的數據類型
3.結構體對齊
不同硬件平臺和編譯器對結構體對齊的要求不相同，

結構體占用總字節(jié)數盡量是2的冪
每個域的開始地址是他大小的整數倍脊另，比如在32位cpu下导狡，假設一個整型變量的地址為0x00000004，那它就是自然對齊的
編譯器提供了字節(jié)對齊的編譯語句
GCC下則在每個結構加attribute((aligned(4)))：
對于標準數據類型偎痛，它的地址只要是它的長度的整數倍就行了，而非標準數據類型按下面的原則對齊
1.數組：按照基本數據類型對齊独郎，第一個對齊了后面的自然也就對齊了踩麦。
2.聯合：按其包含的長度最大的數據類型對齊。
3.結構體：結構體中每個數據類型都要對齊氓癌。

struct stu{
　　 char sex;
　　 int length;
　　 char name[10];
　　};
　　struct stu my_stu;
　　由于在x86下谓谦，GCC默認按4字節(jié)對齊，它會在sex后面跟name后面分別填充三個和兩個字節(jié)使length和整個結構體對齊贪婉。于是我們sizeof(my_stu)會得到長度為20反粥，而不是15.
struct stu{
　　 char sex;
　　 int length;
　　 char name[10];
　　}__attribute__ ((aligned (4)));

表達式移除
去掉重復的、共同的計算或訪問
分支優(yōu)化
1.盡量避免把判斷放到循環(huán)里
2.拆分循環(huán)疲迂，減少分支
3.合并多個條件
4.查表法移除分支
5.分支順序才顿。如：if( a&&b)若啊計算量大應該放后面
6.優(yōu)化交換性能

uchar tmp=a[ji];
a[ji]=a[[jj];
a[jj]=tmp;
可優(yōu)化為：
uchar aji=a[ji];
uchar ajj=a[[jj];
a[ji]=ajj;
a[jj]=aji;
后一段代碼雖然多一個臨時變量，但是讀寫間沒有關系尤蒿，并行讀高郑气！

指令級別

1.減少數據依賴
2.注意處理器多發(fā)射能力
3.優(yōu)化乘除法和模余
整數運算最多一個周期，而乘法要三個周期腰池，除法十幾個尾组，模余需要幾十或上百，移位運算只要一個周期示弓。
將除法轉換成乘法
4.選擇更具體的庫函數或算法
5.其他：如聲明float時加f后綴讳侨，使用const，static

最后編輯于：2017.12.26 11:15:03

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末奏属，一起剝皮案震驚了整個濱河市跨跨，隨后出現的幾起案子，更是在濱河造成了極大的恐慌拍皮，老刑警劉巖歹叮，帶你破解...
沈念sama閱讀 218,525評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現場離奇詭異铆帽，居然都是意外死亡咆耿，警方通過查閱死者的電腦和手機，發(fā)現死者居然都...
沈念sama閱讀 93,203評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門爹橱，熙熙樓的掌柜王于貴愁眉苦臉地迎上來萨螺，“玉大人，你說我怎么就攤上這事∥考迹” “怎么了椭盏？”我有些...
開封第一講書人閱讀 164,862評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長吻商。經常有香客問我掏颊，道長，這世上最難降的妖魔是什么艾帐？我笑而不...
開封第一講書人閱讀 58,728評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任乌叶，我火速辦了婚禮，結果婚禮上柒爸，老公的妹妹穿的比我還像新娘准浴。我一直安慰自己，他們只是感情好捎稚，可當我...
茶點故事閱讀 67,743評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布乐横。她就那樣靜靜地躺著，像睡著了一般今野。火紅的嫁衣襯著肌膚如雪葡公。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,590評論 1贊 305
城市分裂傳說
那天腥泥，我揣著相機與錄音匾南，去河邊找鬼。笑死蛔外，一個胖子當著我的面吹牛蛆楞，可吹牛的內容都是我干的。我是一名探鬼主播夹厌，決...
沈念sama閱讀 40,330評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼豹爹，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了矛纹？” 一聲冷哼從身側響起臂聋，我...
開封第一講書人閱讀 39,244評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎或南，沒想到半個月后孩等，有當地人在樹林里發(fā)現了一具尸體，經...
沈念sama閱讀 45,693評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡采够，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,885評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年肄方，在試婚紗的時候發(fā)現自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蹬癌。...
茶點故事閱讀 40,001評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡权她，死狀恐怖虹茶，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情隅要，我是刑警寧澤蝴罪，帶...
沈念sama閱讀 35,723評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站步清，受9級特大地震影響要门，放射性物質發(fā)生泄漏。R本人自食惡果不足惜尼啡，卻給世界環(huán)境...
茶點故事閱讀 41,343評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一暂衡、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧崖瞭，春花似錦、人聲如沸撑毛。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,919評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽藻雌。三九已至雌续，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間胯杭，已是汗流浹背驯杜。一陣腳步聲響...
開封第一講書人閱讀 33,042評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留做个，地道東北人鸽心。一個月前我還...
沈念sama閱讀 48,191評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像居暖，于是被迫代替她去往敵國和親顽频。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,955評論 2贊 355

串行代碼優(yōu)化（個人總結）

應用級別

算法級別

函數級別

循環(huán)級別

需要注意？枧＠紊选！留意處理末尾的數據

語句級別

指令級別

推薦閱讀更多精彩內容