Shell - 行列轉(zhuǎn)換

在日常文本的處理中撵枢,我們經(jīng)常會(huì)碰見行列轉(zhuǎn)換的情況雷恃,以下為幾種常見的行列轉(zhuǎn)換命令:

方案一

基本思路:將所有內(nèi)容存儲(chǔ)到一個(gè)二維數(shù)組中,之后按列輸出每一行

 cat file.txt | awk 'BEGIN{c=0;} {for(i=1;i<=NF;i++) {num[c,i] = $i;} c++;} END{ for(i=1;i<=NF;i++){str=""; for(j=0;j<NR;j++){ if(j>0){str = str" "} str= str""num[j,i]}printf("%s\n", str)} }' 

如果想使用tab鍵分開:

cat file.txt | awk 'BEGIN{c=0;} {for(i=1;i<=NF;i++) {num[c,i] = $i;} c++;} END{ for(i=1;i<=NF;i++){str=""; for(j=0;j<NR;j++){ if(j>0){str = str" "} str= str"\t"num[j,i]}printf("%s\n", str)} }' 

另一種寫法

cat file.txt | awk '{for(i=1;i<=NF;i=i+1){a[NR,i]=$i}}END{for(j=1;j<=NF;j++){str=a[1,j];for(i=2;i<=NR;i++){str=str " " a[i,j]}print str}}'

方案二

使用一維數(shù)組牺六,記錄每一列的組合串键闺;當(dāng)是第一行時(shí)賦值,否則都是累加,即字符串拼接

cat file.txt | awk '{ for(i=1;i<=NF;i++){ if(NR==1){ arr[i]=$i; }else{ arr[i]=arr[i]" "$i; } } } END{ for(i=1;i<=NF;i++){ print arr[i]; } }' 

同樣走搁,tab鍵分割:

cat file.txt | awk '{ for(i=1;i<=NF;i++){ if(NR==1){ arr[i]=$i; }else{ arr[i]=arr[i]"\t"$i; } } } END{ for(i=1;i<=NF;i++){ print arr[i]; } }' 
awk參數(shù)解析

NR - Number of Record :當(dāng)前處理的行是第幾行(因?yàn)閍wk是流處理工具独柑,一行一行處理的,所以NR在不停的自增1)私植;END里面引用的NR忌栅,是處理完文本后的NR
FNR - File Number of Record :當(dāng)前處理的行是當(dāng)前處理文件的第幾行
NF - Number of Fileds:當(dāng)前行有多少列數(shù)據(jù)(這個(gè)在每行都會(huì)根據(jù)設(shè)定的分割符重新計(jì)算,默認(rèn)分割符是任意連續(xù)的多個(gè)空白符)

實(shí)例解析

文件: expression_mRNA_17-Aug-2014.txt

$cat expression_mRNA_17-Aug-2014.txt* | sed -n '1,10p' | cut -f 1-10 | en

  1         tissue  sscortex        sscortex        sscortex        sscortex        sscortex        sscortex        sscortex        ca1hippocampus
  2         group # 1       1       1       1       1       1       1       1
  3         total mRNA mol  21580   21748   31642   32916   21531   24799   31406   20389
  4         well    11      95      33      42      48      13      50      66
  5         sex     1       -1      -1      1       1       -1      1       -1
  6         age     21      20      20      21      25      20      25      23
  7         diameter        0       9.56    11.1    11.7    11      11.9    11.3    10.9
  8 (none)  cell_id 1772071015_C02  1772071017_G12  1772071017_A05  1772071014_B06  1772067065_H06  1772071017_E02  1772067065_B07  1772067060_B09
  9 (none)  level1class     interneurons    interneurons    interneurons    interneurons    interneurons    interneurons    interneurons    interneurons
 10 (none)  level2class     Int10   Int10   Int6    Int10   Int9    Int9    Int10   Int9

$cat expression_mRNA_17-Aug-2014.txt* | sed -n '1,10p' | cut -f 1-10 | cut -f 2- | awk '{ for(i=1;i<=NF;i++){ if(NR==1){ arr[i]=$i; }else{ arr[i]=arr[i]"\t"$i; } } } END{ for(i=1;i<=NF;i++){ print arr[i]; } }' | en

  1 tissue  group   total   well    sex     age     diameter        cell_id level1class     level2class
  2 sscortex        #       mRNA    11      1       21      0       1772071015_C02  interneurons    Int10
  3 sscortex        1       mol     95      -1      20      9.56    1772071017_G12  interneurons    Int10
  4 sscortex        1       21580   33      -1      20      11.1    1772071017_A05  interneurons    Int6
  5 sscortex        1       21748   42      1       21      11.7    1772071014_B06  interneurons    Int10
  6 sscortex        1       31642   48      1       25      11      1772067065_H06  interneurons    Int9
  7 sscortex        1       32916   13      -1      20      11.9    1772071017_E02  interneurons    Int9
  8 sscortex        1       21531   50      1       25      11.3    1772067065_B07  interneurons    Int10
  9 ca1hippocampus  1       24799   66      -1      23      10.9    1772067060_B09  interneurons    Int9

巨人的肩膀

Shell練習(xí) 行列轉(zhuǎn)換
Linux 文本行列轉(zhuǎn)換

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末曲稼,一起剝皮案震驚了整個(gè)濱河市索绪,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌贫悄,老刑警劉巖瑞驱,帶你破解...
    沈念sama閱讀 206,482評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異窄坦,居然都是意外死亡唤反,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門嫡丙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來拴袭,“玉大人读第,你說我怎么就攤上這事曙博。” “怎么了怜瞒?”我有些...
    開封第一講書人閱讀 152,762評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵父泳,是天一觀的道長。 經(jīng)常有香客問我吴汪,道長惠窄,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,273評(píng)論 1 279
  • 正文 為了忘掉前任漾橙,我火速辦了婚禮杆融,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘霜运。我一直安慰自己脾歇,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,289評(píng)論 5 373
  • 文/花漫 我一把揭開白布淘捡。 她就那樣靜靜地躺著藕各,像睡著了一般。 火紅的嫁衣襯著肌膚如雪焦除。 梳的紋絲不亂的頭發(fā)上激况,一...
    開封第一講書人閱讀 49,046評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼乌逐。 笑死竭讳,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的浙踢。 我是一名探鬼主播代咸,決...
    沈念sama閱讀 38,351評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼成黄!你這毒婦竟也來了呐芥?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,988評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤奋岁,失蹤者是張志新(化名)和其女友劉穎思瘟,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體闻伶,經(jīng)...
    沈念sama閱讀 43,476評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡滨攻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,948評(píng)論 2 324
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蓝翰。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片光绕。...
    茶點(diǎn)故事閱讀 38,064評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖畜份,靈堂內(nèi)的尸體忽然破棺而出诞帐,到底是詐尸還是另有隱情,我是刑警寧澤爆雹,帶...
    沈念sama閱讀 33,712評(píng)論 4 323
  • 正文 年R本政府宣布停蕉,位于F島的核電站,受9級(jí)特大地震影響钙态,放射性物質(zhì)發(fā)生泄漏慧起。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,261評(píng)論 3 307
  • 文/蒙蒙 一册倒、第九天 我趴在偏房一處隱蔽的房頂上張望蚓挤。 院中可真熱鬧,春花似錦驻子、人聲如沸灿意。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,264評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽脾歧。三九已至,卻和暖如春演熟,著一層夾襖步出監(jiān)牢的瞬間鞭执,已是汗流浹背司顿。 一陣腳步聲響...
    開封第一講書人閱讀 31,486評(píng)論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留兄纺,地道東北人大溜。 一個(gè)月前我還...
    沈念sama閱讀 45,511評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像估脆,于是被迫代替她去往敵國和親钦奋。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,802評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • awk:報(bào)告生成器疙赠,格式化文本輸出 內(nèi)容: awk介紹 awk基本用法 awk變量 awk格式化 awk操作符 a...
    BossHuang閱讀 1,452評(píng)論 0 9
  • 轉(zhuǎn)自: https://wujunze.com/server_logs_analysis.jsp 2017-06-...
    鯨息_Leon閱讀 465評(píng)論 0 0
  • awk介紹awk變量printf命令:實(shí)現(xiàn)格式化輸出操作符awk patternawk actionawk數(shù)組aw...
    哈嘍別樣閱讀 1,549評(píng)論 0 4
  • 報(bào)告生成器付材,格式化文本輸出,常用選項(xiàng): -F:指明輸入時(shí)用到的字段分隔符 -v var=value:自定義變量 介...
    毛利卷卷發(fā)閱讀 516評(píng)論 0 1
  • 本章主要學(xué)習(xí)內(nèi)容awk介紹 ?awk基本用法 ?awk變量 ?awk格式化 ?awk操作符 ?awk條件判斷 ?a...
    楠人幫閱讀 1,254評(píng)論 0 8