scipy常見數(shù)據(jù)結構:coo_matrix彭雾、csc_matrix與csr_matrix

scipy.sparse.coo_matrix

coo_matrix全稱是A sparse matrix in COOrdinate format沪铭,一種基于坐標格式的稀疏矩陣,每一個矩陣項是一個三元組(行,列,值)峦朗。
該矩陣的常見構造方法有如下幾種:

  • coo_matrix(D)
    舉例如下:
import numpy as np
from scipy.sparse import coo_matrix
coo = coo_matrix(np.array([1, 2, 3, 4, 5, 6]).reshape((2,3)))
print(coo)

輸出為:


image.png

使用稠密二維數(shù)組構造

  • coo_matrix(S)
    使用另外一個稀疏矩陣S構造。
  • coo_matrix((M, N), [dtype])
    舉例如下:
from scipy.sparse import coo_matrix
coo_matrix((3, 4), dtype=np.int8).toarray()

輸出為:
array([[0, 0, 0, 0],
[0, 0, 0, 0],
[0, 0, 0, 0]], dtype=int8)

  • coo_matrix((data, (i, j)), [shape=(M, N)])
    data即矩陣存儲的數(shù)據(jù)排龄,i為行下標波势,j為列下標,
    data,i,j的關系為:A[i[k], j[k]] = data[k]
    舉例如下:
from scipy.sparse import coo_matrix
row  = np.array([0, 3, 1, 0])
col  = np.array([0, 3, 1, 2])
data = np.array([4, 5, 7, 9])
coo_matrix((data, (row, col)), shape=(4, 4)).toarray()
pr

輸出為:
array([[4, 0, 9, 0],
[0, 7, 0, 0],
[0, 0, 0, 0],
[0, 0, 0, 5]])
如果行列坐標有重復橄维,對應的值直接累加尺铣,舉例如下:

row  = np.array([0, 0, 1, 3, 1, 0, 0])
col  = np.array([0, 2, 1, 3, 1, 0, 0])
data = np.array([1, 1, 1, 1, 1, 1, 1])
coo = coo_matrix((data, (row, col)), shape=(4, 4))
np.max(coo.data)
coo.toarray()

輸出為:
array([[3, 0, 1, 0],
[0, 2, 0, 0],
[0, 0, 0, 0],
[0, 0, 0, 1]])

scipy.sparse.csr_matrix

csr是Compressed Sparse Row matrix的縮寫即壓縮稀疏基于行存儲的矩陣,好繞口争舞,該矩陣有如下幾種構造方法:

  • csr_matrix(D)
    D是一個稠密矩陣或2維的ndarray
    舉例如下:
import numpy as np
from scipy.sparse import csr_matrix
csr = csr_matrix(np.array([1, 2, 3, 4, 5, 6]).reshape((2,3)))
print(csr)

輸出為:


image.png
  • csr_matrix(S)
    使用另外一個csr即S構造
  • csr_matrix((M, N), [dtype])
    構造一個shape為(M,N)的dtype類型空矩陣
    舉例如下:
import numpy as np
from scipy.sparse import csr_matrix
import numpy as np
from scipy.sparse import csr_matrix
csr_matrix((3, 4), dtype=np.int8).toarray()

輸出為:
array([[0, 0, 0, 0],
[0, 0, 0, 0],
[0, 0, 0, 0]], dtype=int8)

  • csr_matrix((data, (row_ind, col_ind)), [shape=(M, N)])
    data,row_ind,col_ind的關系為:a[row_ind[k], col_ind[k]] = data[k]
row = np.array([0, 0, 1, 2, 2, 2])
col = np.array([0, 2, 2, 0, 1, 2])
data = np.array([1, 2, 3, 4, 5, 6])
csr_matrix((data, (row, col)), shape=(3, 3)).toarray()

輸出為:
array([[1, 0, 2],
[0, 0, 3],
[4, 5, 6]])
按行存儲凛忿,即先存儲第0行,然后第1行竞川,依次到最后一行店溢,即先掃描row數(shù)組的數(shù)據(jù),第一個數(shù)據(jù)是0即第0行委乌,然后掃描col的第一個數(shù)據(jù)是0即第0列床牧,那么第0行第0列存儲的值就是data的第一個數(shù)據(jù)即1,然后繼續(xù)掃描row的第二個數(shù)據(jù)還是0即還是第0行遭贸,col對應的第二個數(shù)據(jù)是2即第2列戈咳,data的第二個數(shù)據(jù)是2,即第0行第2列的數(shù)據(jù)是2壕吹,依次掃描row著蛙,找對應的col和data構造稀疏矩陣。

  • csr_matrix((data, indices, indptr), [shape=(M, N)])
    這是標準的CSR表示方法算利,其中第i行的列下標存儲在indices[indptr[i]:indptr[i+1]]册踩,根據(jù)該公式可以得到行數(shù)即為indptr的長度減1,對應的列列值存儲在data[indptr[i]:indptr[i+1]]效拭。
    舉例如下:
import numpy as np
from scipy.sparse import csr_matrix
indptr = np.array([0, 2, 3, 6])
indices = np.array([0, 2, 2, 0, 1, 2])
data = np.array([1, 2, 3, 4, 5, 6])
csr_matrix((data, indices, indptr), shape=(3, 3)).toarray()

輸出為:
array([[1, 0, 2],
[0, 0, 3],
[4, 5, 6]])

scipy.sparse.csc_matrix

csc是Compressed Sparse Column matrix的縮寫即基于列存儲的壓縮稀疏矩陣暂吉,該矩陣有如下幾種構造方法:

  • csc_matrix(D)
    使用一個二維數(shù)組構造胖秒,舉例如下:
import numpy as np
from scipy.sparse import csr_matrix
csc = csc_matrix(np.array([1, 2, 3, 4, 5, 6]).reshape((2,3)))
print(csc)

輸出如下:


image.png

和前面的csr的輸出對比可以看出該矩陣是按列逐個存儲。

  • csc_matrix(S)
    使用另外一個csc構造慕的。
  • csc_matrix((M, N), [dtype])
import numpy as np
from scipy.sparse import csc_matrix
csc_matrix((3, 4), dtype=np.int8).toarray()

輸出如下:
array([[0, 0, 0, 0],
[0, 0, 0, 0],
[0, 0, 0, 0]], dtype=int8)

  • csc_matrix((data, (row_ind, col_ind)), [shape=(M, N)])
    舉例如下:
import numpy as np
from scipy.sparse import csc_matrix
row = np.array([0, 2, 2, 0, 1, 2])
col = np.array([0, 0, 1, 2, 2, 2])
data = np.array([1, 2, 3, 4, 5, 6])
csc_matrix((data, (row, col)), shape=(3, 3)).toarray()

輸出如下:
array([[1, 0, 4],
[0, 0, 5],
[2, 3, 6]])

  • csc_matrix((data, indices, indptr), [shape=(M, N)])
    這是標準的csc矩陣表示方法阎肝,其中第i列的行下標存儲在indices[indptr[i]:indptr[i+1]],對應的行值存儲在data[indptr[i]:indptr[i+1]]肮街。
    舉例如下:
import numpy as np
from scipy.sparse import csc_matrix
indptr = np.array([0, 2, 3, 6])
indices = np.array([0, 2, 2, 0, 1, 2])
data = np.array([1, 2, 3, 4, 5, 6])
csc_matrix((data, indices, indptr), shape=(3, 3)).toarray()

輸出如下:
array([[1, 0, 4],
[0, 0, 5],
[2, 3, 6]])

coo_matrix风题、csc_matrix與csr_matrix的關系與用法

coo_matrix由于構造方便容易理解,所以通常都是先構造該矩陣然后調用tocsr和tocsc函數(shù)來獲取另外兩種矩陣的存儲嫉父。
csr_matrix支持快速的按行切片沛硅,而csc_matrix則支持快速按列切片操作。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末绕辖,一起剝皮案震驚了整個濱河市摇肌,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌仪际,老刑警劉巖围小,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異树碱,居然都是意外死亡肯适,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門成榜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來框舔,“玉大人,你說我怎么就攤上這事伦连∮杲龋” “怎么了?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵惑淳,是天一觀的道長额港。 經常有香客問我,道長歧焦,這世上最難降的妖魔是什么移斩? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮绢馍,結果婚禮上向瓷,老公的妹妹穿的比我還像新娘。我一直安慰自己舰涌,他們只是感情好猖任,可當我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著瓷耙,像睡著了一般朱躺。 火紅的嫁衣襯著肌膚如雪刁赖。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天长搀,我揣著相機與錄音宇弛,去河邊找鬼。 笑死源请,一個胖子當著我的面吹牛枪芒,可吹牛的內容都是我干的。 我是一名探鬼主播谁尸,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼舅踪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了良蛮?” 一聲冷哼從身側響起硫朦,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎背镇,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體泽裳,經...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡瞒斩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了涮总。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片胸囱。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖瀑梗,靈堂內的尸體忽然破棺而出烹笔,到底是詐尸還是另有隱情,我是刑警寧澤抛丽,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布谤职,位于F島的核電站,受9級特大地震影響亿鲜,放射性物質發(fā)生泄漏允蜈。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一蒿柳、第九天 我趴在偏房一處隱蔽的房頂上張望饶套。 院中可真熱鬧,春花似錦垒探、人聲如沸妓蛮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蛤克。三九已至捺癞,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間咖耘,已是汗流浹背翘簇。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留儿倒,地道東北人版保。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像夫否,于是被迫代替她去往敵國和親彻犁。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,762評論 2 345