DICOM將臨床中的幾乎所有信息都標(biāo)準(zhǔn)化為DICOM中的屬性,并將其組織成IOD(Information Object Defination).在接下來(lái)的內(nèi)容中將主要講解DICOM協(xié)議如何組織這些數(shù)據(jù)涛癌。
基本的IT知識(shí)
學(xué)過(guò)計(jì)算機(jī)基礎(chǔ)知識(shí)的同學(xué)都知道魂贬,計(jì)算機(jī)中存儲(chǔ)信息是通過(guò)二進(jìn)制存儲(chǔ)的筐骇,計(jì)算機(jī)存儲(chǔ)的時(shí)候敌蜂,又有字節(jié)(byte)和比特(bit)之分拾枣,一個(gè)比特表示二進(jìn)制數(shù)字中的一位庆械,而一個(gè)字節(jié)包含了八個(gè)比特薇溃。例如,十進(jìn)制中的14 在二進(jìn)制中表示為 0000 1110缭乘,在電腦中占用了一個(gè)字節(jié)(8bit)的存儲(chǔ)空間沐序。更為具體的數(shù)值存儲(chǔ)只是,在這里就不細(xì)講了堕绩,如果不會(huì)就需要去復(fù)習(xí)下計(jì)算機(jī)基礎(chǔ)知識(shí)了策幼。
文本 or 二進(jìn)制
通常根據(jù)存儲(chǔ)內(nèi)容類型的不同,計(jì)算機(jī)會(huì)將數(shù)據(jù)分為二進(jìn)制文件和文本文件兩種類型奴紧,文本類型數(shù)據(jù)就像我們平時(shí)使用的.txt格式的文件特姐,存儲(chǔ)的都是一些文字信息,比較典型的場(chǎng)景包括姓名黍氮、日期唐含、日志、ID等字符串信息的存儲(chǔ)滤钱,優(yōu)點(diǎn)是讀取方便觉壶,不需要再次編解碼。而二進(jìn)制數(shù)據(jù)通常存儲(chǔ)數(shù)字化的序列件缸,比如圖像像素?cái)?shù)據(jù)铜靶、視頻、音頻數(shù)據(jù)等他炊,相比文本類型争剿,二進(jìn)制數(shù)據(jù)會(huì)更加的節(jié)省存儲(chǔ)空間,但相比文本數(shù)據(jù)痊末,其編碼蚕苇、解碼會(huì)比較耗時(shí),通常會(huì)根據(jù)硬件的不同對(duì)性能有不同程度的影響凿叠。
在這里有一點(diǎn)值得注意涩笤,不同的操作系統(tǒng)對(duì)數(shù)據(jù)會(huì)有不同的存儲(chǔ)方式,有的采用小端對(duì)齊(Windows)盒件,有的采用大端對(duì)齊(Mac Os),如果你現(xiàn)在在Windows下存儲(chǔ)了一個(gè)數(shù)據(jù)為 0x 007F (127), 此時(shí)相同的數(shù)據(jù)在Mac Os中就要表示成 0x7F00了蹬碧。如果這個(gè)時(shí)候要在Windows和Mac Os之間傳輸數(shù)據(jù),就會(huì)導(dǎo)致數(shù)據(jù)的錯(cuò)亂炒刁,為了避免這種情況恩沽,一般兩個(gè)系統(tǒng)上的DICOM應(yīng)用在傳輸數(shù)據(jù)之前就要先確定對(duì)方的數(shù)據(jù)存儲(chǔ)方式,另外要注意的是翔始,DICOM在默認(rèn)情況下是以小端對(duì)齊
的方式進(jìn)行存儲(chǔ)數(shù)據(jù)的罗心。數(shù)據(jù)存儲(chǔ)方式的不同這點(diǎn)不論是開發(fā)人員還是應(yīng)用軟件的使用人員都需要注意里伯。
相比之下,文本類型的數(shù)據(jù)就不會(huì)有這么多的麻煩事了渤闷,文本類型數(shù)據(jù)都比較獨(dú)立疾瓮,不受操作系統(tǒng)的影響,為開發(fā)人員節(jié)省了很多腦細(xì)胞肤晓。對(duì)比二進(jìn)制數(shù)據(jù)和文本類型數(shù)據(jù)爷贫,都有著其優(yōu)勢(shì)的地方认然,所以DICOM標(biāo)準(zhǔn)中將dicom文件的存儲(chǔ)方式既包含文本數(shù)據(jù)补憾,又包含二進(jìn)制數(shù)據(jù)。如果你用記事本打開一個(gè)dicom文件卷员,你可能看到如下圖的場(chǎng)景:文件中既包含可讀的文字信息盈匾,又包含一些亂糟糟的亂碼,其實(shí)這些亂碼就是存儲(chǔ)的二進(jìn)制數(shù)據(jù)毕骡,如果你想了解存儲(chǔ)在這些亂碼中的信息削饵,只能通過(guò)專業(yè)的DICOM軟件進(jìn)行閱讀了。
DICOM語(yǔ)法:Value Representations
如果你學(xué)習(xí)過(guò)編程未巫,對(duì)數(shù)據(jù)類型這個(gè)詞語(yǔ)你一定不陌生窿撬,而在DICOM中也有著自己的數(shù)據(jù)類型,專業(yè)一點(diǎn)的叫法叫做Value Representation. DICOM標(biāo)準(zhǔn)中總共定義了27種基本數(shù)據(jù)類型叙凡,幾乎囊括了所有的臨床數(shù)據(jù)類型劈伴,DICOM文件中所有的數(shù)據(jù)編碼都要在這27種基本數(shù)據(jù)類型之內(nèi)。另外握爷,每一種數(shù)據(jù)類型都用兩個(gè)大寫英文字母來(lái)表示跛璧,具體的27種數(shù)據(jù)類型定義如下:
以上為DICOM中所有的數(shù)據(jù)類型,作為開發(fā)人員新啼,需要在使用時(shí)重點(diǎn)關(guān)注數(shù)據(jù)長(zhǎng)度追城,在上面的圖中,每種數(shù)據(jù)類型后邊都跟著其數(shù)據(jù)長(zhǎng)度燥撞,DICOM通過(guò)兩種方式來(lái)確定數(shù)據(jù)的長(zhǎng)度座柱,一種方式是單獨(dú)的記錄每種類型長(zhǎng)度,類似于建立一個(gè)map表物舒,映射類型與長(zhǎng)度關(guān)系色洞;另一種方式則是像前面表格中最后一列,一些基本數(shù)據(jù)類型其數(shù)據(jù)長(zhǎng)度是固定的茶鉴,只要根據(jù)該表就能確定數(shù)據(jù)長(zhǎng)度是多少锋玲。
在前面表中的27中數(shù)據(jù)類型,大致可以分為以下幾類:
- Text VRs(文本類型): CS SH LO ST LT UT
- 時(shí)間日期類型: DA TM DT AS
- 文本類型數(shù)字:IS DS
- 二進(jìn)制類型數(shù)字: SS US SL UL FL FD OB OW OF AT
- PN 存儲(chǔ)患者姓名: PN
- AE 存儲(chǔ)應(yīng)用實(shí)體: AE
- UIDs 唯一標(biāo)識(shí):UID
- SQ: 序列數(shù)據(jù)集:SQ
- UN: 標(biāo)識(shí)未知的值:UN
關(guān)于VR(Value Representations 類似于數(shù)據(jù)類型) 還有很多細(xì)節(jié)信息涵叮,在此就不具體的贅述了惭蹂,需要的時(shí)候可以查看Digital Imaging and Communications in Medicine這本書和Dicom協(xié)議進(jìn)行了解伞插。