[Qemu OpenChannelSSD] Basic I/O issues: Part1

![s](http://upload-images.jianshu.io/upload_images/569506-0d0d6094a17c7073.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240

今天繼續(xù)liblightnvm,咱今天牛逼了,搞一下OCSSD的IO操作,具體也是一樣浓体,從tests里面的test_addr_io.c下手.

幾點(diǎn)注意:

  1. nvm_buf_alloc:讀寫的數(shù)據(jù)長(zhǎng)度需要經(jīng)過(guò)對(duì)齊霹疫。
    最終調(diào)用的是posix_memalign.
void *nvm_buf_alloc(const struct nvm_geo *geo, size_t nbytes)
{
    char *buf;
    int ret;

    if (!nbytes) {
        errno = EINVAL;
        return NULL;
    }

    ret = posix_memalign((void **)&buf, geo->sector_nbytes, nbytes);
        //拿到了一個(gè)'至少'nbytes字節(jié)的內(nèi)存塊汁胆,并且這塊內(nèi)存起始地址是geo->sector_nbytes的倍數(shù).
        //至于為什么需要以geo->sector_nbytes大小對(duì)齊勤婚,我推測(cè)原因可能有2:
        //1.性能:讀寫時(shí)避免單次內(nèi)存操作被拆成2次.
        //2.沒有作對(duì)齊的內(nèi)存塊在Lightnvm內(nèi)核進(jìn)行I/O時(shí)可能會(huì)出錯(cuò).    
    if (ret) {
        errno = ret;
        return NULL;
    }

    return buf;
}
  1. 寫入/讀取的模式 : with or without meta ?

  2. 寫入/讀取的模式 : plane access mode : Single-plane, Dual-plane or Quad-plane ?

  3. 由于是NAND-Based Flash Mem,Write前需要先Erase. 而Erase的單位一般是Block.

一些小測(cè)試(To be continue...)

a. Erase:
(1). 目前貌似Erase只能同時(shí)對(duì)一個(gè)lun上的所有plane進(jìn)行擦除.(Test1)
(2). 正如Paper上說(shuō)的勃痴,write任意一個(gè)地址之前,如果這個(gè)地址被寫過(guò)磷蜀,需要先擦除再寫入.(Test2)

b. Write:
(0). write/read的最小單元是sector.(實(shí)際上也是nvm_addr所能尋址的最小單元)

c. Write/Read with meta. 這里的meta是啥東西召耘?
一個(gè)猜想:OCSSD里面一個(gè)sector(Update: 目前只能確定page,sector還不能確定)存儲(chǔ)單元(storage unit)配套存在一個(gè)meta存儲(chǔ)單元. 帶外數(shù)據(jù)(out-of-bound data)可能指的就是這樣的每個(gè)尋址單位其對(duì)應(yīng)的一小塊字節(jié)區(qū).

d. Access mode: Sngl/Dual/Quad
一個(gè)猜想:由于之前推斷出的結(jié)構(gòu)褐隆,加上這個(gè)測(cè)試示范Dual和Quad 2個(gè)模式都是在nplane大于相應(yīng)的個(gè)數(shù)時(shí)才做的(Dual:2污它, Quad:4),很可能這里的access mode是單次I/O同時(shí)發(fā)向不同的plane庶弃,可以使I/O并發(fā).

附:

#include <liblightnvm.h>
#include <stdlib.h>
#include <string.h>
#include <stdio.h>

static char nvm_dev_path[NVM_DEV_PATH_LEN] = "/dev/nvme0n1";
static struct nvm_dev *dev;
static const struct nvm_geo *geo;
static struct nvm_addr a0;

static int channel = 0;
static int lun = 0;
static int plane = 0;
static int block = 10;

#define STRLEN 20
static char Str[STRLEN] = "OCSSD Test";
static void *Buf_for_read = NULL;


#define FAIL_ERASE do{ printf("Erase Failed\n"); }while(0)
#define FAIL_ALLOC do{ printf("Alloc Failed\n"); }while(0)
#define FAIL_WRITE do{ printf("Write Failed\n"); }while(0)
#define FAIL_READ  do{ printf("Read Failed\n"); }while(0)
#define THE_SAME   do{ printf("Same\n"); }while(0)
#define NOT_THE_SAME do{ printf("Not Same\n"); }while(0)

int setup(void)
{
    dev = nvm_dev_open(nvm_dev_path);
    if (!dev) {
        perror("nvm_dev_open");
    }
    geo = nvm_dev_get_geo(dev);

    a0.ppa = 0;
    a0.g.ch = channel;
    a0.g.lun = lun;
    a0.g.pl = plane;
    a0.g.blk = block;

    Buf_for_read =  nvm_buf_alloc(geo, geo->sector_nbytes);
    if (!Buf_for_read) {
        FAIL_ALLOC;
        return -1;
    }
 
    return 0;
}

int teardown(void)
{
    nvm_dev_close(dev);
    if ( Buf_for_read ) {
        free(Buf_for_read);
    }
    return 0;
}

uint64_t alignblk(struct nvm_addr adr)
{
    struct nvm_addr alg;
    alg.ppa = adr.ppa;
    alg.g.pg = 0;
    alg.g.sec = 0;
    return alg.ppa;
}
void EraseNpl_1Blk(struct nvm_addr wh)//
{
    struct nvm_ret ret;
    ssize_t res;
    int pmode = NVM_FLAG_PMODE_SNGL;
    const int npl = geo->nplanes;
    struct nvm_addr whichblk[npl];
    for(int i = 0; i < npl; ++i){
        whichblk[i].ppa = alignblk(wh);
        whichblk[i].g.pl = i;
    }
    res = nvm_addr_erase(dev, whichblk, npl, pmode, &ret);//Erase 1 block of all planes inside a lun.
    if(res < 0){
        FAIL_ERASE;
        nvm_ret_pr(&ret);
    }
}


//pmode = Single-plane, without meta
void Write_1Sector(struct nvm_addr wh)
{
    struct nvm_ret ret;
    ssize_t res;
    int pmode = NVM_FLAG_PMODE_SNGL;
    void *bufptr = NULL;

    bufptr = nvm_buf_alloc(geo, geo->sector_nbytes);//sector size
    if(!bufptr){
        FAIL_ALLOC;
        goto OUT;
    }
    memcpy(bufptr, Str, STRLEN);

    //2. write
    res = nvm_addr_write(dev, &wh, 1, bufptr, NULL, pmode, &ret);//Write 1 sector
    if(res < 0){
        FAIL_WRITE;
    }

    free(bufptr);
OUT:
    if(res < 0){
        nvm_ret_pr(&ret);
    }
    return;
}

void Read_1Sector(struct nvm_addr wh)
{
    struct nvm_ret ret;
    ssize_t res;

    int pmode = NVM_FLAG_PMODE_SNGL;

    res = nvm_addr_read(dev, &wh, 1, Buf_for_read, NULL, pmode, &ret);
    if(res < 0){
        FAIL_READ;
        nvm_ret_pr(&ret);
    }
}

int MemCmp(unsigned char *a, unsigned char *b, int len)
{
    for(int i = 0; i < len; ++i){
        if(a[i] != b[i]){
            return -1;
        }
    }
    return 0;
}

void test_basic(void);
void test_write_no_erase(void)
{
    struct nvm_addr addr;
    addr.ppa = a0.ppa;
    addr.g.pg = 1;
    addr.g.sec = 1; //same as test_basic()'s address
    printf("Before test: ");
    test_basic();

    printf("Run test: ");
    Write_1Sector(addr);
}

void test_erase_1pl_1blk(void)
{
    struct nvm_addr addr;
    struct nvm_ret ret;
    ssize_t res;
    int pmode = NVM_FLAG_PMODE_SNGL;
    const int npl = geo->nplanes;
    struct nvm_addr whichblk[npl];

    addr.ppa = a0.ppa;

    for(int i = 0; i < npl; ++i){
        whichblk[i].ppa = alignblk(addr);
        whichblk[i].g.pl = i;
    }
    res = nvm_addr_erase(dev, whichblk, 1, pmode, &ret);//Erase 1 block of 1 planes inside a lun.
    if(res < 0){
        FAIL_ERASE;
        nvm_ret_pr(&ret);
    }
}

void test_basic(void)
{
    struct nvm_addr addr;
    addr.ppa = a0.ppa;
    addr.g.pg = 1;
    addr.g.sec = 1;
    EraseNpl_1Blk(addr);
    Write_1Sector(addr);
    Read_1Sector(addr);
    if(0 == MemCmp(Str, Buf_for_read, strlen(Str))){
        THE_SAME;
    }else{
        NOT_THE_SAME;
    }
}

typedef void (* FuncType) (void);
void RunTests()
{
    FuncType tests[] = { 
            test_basic,
            test_erase_1pl_1blk,
            test_write_no_erase
        };
    const char *teststr[] = {
            "test_basic",
            "test_erase_1pl_1blk",
            "test_write_no_erase"
        };
    for(int i = 0; i < 3; i++){
        printf("====Test %d====\n %s:\n", i, teststr[i]);
        tests[i]();
    }
}


int main()
{
    if( setup() < 0){
        return -1;
    }
    RunTests();
    teardown();
    return 0;
}

Result:

====Test 0====
 test_basic:
Same
====Test 1====
 test_erase_1pl_1blk:
Erase Failed
nvm_ret { result(0x2), status(0) }
====Test 2====
 test_write_no_erase:
Before test: Same
Run test: Write Failed
nvm_ret { result(0x2), status(0) }

Qemu Output:

lnvm: Erase not performed to all planes (1)
Erased failed
ppa:ch:0,lun:0,blk:10,pg:0,pl:0,sec:0
Attempting to write to non erased block (172)
lnvm: set written status failed
ppa:ch:0,lun:0,blk:10,pg:1,pl:1,sec:0

PS

這個(gè)lib讓使用qemu的用戶可以直接通過(guò)nvme與OCSSD交互衫贬,不需要通過(guò)內(nèi)核lightnvm模塊的target(包括需要初始化(lnvm init)/生成一個(gè)target設(shè)備(lnvm create)等)

PPS

我在測(cè)試write with meta時(shí)發(fā)現(xiàn)meta存在寫入與讀取不匹配的情況,后來(lái)看了一眼最新的qemu-nvme歇攻,發(fā)現(xiàn)這個(gè)bug已經(jīng)在2天前的commit(3839a1f059fff)fix掉了. ~~~lucky! 改天可以分析一下這整個(gè)從用戶態(tài)lib到kerne再到hardware(qemu)的流程固惯。

lightnvm: fix bad dma write on metadata
 [master](https://github.com/OpenChannelSSD/qemu-nvme)
1 parent commit 3839a1f059fff1dd40d8696b8d12bdebe256112a
Javier González committed 2 days ago
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市缴守,隨后出現(xiàn)的幾起案子葬毫,更是在濱河造成了極大的恐慌,老刑警劉巖屡穗,帶你破解...
    沈念sama閱讀 211,042評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件贴捡,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡村砂,警方通過(guò)查閱死者的電腦和手機(jī)烂斋,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)础废,“玉大人汛骂,你說(shuō)我怎么就攤上這事∑老伲” “怎么了帘瞭?”我有些...
    開封第一講書人閱讀 156,674評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)蒿讥。 經(jīng)常有香客問(wèn)我蝶念,道長(zhǎng)锋拖,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評(píng)論 1 283
  • 正文 為了忘掉前任祸轮,我火速辦了婚禮兽埃,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘适袜。我一直安慰自己柄错,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評(píng)論 5 384
  • 文/花漫 我一把揭開白布苦酱。 她就那樣靜靜地躺著售貌,像睡著了一般。 火紅的嫁衣襯著肌膚如雪疫萤。 梳的紋絲不亂的頭發(fā)上颂跨,一...
    開封第一講書人閱讀 49,749評(píng)論 1 289
  • 那天,我揣著相機(jī)與錄音扯饶,去河邊找鬼恒削。 笑死,一個(gè)胖子當(dāng)著我的面吹牛尾序,可吹牛的內(nèi)容都是我干的钓丰。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼每币,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼携丁!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起兰怠,我...
    開封第一講書人閱讀 37,662評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤梦鉴,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后揭保,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體肥橙,經(jīng)...
    沈念sama閱讀 44,110評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年掖举,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了快骗。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片娜庇。...
    茶點(diǎn)故事閱讀 38,577評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡塔次,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出名秀,到底是詐尸還是另有隱情励负,我是刑警寧澤,帶...
    沈念sama閱讀 34,258評(píng)論 4 328
  • 正文 年R本政府宣布匕得,位于F島的核電站继榆,受9級(jí)特大地震影響巾表,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜略吨,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評(píng)論 3 312
  • 文/蒙蒙 一集币、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧翠忠,春花似錦鞠苟、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至考榨,卻和暖如春跨细,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背河质。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工冀惭, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人掀鹅。 一個(gè)月前我還...
    沈念sama閱讀 46,271評(píng)論 2 360
  • 正文 我出身青樓云头,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親淫半。 傳聞我的和親對(duì)象是個(gè)殘疾皇子溃槐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容