![240](https://upload.jianshu.io/users/upload_avatars/22435566/150b64d1-ecae-4a13-9173-62aca1056d58.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
Bug起源 來自于Nvidia 的cub庫[https://github.com/NVIDIA/cub]的issue#179[https://g...
在學習CUB庫的radix sort時恩敌,會出現一系列一開始看起來奇怪的數字∏突穑現將其含義解釋如下慷蠕。 出現不同數字代表的含義 這是由于16bit合并...
需求 需求原因起源于cuda調試中,有許多函數的參數也是函數,暫且稱之為參數函數。當我想直接進入一個函數而不是參數函數中時,直接用step是不行...
最近在看cub[https://nvlabs.github.io/cub/index.html]代碼碍讨,記錄對于其scan和reduce的算法理解...
5.4. 消除循環(huán)的低效率 代碼移動:將要執(zhí)行多次但是計算結果不會改變的計算,移動到到循環(huán)外面蒙秒。image.png 5.5. 減少過程的調用 不...
設置ddd字體 原始的ddd字體丑陋勃黍,像素化,需要設置合適的字體大小晕讲,點擊Edit->Preferences->Fonts溉躲。然后看到不同設置。然...
近日感覺線程束洗牌指令還是很重要的益兄,下面就記錄一下自己的理解锻梳。 __shfl_xor命令 其中,returnValue 是從源線程中那個值返回的...
在看《深入理解計算機系統》時净捅,上面有一個存儲器山疑枯,自己也制作了一個自用電腦cpu的存儲器山。放圖如下: 時間局部性視圖(步長S為1時) 可以看出...
當不用參數初始化列表進行構造函數時荆永,成員參數會首先進行默認初始化废亭,之前有一段時間自己以為會調用默認構造函數來初始化,后來發(fā)現還是有區(qū)別的具钥。遂記錄...