CristianoC - 簡書

發(fā)簡信

CristianoC

4
關注
29
粉絲
83
文章
134965

字數
18

收獲喜歡
0

總資產

IP屬地：廣東

CristianoC

深度強化學習落地指南總結（一）-需求分析
本系列是對《深度強化學習落地指南》全書的總結，這本書是我市面上看過對深度強化學習落地講的最好的一本書干茉，大大拓寬了自己對RL落地思考的維度侦高，形成了強化學習落地分析的一套完整框架...

1022 0 1
CristianoC

virtualenv使用說明
用PPO要用tensorflow_proballity 自己電腦是tf1.x 沒法順利安裝所以要用虛擬環(huán)境一般就是進入venv的bin目錄下 source activat...

177 0 0

CristianoC

機器學習中的頻率派和貝葉斯派-以極大似然估計和最大后驗估計為例
這是一個新的系列模闲，會整理一下以前在ipad上寫的筆記查剖。前言把概率引進到機器學習當中是一件很自然的事情贯被，許多機器學習當中問題的本質都可以從概率中的頻率派（Frequenti...

781 0 1
CristianoC

強化學習算法總結（一）——從零到DQN變體
這是新開的一個系列沟于，將結合理論和部分代碼（by ElegantRL）介紹強化學習中的算法咳胃，將從基礎理論總結到現在常用的SAC,TD3等算法，希望能幫助大家重溫知識點旷太。本文是第...

1700 0 4
CristianoC

@小火車程序員細節(jié)寫多是為了方便大家感謝認可

全面解析可變形卷積家族（Deformable Convolutional Networks v1+ v2）
目錄 DCN v1 DCN v2 參考 DCN v1 背景在計算機視覺領域展懈，同一物體在不同場景，角度中未知的幾何變換是檢測/識別的一大挑戰(zhàn)泳秀，通常來說我們有兩種做法: (1)...

CristianoC
7878 4 0
CristianoC

@簡簡單單0828 插值沒必要講了吧都用DCN的人了不至于插值都不會把

全面解析可變形卷積家族（Deformable Convolutional Networks v1+ v2）
目錄 DCN v1 DCN v2 參考 DCN v1 背景在計算機視覺領域标沪，同一物體在不同場景，角度中未知的幾何變換是檢測/識別的一大挑戰(zhàn)嗜傅，通常來說我們有兩種做法: (1)...

CristianoC
7878 4 0
CristianoC

深入淺出解讀并思考AlphaGo
本文是對2016年發(fā)表在Nature的<< Mastering the game of Go with deep neural networks and tree searc...

634 0 0

CristianoC

蒙特卡洛積分與重要性采樣
重要性采樣在強化學習有著重要作用,它是蒙特卡洛積分的一種采樣策略. 目錄概率論基礎蒙特卡洛積分重要性采樣參考概率論基礎本文先補充兩條基礎的概率論公式,方便大家更好...

1484 0 0
CristianoC

強化學習之蒙特卡洛學習,時序差分學習理論與實戰(zhàn)(四)
前言上一講講解了如果應用動態(tài)規(guī)劃算法對一個已知狀態(tài)轉移概率的MDP進行策略評估或通過策略迭代或直接的價值迭代來尋找最優(yōu)策略和最優(yōu)價值函數,同時也指出了動態(tài)規(guī)劃算法的一些缺點...

529 0 0
CristianoC

強化學習之動態(tài)規(guī)劃尋找最優(yōu)策略理論與實戰(zhàn)(三)
前言本講將著重講解如何利用動態(tài)規(guī)劃(Dynamic programming)來解決強化學習中的規(guī)劃問題金句。"規(guī)劃"是指在已知環(huán)境動力學的基礎上進行評估和控制,具體來說就在了解...

613 0 0
CristianoC

強化學習核心之馬爾科夫決策過程理論與實戰(zhàn)(二)
前言本講將從基礎的馬爾科夫過程開始講解,到馬爾科夫獎勵過程,馬爾科夫決策過程,最后也會用代碼鞏固這部分理論. 目錄馬爾科夫過程馬爾科夫獎勵過程馬爾科夫決策過程編程實...

229 0 0
CristianoC

強化學習總體介紹-初步搭建強化學習理論體系(一)
前言兩年前接觸強化學習是通過莫煩的課程,那時候對強化學習整體有一個基礎的認識,最近聽了David Silver的課程后又建立起了完整的強化學習體系,故連載David Sil...

713 0 0

CristianoC

離散數學
偏序：在整數集中定義偏序：若a能整除b，我們就記為a?b顯然它滿足序公理吕嘀。但整數集中违寞，不是任何兩個數都存在整除關系，這個關系是局部的（partial）偶房，太“偏頗”趁曼，于是被稱為...

315 0 0
CristianoC

數據庫三大范式
第一范式(確保每列保持原子性，即不能分解棕洋，比如生日年月日就可以繼續(xù)分解)第二范式(確保表中的每列都和主鍵相關挡闰，不能存在部分依賴，學分依賴課程號，姓名依賴與學號摄悯，所以不符合二范...

141 0 0
CristianoC

數據庫
原子性（Atomicity）: 事務要么全部完成赞季，要么全部取消。如果事務崩潰奢驯，狀態(tài)回到事務之前（事務回滾）申钩。隔離性（Isolation）: 如果2個事務 T1 和 T2 同...

164 0 0
CristianoC

計算機網絡
因特網由邊緣部分和核心部分組成，邊緣部分由主機組成瘪阁，由用戶直接使用撒遣，核心部分由大量網絡和連接這些網絡的路由器組成。 C/S是客戶/服務器方式管跺，運行在一個端系統上的客戶進程總是...

361 0 0
CristianoC

AVL
AVL是平衡二叉樹义黎，有兩個特點 1.左右子樹的高度差小于等于 1。（平衡因子絕對值不超過1）2.其每一個子樹均為平衡二叉樹伙菜。平衡的操作有兩種：左旋和右旋轩缤，這兩種操作也是左右...

216 0 0

CristianoC

動態(tài)規(guī)劃
動態(tài)規(guī)劃分為三步：定義數組元素含義，找到初始值贩绕，寫狀態(tài)轉移方程，做多基本就沒啥問題了壶愤，當然都會做之后還涉及到一個優(yōu)化問題淑倾。最大序列和最長上升子序列判斷在某個數前面是不是...

114 0 0
CristianoC

判斷鏈表有環(huán)
1、快慢指針：比如設置一個慢指針一次走一步征椒，一個快指針一次走兩步娇哆，兩個指針同時開始走，如果在某個時刻勃救，快慢指針相遇了碍讨，代表快指針“走回來了”，所以就是有環(huán)的蒙秒。時間復雜度是o(...

219 0 0
CristianoC

全面解析可變形卷積家族（Deformable Convolutional Networks v1+ v2）
目錄 DCN v1 DCN v2 參考 DCN v1 背景在計算機視覺領域勃黍，同一物體在不同場景，角度中未知的幾何變換是檢測/識別的一大挑戰(zhàn)晕讲，通常來說我們有兩種做法: (1)...

7878 4 0