Jaydu - 簡書

Jaydu

IP屬地：廣東

強化學習中on-policy和off-policy方法
什么是策略同波？一個確定性策略定義了一個從行動空間到狀態(tài)空間的函數(shù)突硝。在實際應用中卧波，一個策略的輸出常常是一個概率分布唐全，表示在狀態(tài)下采取每一個動作的概...

0.1 1856 0 1
強化學習中的model-free和model-based算法
Model-based強化學習通過一個代理（agent）來嘗試理解環(huán)境，并且建立模型來表示這個代理肛真。這個模型希望學習到兩個函數(shù)：狀態(tài)轉移函數(shù)（...

0.1 3059 0 1

Adam優(yōu)化算法簡介
背景介紹在機器學習中袁铐，對每一個數(shù)據(jù)點，我們通過最小化經(jīng)驗風險來從數(shù)據(jù)中學習淘衙，其中是模型的參數(shù)传藏。對整個訓練集，目標函數(shù)即為對應的梯度為然而彤守，當很...

0.1 5094 0 2
支持向量機系列（一）——線性可分情形下的SVM
Linear Support Vector Machines in the Linearly Separable Case Problem De...

0.3 494 0 1
神經(jīng)網(wǎng)絡簡介
BP神經(jīng)網(wǎng)絡結構我們知道單層感知機（perceptron）的局限性：它無法解決異或（XOR）問題毯侦，或者其它線性不可分問題【叩妫考慮下圖的數(shù)據(jù)集的分...

0.3 1213 0 1
動態(tài)規(guī)劃簡介
動態(tài)規(guī)劃（Dynamic Programming侈离， DP）算法采用遞歸的方式，將較復雜的原問題分解為較為簡單的子問題筝蚕，以求解原問題卦碾。適用情況 ...

0.5 680 0 3
LightGBM簡介
LightGBM LightGBM（Light Gradient Boosting Machine）是一款基于決策樹算法的分布式梯度提升框架。為...

0.3 17395 0 2

XGBoost簡介
XGBoost Extreme Gradient Boosting(XGBoost)是由華盛頓大學（University of Washingt...

0.3 3879 0 2
Logistic Regression與Logistic Loss簡介
Logistic Regression 在線性回歸中起宽，我們尋找的連續(xù)型隨機變量和的函數(shù)關系式為：洲胖，其中為待估參數(shù)（包含截距項，即坯沪，）绿映，為隨機誤差...

1.1 6830 1 5