IP屬地:湖北
Q-learning 決策: 根據(jù)Q表慷垮,選擇reward較大的action. Q-learning 更新: 代碼如下
強(qiáng)化學(xué)習(xí)方法匯總 (Reinforcement Learning): (1)Model-free 和 Model-based: model-fr...
一. 大致流程如下 股票歷史數(shù)據(jù) 股票技術(shù)指標(biāo) 股吧文本數(shù)據(jù) 1.特征選擇 2.股吧文本情感分析 2.1文本數(shù)據(jù)預(yù)處理 2.2 基于LSTM的情...