策略類型:大數(shù)據(jù)選股 & 大數(shù)據(jù)擇時(shí)
指標(biāo)屬性:熱度指標(biāo) & 情緒指標(biāo) & 指示指標(biāo)
數(shù)據(jù)抓爬方法
并非盲抓,需要事先分析不同數(shù)據(jù)來(lái)源的數(shù)據(jù)結(jié)構(gòu),總結(jié)網(wǎng)址規(guī)律(url規(guī)律)讯沈,利用規(guī)律抓爬鹤盒,提高數(shù)據(jù)抓爬及篩選效率。
數(shù)據(jù)可分為以下幾類:
1.新聞搜索引擎結(jié)構(gòu):搜索結(jié)果設(shè)定褐隆、搜索時(shí)間段設(shè)定污它、以及新聞來(lái)源的相關(guān)設(shè)定。(參考廣發(fā)大數(shù)據(jù)系列一)
2.公告信息披露平臺(tái)數(shù)據(jù)(參考廣發(fā)大數(shù)據(jù)系列二)
3.股吧論壇數(shù)據(jù)(參考廣發(fā)大數(shù)據(jù)系列三)
4.財(cái)經(jīng)類網(wǎng)站個(gè)股推薦庶弃,熱點(diǎn)概念數(shù)據(jù)(參考廣發(fā)大數(shù)據(jù)系列四衫贬、五)
5.各平臺(tái)的關(guān)注度類數(shù)據(jù),如關(guān)注人數(shù)歇攻,轉(zhuǎn)發(fā)人數(shù)固惯,點(diǎn)贊人數(shù)等(參考廣發(fā)大數(shù)據(jù)系列六)
大數(shù)據(jù)選股方法
1.挖掘公告信息(事件驅(qū)動(dòng))
所用指標(biāo)屬于指示型指標(biāo)。
對(duì)公告進(jìn)行分類缴守,再統(tǒng)計(jì)各類公告發(fā)布之后的個(gè)股表現(xiàn)葬毫。發(fā)掘不同類型公告與股價(jià)表現(xiàn)的統(tǒng)計(jì)性規(guī)律,從而構(gòu)建相應(yīng)的事件驅(qū)動(dòng)策略屡穗。
2.個(gè)股推薦選股
批量持有熱門財(cái)經(jīng)類網(wǎng)站的推薦個(gè)股贴捡,構(gòu)成組合,統(tǒng)計(jì)不同持有時(shí)長(zhǎng)的收益情況村砂,構(gòu)造選股及持有策略烂斋。(短線效應(yīng)明顯)
3.新聞熱點(diǎn)選股
根據(jù)網(wǎng)絡(luò)文本識(shí)別當(dāng)前熱點(diǎn),再選取與熱點(diǎn)相關(guān)的投資標(biāo)的,構(gòu)建組合汛骂。
4.低關(guān)注度選股
對(duì)個(gè)股關(guān)注度進(jìn)行標(biāo)準(zhǔn)化處理罕模,尋找低關(guān)注度的冷門股,構(gòu)建組合帘瞭。
大數(shù)據(jù)擇時(shí)方法
1.熱度擇時(shí)
通過(guò)板塊整體新聞量淑掌,直接定義熱度。當(dāng)日熱度數(shù)據(jù)與次日股票漲跌有較強(qiáng)的相關(guān)性蝶念。
策略構(gòu)建:根據(jù)熱度數(shù)據(jù)構(gòu)建布林通道上下軌抛腕,向上突破看多,向下突破看空祸轮。
2.情緒擇時(shí)
核心技術(shù)在于文本分析與情感分析兽埃。
使用網(wǎng)絡(luò)文本挖掘的方法,抓取熱門股吧的股票帖子內(nèi)容适袜,并采用文本脫水柄错、分詞以及情感分析等方法得到每條帖子的“樂(lè)觀”與“悲觀”判斷,構(gòu)建情緒指標(biāo)苦酱。根據(jù)情緒指標(biāo)構(gòu)建布林通道售貌,當(dāng)某日情緒指標(biāo)劇增,突破上界時(shí)疫萤,看多颂跨,突破下界時(shí)看空。