開(kāi)源證券 | 通聯(lián)數(shù)據(jù)助力挖掘新聞?shì)浨橹械摩?,超中證500收益4.86%
在傳統(tǒng)的量化投資領(lǐng)域,模型處理的信息通常來(lái)自財(cái)務(wù)數(shù)據(jù)和量?jī)r(jià)數(shù)據(jù)。然而伴隨著量化投資規(guī)模的蓬勃壯大,傳統(tǒng)策略的同質(zhì)化日趨嚴(yán)重,因子擁擠(Factors Crowding)的困境逐漸浮現(xiàn),最終導(dǎo)致Alpha空間日漸縮窄。
開(kāi)源金工團(tuán)隊(duì)采用的數(shù)據(jù)庫(kù)為通聯(lián)數(shù)據(jù)新聞?shì)浨閿?shù)據(jù),基于中文自然語(yǔ)言處理技術(shù),對(duì)每日3萬(wàn)多條中文新聞報(bào)道進(jìn)行篩選、分類(lèi)和打分。
針對(duì)單只股票,將每天與其關(guān)聯(lián)的各條新聞報(bào)道所對(duì)應(yīng)的情感得分進(jìn)行加總,得出相應(yīng)的新聞?shì)浨橐蜃?。這一因子不僅融合了新聞關(guān)注度(即每天與每只股票相關(guān)的新聞報(bào)道總數(shù)量),還能夠體現(xiàn)新聞?shì)浨榈恼?fù)情感方向。
數(shù)據(jù)庫(kù)中有新聞數(shù)據(jù)的個(gè)股共3848只,A股覆蓋率達(dá)到99.86%,月頻覆蓋率在98.8%以上,日均出現(xiàn)新聞?shì)浨閿?shù)據(jù)的個(gè)股在1600只左右。
開(kāi)源金工團(tuán)隊(duì)使用通聯(lián)數(shù)據(jù)中“getNewsRelatedScoreV2”( 獲取新聞情感信息) 和“新聞關(guān)聯(lián)標(biāo)簽行業(yè)表”(getNewsTagInd)這兩張表, 進(jìn)行新聞?shì)浨樵紨?shù)據(jù)集的構(gòu)建 。
通過(guò)對(duì)新聞情緒因子刻畫(huà)改進(jìn)與回測(cè),開(kāi)源金工分析師構(gòu)建過(guò)去N天輿情分?jǐn)?shù)平均值的變化量因子,回測(cè)結(jié)果顯示,該因子的多空收益比在全樣本區(qū)間內(nèi)表現(xiàn)良好,尤其在中證500選股域上表現(xiàn)優(yōu)異。
取回看天數(shù)為20,并按月調(diào)倉(cāng),該因子在多空以及多頭組上的表現(xiàn)優(yōu)異:多空收益波動(dòng)比為2.2,多頭相對(duì)中證500的年化收益率為4.6%。
在三種不同換倉(cāng)頻率下的表現(xiàn)中,雙周頻>月頻>周頻。在雙周頻上該因子的多空對(duì)沖年化收益率為12.00%,因子的年化ICIR為-2.3;月頻下,該因子的多空對(duì)沖年化收益率11.92%,因子年化ICIR為-2.00。
對(duì)該因子剔除常見(jiàn)10個(gè)因子后,剝離得到后的因子在中證500選股域上的表現(xiàn)依然優(yōu)異:多空收益波動(dòng)比達(dá)2.64,年化ICIR-2.27,多頭相對(duì)中證500年化收益率4.86%。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。